ارتقاء بازشناسي گفتار مستقيم و تلفني با استفاده از اصلاح بردارهاي بازنمايي توسط معكوس سازي شبكه هاي عصبي

در حال حاضر تلاش فراگيري براي طراحي سيستمهاي بازشناسي گفتار مقاوم نسبت به تنوعات ١گفتار صورت ميگيرد. يكي از اين تنوعات، گفتار تلفني نسبت به گفتار مستقيم) ٢گفتاري كه در شرايط عاري از هر گونه نويز محيط تهيه شده است( ميباشد. در مقاله حاضر با استخراج بردارهاي بازنمايي طيفي LHCB3از گفتار مستقيم و تلفني و طراحي مدل بازشناسي گفتار مبتني بر شبكه عصبي ، MLP يك سيستم واحد بازشناسي گفتار مستقيم و تلفني ساخته ميشود. سپس با بكارگيري دو روش معكوس سازي محلي ٤و عمومي  شبكههاي عصبي، بردارهاي بازنمايي گفتار تلفني را به سمت بردارهاي بازنمايي گفتار مستقيم اصلاح ميكنيم و با تعليم شبكه ديگري روي دادگان اصلاح شده، در روش معكوس سازي محلي افزايش ٪۱/۴در صحت بازشناسي گفتار تلفني و در روش معكوسسازي عمومي افزايش ٪۲/۹۸در صحت بازشناسي گفتار تلفني و ٪۱/۶۸در صحت بازشناسي گفتار مستقيم حاصل شده است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.