در اين مفاله راهکارهاي مختلفي که اکثرا در روشهاي پردازش صحبت مورد بحث قرارمي گيرد باهم مقايسه شده و يک مسير مطمئن از شروع تا انتهاي پردازش صحبت توصيه شده است. صحبت توسط حنجره توليد مي شود و گوش انسان آن را گرفته و سيگنالهايي را به مغز مي رساند. محدوده قابل 20 هرتز مي باشد ولي محدوده فرکانسي صحبت از ٥٠ تا ٨٠٠٠ هرتز افزايش نمي يابد. براي پردازش صحبت ‐ سمع ٢٠٠٠٠ابتدا با يک ميکروفن و کارت صدا ، صحبت را به سيگنال تبديل مي کنند . در ادامه پيش پردازشهايي روي سيگنال انجام مي شود و از يک محدوده زماني از سيگنال که مانا باشد ويژگيهايي استخراج شده و بردارهاي ويژگي بدست آمده طبقه بندي شده و تشخيص انجام مي شود.