سیستم بازشناسی ارقام دستنویس فارسی بر اساس الگوریتم آموزش فعال و شبکه های عصبی

توضیحات
فایل های مرتبط

در مسایل یادگیریِ واقعی، بدستآوردن نمونههای برچسبدار برای آموزش بسیار پرهزینه میباشد. در این مقاله روشی برای دستهبندی اعداد پیشنهاد شده است که در آن ابتدا یک شبکه عصبی ساده چند لایه با تعداد کمی نمونه برچسبدار ساخته میشود، سپس با استفاده از یادگیری فعال و با بکارگیری روش نمونهبرداری براساس عدم اطمینان و عدم مشابهت و اضافه کردن تعدادی از نمونههایی که در مرحله تست اشتباه دستهبندی شدهاند )نمونههای منحرف(، نمونههای مفید را برای برچسبگذاری به کاربر میدهد تا در آموزش شبکه استفاده کند. این مقاله همچنین از روش قاببندی برای استخراج ویژگیها استفاده میکند. در این روش یک تصویر باینری از اعداد جزءبندی شده و به تعداد ثابتی از تصاویر کوچکتر که قاب نامیده میشوند شکسته میشود. از هر جعبه یک نقطه ثابت که بردار فاصله میباشد استخراج میشود. این روش وابسته به قلم و اندازه کاراکتر ورودی نیست و با یک تغییر کوچک در مرحله پیشپردازش برای هر زبانی با هر قلمی و هر اندازهای میتواند کارا باشد. نمونههای استفاده شده بصورت دستی جمعآوری و پردازش شده اند