سیستم بازشناسی ارقام دستنویس فارسی بر اساس الگوریتم آموزش فعال و شبکه های عصبی

در مسایل یادگیریِ واقعی، بدستآوردن نمونه های برچسب دار برای آموزش بسیار پرهزینه می باشد. در این مقاله روشی برای دسته بندی اعداد پیشنهاد شده است که در آن ابتدا یک شبکه عصبی ساده چند لایه با تعداد کمی نمونه برچس بدار ساخته م یشود، سپس با استفاده از یادگیری فعال و با بکارگیری روش نمونه برداری براساس عدم اطمینان و عدم مشابهت و اضافه کردن تعدادی از نمونه هایی که در مرحله تست اشتباه دسته بندی شده اند (نمونه های منحرف)، نمونه های مفید را برای برچس بگذاری به کاربر م یدهد تا در آموزش شبکه استفاده کند. این مقاله همچنین از روش قاب بندی برای استخراج ویژگی ها استفاده می کند. در این روش یک تصویر باینری از اعداد جزء بندی شده و به تعداد ثابتی از تصاویر کوچکتر که قاب نامیده می شوند شکسته می شود. از هر جعبه یک نقط ه ثابت که بردار فاصله م یباشد استخراج می شود. این روش وابسته به قلم و اندازه کاراکتر ورودی نیست و با یک تغییر کوچک در مرحله پی شپردازش برای هر زبانی با هر قلمی و هر انداز های می تواند کارا باشد. نمونه های استفاده شده بصورت دستی جمع آوری و پردازش شده اند.

 

احمد خیرخواه، اسماعیل رحمانیان
گروه هوش مصنوعی دانشکده مهندسی دانشگاه آزاد مشهد

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *