موتور جستجوي پارسي اسناد الكترونيكي به كمك روش ريشه يابي و امتيازدهي دامنه فوريه

بيشتر موتورهاي جستجو حجم زيادي از اطلاعات ناخواسته را بر مي گرداند. يكي از راههاي جلوگيري از اين امر اينست كه اطلاعات بازگشتي بر حسب ميزان ارتباط با كليد واژه ها مرتب شوند. روش جديدي موسوم به FDS يا امتياز دهي دامنه فوريه كه بر پايه تبديل فوريه استوار شده است، مي تواند جهت انجام اين كار استفاده شود. روش FDS عمليات جداسازي و فيلتر كردن اسناد را بر اساس ميزان محلي بودن كليد واژه ها در اسناد انجام مي دهد. در اين مقاله به شرح در مورد چگونگي پياده سازي اين روش و نيز نحوه استفاده از آن در پياده سازي موتور جستجوي ALIA جهت جستجو در اسناد فارسي، پرداخته شده است. اين روش در مقايسه با روشهاي شناخته شده ي رايج همانند LSI و كسيونوس برداري داراي بازدهي بالاتري مي باشد، كه دليل اين امر در نياز روش هاي مذكور به دامنه گسترده تري از اسناد براي تعيين موضوع اسناد است.

 

حامد شهبازي، عليرضا مختاري پور ، حميد محمدي ، بهروز ترك لاداني
گروه مهندسي كامپيوتر دانشگاه اصفهان

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *