موتور جستجوي پارسي اسناد الكترونيكي به كمك روش ريشه يابي و امتيازدهي دامنه فوريه

بيشتر موتورهاي جستجو حجم زيادي از اطلاعات ناخواسته را بر مي گرداند. يكي از راههاي جلوگيري از اين امر اينست كه اطلاعات بازگشتي بر حسب ميزان ارتباط با كليد واژه ها مرتب شوند. روش جديدي موسوم به FDSيا امتياز دهي دامنه فوريه كه بر پايه تبديل فوريه استوار شده است، مي تواند جهت انجام اين كار استفاده شود. روش FDSعمليات جداسازي و فيلتر كردن اسناد را بر اساس ميزان محلي بودن كليد واژه ها در اسناد انجام مي دهد. در اين مقاله به شرح در مورد چگونگي پياده سازي اين روش و نيز نحوه استفاده از آن در پياده سازي موتور جستجوي ALIAجهت جستجو در اسناد فارسي، پرداخته شده است. اين روش در مقايسه با روشهاي شناخته شدهي رايج همانند LSIو كسيونوس برداري داراي بازدهي بالاتري ميباشد، كه دليل اين امر در نياز روش مذكور به دامنه گسترده تري از اسناد براي تعيين موضوع اسناد است

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *