• جزئیات بیشتر مقاله
    • تاریخ ارائه: 1392/07/24
    • تاریخ انتشار در تی پی بین: 1392/07/24
    • تعداد بازدید: 1020
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    تحقیقات زیاد روی موتورهای جستجو نشان می دهد که اکثر پرس و جوهای کاربران بیش از یک کلمه می باشد و ممکن است بطور مشخص با استفاده از علامت نقل قول به عنوان عبارت معرفی شده باشند یا از علامت نقل قول استفاده نشده باشد ولی در بیشتر مواقع منظور کاربر یک عبارت باشد. اکثر الگوریتم های رتبه بندی از فرکانس رخداد یک کلمه در سند (tf) برای امتیاز دهی به اسناد استفاده می کنند اما برای عبارت تعریف روشنی از این پارامتر وجود ندارد. از طرفی تعداد رخداد یک عبارت به تنهایی مفید نیست و باید فاصله بین کلمات عبارت محاسبه گردد. در این مقاله پارامترهای فاصله، فرکانس رخداد یک عبارت  (pf) و idf با توجه به فاصله تعریف می شود و الگوریتم هایی برای محاسبه آنها ارائه می گردد. همچنین نتایج الگوریتم پیشنهادی با الگوریتم پیاده سازی شده توسط نمایه ساز متن باز لوسین مقایسه گردیده است.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها
مقالات جدیدترین ژورنال ها