• روشی جدید برای خوشه بندی مستندات متنی براساس آنتولوژی

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1386/01/01
    • تاریخ انتشار در تی پی بین: 1386/01/01
    • تعداد بازدید: 806
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    امروزه خوشه بندی نقش حیاتی در روشهای بازیابی اطلاعات برای سازمانبندی مجموعه های بزرگ مستندات متنی مانند وب، درون تعداد کمی خوشه معنادار دارد. معمولا در خوشه بندی مستندات متنی با خوشه بندی ابعاد بسیار بالای فضای داده مواجه هستیم که انجام خوشه بندی به این شکل، مشکل بنظر می رسد. علاوه بر این، معمولا با استفاده از الگوریتم های خوشه بندی متفاوت، نتایج متفاوتی بدست می آید و مستندات درون خوشه های بدست آمده نیز ارتباط معنایی لازم را با هم ندارند. برای حل این مشکلات ما هسته آنتولوژی مانند وردنت را به عنوان دانش پس زمینه، درون فرایند خوش هبندی مستندات متنی جایگذاری نمودیم. سپس به صورت تجربی روش جدید را با تکنیکهای خوشه بندی ساده برای مجموعه داده خبرگزاری رویتر مقایسه نمودیم. نتایج بدست آمده از خوشه بندی متن همراه با استفاده از دانش پس زمینه در مقایسه با خوشه بندی متن بدون دانش پس زمینه، بهبود داشته است.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها