• مطالعه مقایسه ای روش های مبتنی بر یادگیری ماشین در تشخیص نویسنده فارسی زبان بر اساس سبک نوشتاری

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1391/01/01
    • تاریخ انتشار در تی پی بین: 1391/01/01
    • تعداد بازدید: 1186
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    تشخیص نویسنده، تلاشی است برای نشان داد خصوصیات نویسنده ی تکه ای از اطلاعات زبانی به طوری که نهایتا بتوان بین متون مختلفی توسط افراد گوناگون نوشته شده اند، تمایز معنی داری قائل شد. پیشرفت سریع ارتباطات اینترنتی، ابزارهای اینترنتی با هویت ناشناس مانند ایمیل و وبلاگ را به روش های ارتباطی محبوبی برای مرتکبین اعمال غیرقانونی تبدیل کرده و مسائل امنیتی خاصی را بوجود آورده است. زبان فارسی به علل مختلفی همچون سیاسی، اجتماعی مذهبی مورد توجه افراد و سازمان های مختلفی قرار دارد. در این مقاله روش های هوشمند writeprint که به شناسایی نویسنده فارسی زبان و بر اساس سبک نوشتاری او کمک می نماید، معرفی و مقایسه شده اند. در این تحقیق، پس از جمع آوری دو پایگاه داده، از چهار مجموعه ویژگی شامل واژگانی، نحوی، معنایی و وابسته به کاربرد برای استخراج اطلاعات سبکی استفاده شده و مقایسه ای روی انواع مختلف روش های دسته بندی مانندdelta ,knn ، شبکه عصبی، درخت تصمیم گیری و تحلیل linear discriminant روی این پایگاه ها انجام گردیده است. بررسی های این تحقیق نشان می دهد که روش های تحلیلknn ,linear discriminant  به تربیت رتبه یکم و دوم دقت را بین روش های بررسی شده، در دست دارند.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین ژورنال ها