• بهبود ترکیب نمونه انتخاب برای انتساب داده های گمشده با کمک الگوریتم های ماشین بردار پشتیبان و جستجوی گرانشی

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1396/09/25
    • تاریخ انتشار در تی پی بین: 1396/09/25
    • تعداد بازدید: 612
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -

    گمشده گی داده در تمامی پژوهش های علوم اجتماعی، رفتاری، پزشکی وجود دارد. در آمار، گم شدن داده به وضعیتی گفته می شود که تعدادی از اطلاعات داده ها گزارش نشده باشند. گمشده گی داده باعث کاهش تطابق جامعه نمونه با جامعه کل شده و می تواند منجر به نتیجه گیری اشتباه در مورد جمعیت اصلی شود. گمشده گی داده یک اتفاق معمول بوده و بسته به میزان آن، می تواند اثر قابل توجهی در نتیجه گیری به دست آمده از داده ها داشته باشد. تمامی روش های برآورد پارامترها بر پایه فرض کامل بودن مجموعه داده ها استوار است و تحت برقراری این شرایط منجر به برآوردهایی نااریب می شوند؛ و البته با افزایش نسبت گم شدگی، مقدار اریبی نیز افزایش خواهد یافت. در این پژوهش بدین صورت عمل گردیده است که یک سری مجموعه داده واقعی بر حسب درصد گمشده گی مقادیری را از دست می دهند سپس بر اساس الگوریتم جستجوی گرانشی مقادیر گمشده تخمین زده می شوند و بر اساس معیار میانگین خطای مطلق میزان درصد خطای بدست آمده از روش جستجوی گرانشی نسبت به مقادیر واقعی محاسبه می شود که این معیار بر اساس نتایج ارزیابی، خطای کمتری را نشان می دهد و هر چه داده ها بیشتر باشند این معیار نیز به تناسب بیشتر می شود. سپس با استفاده از الگوریتم طبقه بندی svm برای طبقه بندی داده ها بر اساس مقادیر تعیین شده توسط الگوریتم جستجوی گرانشی دقت حاصل با دقت طبقه بندی بر روی داده های حاصل ازپر کردن با میانگین ویژگی و هم چنین پرکردن داده ها با الگوریتم نزدیکترین همسایگی (k-nn) مقایسه می گردد. که در بخش ارزیابی نتایج نشان داده می شود که دقت طبقه بندی بر روی داده های بدست آمده از روش جستجوی گرانشی نسبت به روش های دیگر بالاتر است و هرچه درصد گمشدگی بیشتر شود این دقت کمتر می شود.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها
مقالات جدیدترین ژورنال ها