• مجموه داده های بر خط حروف تنهای کردی و فارسی

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1391/01/01
    • تاریخ انتشار در تی پی بین: 1391/01/01
    • تعداد بازدید: 758
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    در این مقاله دو مجموعه داده بر خط حروف الفای کردی و فارسی ارائه می شود. تاکنون هیچ مجموعه داده مناسبی برای نوشتار کردی ارائه نشده است. این مقاله مجموعه داده ای 100 نفره با تنوع بالا برای حروف کردی و مجموعه داده ای 200 نفره برای حروف فارسی در اختیار قرار می دهد. در آینده تعداد مجموعه نخست نیز به 200 افزایش خواهد یافت. این مجموعه داده ها دارای نرخ نمونه برداری بالا و تنوع سنی-جنسی مناسب هستند. تفاوت دیگر این مجموعه ها با موارد پیشین، استفاده از سیستم پایش و جمع آوری داده labview است منجر به مشاهده دقیق تر داده های معیوب و حذف آنها شده است. در کنار موارد فوق، استفاده از سیستم های مدرن نوشتاری منجر به ساخت مجموعه داده ای دقیق تر و طبیعی تر شده است. این دو مجموعه داده نخستین گام کارآمد در راستای ایجاد سیستم های بازشناسی بر خط نوشتار کردی و فارسی خواهند بود. محاسبات آماری بر روی این دو مجموعه داده اطلاعات مناسبی را مانند درصد به کارگیری نوع خاصی از نقطه گذاری، جهت نوشتن و تشابه گروه حروف با بدنه یکسان در اختیار قرار می دهد.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها
مقالات جدیدترین ژورنال ها