نشانه گذاری آماری متون فارسی برای استفاده در موتورهای جستجو : تی پی بین

نخستین کنفرانس بین المللی پردازش خط و زبان فارسی

جزئیات رویداد

حوزه های تحت پوشش رویداد

علوم انسانی
- زبان و ادبیات فارسی

نشانه گذاری آماری متون فارسی برای استفاده در موتورهای جستجو

نشانه گذاری آماری متون فارسی برای استفاده در موتورهای جستجو
نویسندگان :

محمد مهدی میردامادی

علی محمد زارع بیدکی

مهدی رضائیان
کلمات کلیدی :

موتور جستجو

پردازش زبان های طبیعی

نشانه گذاری

پپیکره
جزئیات بیشتر مقاله
- تاریخ ارائه: 1391/01/01
- تاریخ انتشار در تی پی بین: 1391/01/01
- تعداد بازدید: 811
- تعداد پرسش و پاسخ ها: 0
- شماره تماس دبیرخانه رویداد: -
نشانه گذاری متن، یکی از فعالیت های اصلی در حوزه پردازش زبان های طبیعی است. اکثر برنامه های پردازش زبان های طبیعی به یک پیش پردازش برای استخراج کلمات متن و تشخیص نشانه ها احتیاج دارند. هدف اصلی و نهایی نشانه گذاری، بدست آوردن کلمات معنی دار همراه با پیشوندها و پسوندهایشان است. این فعالیت متناسب با زبان های طبیعی مختلف، می تواند سخت یا آسان باشد. در زبان فارسی با توجه به وجود فاصله و نیم فاصله، عدم توجه کاربران به فاصله گذاری ها و نبود قواعد دقیقی در نوشتن کلمات چند قسمتی، تشخیص و نشانه گذاری کلمات چند قسمتی و مرکب، با مشکلات و پیچیدگی های خاص خور روبه رو است. در این مقاله برآنیم یک روش اماری برای نشانه گذاری متون فارسی جهت استفاده در موتورهای جستجو، ارائه کنیم. برای این منظور از احتمال رخداد دو کلمه های موجود در پیکره استفاده شده است. الگوریتم پیشنهادی شامل 4 فاز است و با دقت 81.4% به نشانه گذاری کلمات متون فارسی می پردازد. نتایج آزمایشات نشان دادند این روش می تواند با نشانه گذاری بهتر کلمات، دقت اطلاعات بازیابی شده در موتور جستجو را بهبود بخشد.

سوال خود را در مورد این مقاله مطرح نمایید :

سوال شما برای نویسنده مقاله نیز ارسال می گردد.در صورت درج پاسخ از طریق ایمیل به شما اطلاع داده خواهد شد.
با انتخاب دکمه “ثبت پرسش”، موافقت خود را با قوانین انتشار محتوا در تی پی بین اعلام می کنم.

در صورت درج پاسخ از طریق ایمیل به شما اطلاع داده خواهد شد.

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم

مقالات جدیدترین رویدادها

مقالات جدیدترین ژورنال ها

نشانه گذاری آماری متون فارسی برای استفاده در موتورهای جستجو

محمد مهدی میردامادی

علی محمد زارع بیدکی

مهدی رضائیان

سوال خود را در مورد این مقاله مطرح نمایید :

استفاده از تحلیل اهمیت-عملکرد در ارائه الگوی مدیریت خلاقیت سازمانی و ارائه راهکار جهت بهبود

بررسی تاثیر ارزش وجوه نقد مازاد بر ساختار سرمایه شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی تأثیر سطح افشای ریسک بر قرارداد بدهی شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی تأثیر رتبه بندی اعتباری مبتنی بر مدل امتیاز بازار نوظهور بر نقد شوندگی سهام با تأکید بر خصوصی سازی شرکت ها

تأثیر آمیخته بازاریابی پوشاک ایرانی بر تصویر ذهنی مشتری پوشاک ایرانی (هاکوپیان)

بررسی نقش ادراک محیطی بر رضایتمندی و انتخاب اولویت های سکونتی

مروری بر عفونت های بیمارستانی و ارائه راهکارهایی برای پیشگیری و کنترل آنها

چگونگی کاربرد تست های غربالگری ارتولانی و بارلو جهت تشخیص دررفتگی دیسپلاستیک هیپ نوزادان

تهیه، تخلیص و شناسایی اجزاء آنتی ژن های دفعی- ترشحی تاکی زوئیت های توکسوپلاسماگوندی سویه rh

water chemistry of a combined-cycle power plant’s auxiliary equipment cooling system

مدیریت و بررسی افسردگی دانش آموزان دختر مقطع متوسطه دوم در دروان کرونا در شهرستان دزفول

مدیریت و بررسی خرد سیاسی در اندیشه ی فردوسی در ادب ایران

واکاوی و مدیریت توصیفی قلمدان(جاکلیدی)ضریح در موزه آستان قدس رضوی

بررسی تاثیر خلاقیت، دانش و انگیزه کارکنان بر پیشنهادات نوآورانه کارکنان ( مورد مطالعه: هتل های 3 و 4 ستاره استان کرمان)

بررسی تاثیر کیفیت سیستم های اطلاعاتی بر تصمیم گیری موفق در شرکتهای تولیدی استان اصفهان (مورد مطالعه: مدیران شرکتهای تولیدی استان اصفهان)

تعمق و تأملی بر نظریه و مکتب هنری کلاسیسیسم و تأثیرات آن بر معماری و موسیقی

بررسی رابطه بین پاداش نقدی و عملکرد بانک با تاکید بر نقش مدیریت سود

بررسی نقش عوامل زمینه ای در عناصر سیستم مدیریت ایمنی، بهداشت، محیط زیست در کارکنان شبکه بهداشت و درمان شهرستان ابرکوه

چارچوب مدیریتی اجرایی برای پایگاه داده های فازی

الگوی ساختاری موفقیت تحصیلی بر اساس اعتماد به نفس و سرمایه های روانشناختی با میانجی گری راهبرد های مقابله ای (اجتنابی ، مسئله مدار و هیجان مدار )