پیوند ها
نام فایل : ریشه یابی کلمات فارسی
فرمت : .ppt
تعداد صفحه/اسلاید : 21
حجم : 982 کیلوبایت
ریشه یابی کلمات فارسی
مقدمه
امروزه با گسترش کاربرد زبان در سیستم های رایانه ای، نیاز به پردازش متون در این سیستم ها، بیش از پیش احساس می شود.
ریشه یابی لغات نه به معنای زبان شناسی آن بلکه به معنای دسته بندی کلمات در گروه های معنایی یکسان، امری است که در بسیاری از زمینه های پردازش زبان طبیعی مدنظر می باشد.
فعالیت بر روی زبان فارسی به دلیل حجم کم تلاشها بر روی ریشه یابی کلمات فارسی، کامل بودن گرامر زبان فارسی و همچنین قابلیت بسط الگوریتم های به دست آمده به خانواده ی زبانهای هند و اروپایی به دلیل قرابت ساختاری آنها بسیار قابل توجه می باشد.
به جز مشکلاتی که در زمینه ی رسم الخط فارسی برای سامانه های رایانه ای وجود دارد (کوشا،1381)، مشکلات دیگری نیز در دل دستور زبان فارسی هست که ماهیتاً پردازش آن را برای یک نرم افزار پیچیده می کند.
انواع الگوریتم های ریشه یابی
الگوریتم های مبتنی بر دیکشنری : کاملترین الگوریتمهای ریشه یابی هستند. مشکلاتی نظیر :
قابلیت گسترش پایین (no scalability)
ناتوانی در دسته بندی کلمات در گروه های معنایی همسان
درجه زمانی و مکانی بسیار بالا
الگوریتم های مبتنی بر قانون : این الگوریتمها، بر روی به دست آوردن ریشه ی کلمات از طریق تعدادی قوانین از پیش تعیین شده کار می کنند.
قوانین موجود ساختارهای زبانشناسی نیستند.
مشکلات روش قبل را ندارند.
از لحاظ مؤفقیت از درصد پایینی برخوردار هستند.
از این دسته الگوریتمها می توان به الگوریتمهای معروف Porter و Lovins و Krovetz... بر روی زبان انگلیسی و الگوریتم ریشه یابی کاظم تقوی و ... بر روی زبان فارسی اشاره کرد.
بررسی الگوریتم PORTER :
در هر برنامه جداسازي پسوند در سيستم هاي IR دو مورد بايستي مد نظر باشد.
اول آنكه در سيستم هاي IR پسوندها به هدف افزايش كارائي سيستم حذف مي شوند و نه به لحاظ عمليات زبانشناسي. اين بدان معني است كه لزومي ندارد تا بفهميم تحت چه شرايطي يك پسوند بايستي حذف گردد.
نكته دوم آن است كه با استفاده از روشي كه توضيح داده خواهد شد؛ يعني با استفاده از ليست پسوندها با قوانين اِعمال متعدد، ضريب موفقيت در حذف پسوندها جدا از آنكه اين پردازش چگونه ارزيابي شود، مطمئناً كمتر از 100 درصد خواهد بود.
....
مبلغ واقعی 14,000 تومان 30% تخفیف مبلغ قابل پرداخت 9,800 تومان
برچسب های مهم
√جدید ترین آپدیت فروردین ماه 1404 بسم الله الرحمن الرحیم **کسب درآمد از اینترنت روزانه تا ۲/۰۰۰/۰۰۰ میلیون تومان تضمینی و تست شده** ☆☆آموزش صفر تا صد کسب درآمد اینترنتی بالای ۵۰/۰۰۰/۰۰۰ میلیون تومان ماهانه، پشتیبانی ۲۴ ساعته ۷ روز هفته، ۱۰۰%حلال شرعی، کاملاً واقعی و ... ...
جلد دفتر کارنمای جابر بن حیان (با فرمت word جهت تغییر و ویرایش) نمونه ای از دفتر کار نمای جشنواره جابر بن حیانبا طراحی زیبا و مناسب برای دانش آموزان عزیز آماده شده است. ... ...
کاملترین آموزش کاربردی هوش مصنوعی و ChatGPT فقط با موبایل و بدون نیاز به دانش تخصصی! اگه دنبال یه راه واقعی برای کسب درآمد از هوش مصنوعی هستی، اگه دوست داری بدون نیاز به سرمایه، تخصص یا تجهیزات خاص، فقط با یه گوشی موبایل پول دربیاری، این جزوه فوقالعاده ... ...
حل المسائل کتاب اقتصاد خرد رابرتاستیون پیندیک و دانیل رابینفیلد ویرایش هفتم Robert Pindyck تعداد صفحات: 336 فرمت: PDF زبان: لاتین ویرایش: ششم عنوان لاتین: Microeconomics نویسندگان: رابرت استیون پیندیک و دانیل رابینفیلد - Robert Pindyck - Daniel ... ...
دانلود پاورپوینت [مکتب رئالیسم] | به همراه فایل word - قابل ویرایش و ارائه شامل: 1. فایل پاورپوینت در باره مکتب رئالیسم در 27 اسلاید قابل ویرایش 2. قایل ورود قابل ویرایش در 16 صفحه ... ...