این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 24 آذر 1404
پژوهشنامه پردازش و مدیریت اطلاعات
، جلد ۳۳، شماره ۳، صفحات ۱۱۷۹-۱۱۹۶
عنوان فارسی
معرفی رویکردی ماشینی با استفاده از الگوریتم لسک و برچسبدهی نحوی جهت رفع ابهام از معنای کلمات
چکیده فارسی مقاله
پژوهش حاضر به معرفی رویکردی ماشینی برای چگونگی رفع ابهام معنایی از کلمات می پردازد. در زبان فارسی، که ساختواژه پیچیده دارد، هم نگارههای بسیاری ساخته می شوند که معانی گوناگونی در بافت های گوناگون دارند. یکی از راههایی که کمک می کند رفع ابهام از معنای کلمات مبهم (هم نگارهها) با سهولت و دقت بیشتری انجام شود، تخصیص برچسب درست نحوی به کلمات است. بنابراین اگر برچسب دهی نحوی قبل از مرحله رفع ابهام معنایی از کلمات، صورت پذیرد، رفع ابهام معنایی از هم نگارهها با دقت بیشتری انجام خواهد گرفت. از آنجائیکه فراوانی هم نگارههای اسمی و صفتی در متون فارسی، در مقایسه با سایر هم نگارهها، بالا است، پس از تخصیص برچسب نحوی به کلمات، لازم است رفع ابهام از برچسب نحوی هم نگارهها نیز صورت گیرد. در این مقاله ابتدا روشهای ماشینی موجود در جهت رفع ابهام از معنای کلمات معرفی می شود و سپس، الگوریتم لسک (که یکی از روش های یادگیری ماشینی بدون نظارت/ بدون سرپرست برای رفع ابهام معنایی از کلمات مبهم موجود در متون گوناگون است) معرفی می شود و در نهایت رویکردی ماشینی جهت رفع ابهام از معنای کلمات با استفاده از نتیجه مرحله برچسب زنی نحوی به کلمات و رفع ابهام از برچسب نحوی کلمات و الگوریتم لسک معرفی می شود. انجام برچسب دهی نحوی و رفع ابهام از برچسب نحوی هم نگاره ها باعث می شود الگوریتم لسک تنها، معانی مرتبط با برچسب های نحوی را در رفع ابهام معنایی از کلمات در نظر گیرد و در نتیجه عمل رفع ابهام از معنای کلمات با دقت و سهولت بیشتری انجام پذیرد.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Introducing a machine-based approach for Word Sense Disambiguation: using Lesk algorithm and Part Of Speech tagging
چکیده انگلیسی مقاله
Present study introduces a machine-based approach for Word Sense Disambiguation (WSD). In Persian, a morphologically complex language, lots of homographs are made; one way for doing WSD is allocating the right Part Of Speech (POS) tags to words, prior to WSD. Since the frequency of noun and adjective homographs in different Persian text corpuses is high, POS disambiguation of such homographs seems to be necessary for WSD. This paper introduces an approach in which first POS tagging is done, then the output, which is tagged sentences, enters the next step which is POS disambiguation of Persian nouns and adjective homographs; then the output of this step enters the final step which is applying the Lesk algorithm(a kind of unsupervised learning) for WSD. The proposed approach speeds up the WSD procedure by filtering the only relevant glosses (exist in dictionary) and increases the accuracy of the WSD procedure as well.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
الهام علایی ابوذر |
Iranian Research Institute for Information Science and Technology(IranDoc)
پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)
نشانی اینترنتی
http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-3228-2&slc_lang=fa&sid=1
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1504/article-1504-661300.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
فناوری اطلاعات
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات