این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۱، شماره ۱، صفحات ۷۳-۸۵

عنوان فارسی تشخیص اسامی اشخاص با استفاده از تزریق کلمه‌های نامزد اسم در میدان‌های تصادفی شرطی برای زبان عربی
چکیده فارسی مقاله تشخیص و استخراج واحدهای اسمی مانند نام اشخاص، مکان‌ها، تاریخ و ساعت، در داده‌کاوی از یک منبع الکترونیکی یا متنی بسیار مفید است. تشخیص درست واحدهای اسمی، یک نیاز مهم در حل مسائلی در حوزه‌های جدید مانند پاسخ‌گویی به سؤال‌ها، سیستم‌های خلاصه‌سازی، بازیابی اطلاعات، استخراج اطلاعات، ترجمۀ ماشینی، تفسیر ویدئویی و جستجوی معنایی در وب است. به‌علاوه، تشخیص واحدهای اسمی می‌تواند به ما در حل پیشرفته‌ترین مسائل پردازش زبان طبیعی هم‌چون رفع ابهام معنایی میان دو نام مشترک از رشته‌های متفاوت، پیدا کرد ارجاع‌ها در مقالات علمی، تشخیص وابستگی میان اشخاص و بهبود نتایج پرس و جوهایی شامل اسامی در موتورهای جستجو کمک کند. در سال‌های گذشته تلاش دانشمندان برای انجام عملیات تشخیص واحدهای اسمی برای زبان انگلیسی و دیگر زبان‌های اروپایی به نتایج بسیار خوبی منجر شده است، اما برای زبان‌هایی مانند فارسی و عربی، نتایج مناسب حاصل نشده‌ است. یکی از اصلی‌ترین اهداف عملیات تشخیص واحدهای اسمی، تشخیص اسامی اشخاص است. در این مقاله سامانه‌ای برای تشخیص اسامی با به‌کارگیری مفهوم «کلمه‌های نامزد اسم» در مراحل آموزش و پیش‌بینیِ مدلی مبتنی بر میدان‌های تصادفی شرطی معرفی شده است. به‌طورخاص،‌ همراه با توسعۀ این سامانه، پیکره‌های متنی استانداردی از روی متون دینی کهن به زبان عربی ساخته شده‌ است. همچنین حاصل کار سامانه بر روی داده‌های روزنامه‌ای که توسط محققان دیگر ایجاد شده، بررسی شده است و نتایج به‌دست آمده در مقایسه با نتایج سامانه‌های دیگر روی همان داده‌ها، نشان می‌دهد با استفاده از این روش، دقت تشخیص اسامی در متون عربی به مقدار قابل توجهی بالا رفته است.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Extracting person names using name candidate injection in a conditional random field model for Arabic language
چکیده انگلیسی مقاله Named Entity Recognition and Extraction are very important tasks for discovering proper names including persons, locations, date, and time, inside electronic textual resources. Accurate named entity recognition system is an essential utility to resolve fundamental problems in question answering systems, summary extraction, information retrieval and extraction, machine translation, video interpretation and semantic query expansion. Furthermore, named entity recognition can help us in some state-of-art problems such as removing ambiguity between two common names in different fields, finding out citations in scientific articles, recognizing the associations among persons and improving the results of a search engine to search queries containing named entities. Recently, many researches have been done on named entity recognition for English and other European languages which have led to efficient results whereas the results are not convincing in Arabic, Persian and many of South Asian languages. One of the most necessary and problematic sub-tasks of named entity recognition is the person named extraction. In this article we have introduced a system for person named extraction in Arabic religious texts using "Proper Name candidate injection" by means of Conditional Random Field (CRF) method. Additionally, we have constructed a new corpus from traditional Arabic religious texts. Applying this method, our experiments have significantly achieved more efficient results.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله مجید عسگری بیدهندی | asgari bidhendi
تهران - خ آزادی - خ جیحون - ک ابراهیم - پ ۵۴

بهروز مینایی بیدگلی | behrouz minaei bidgoli
تهران - نارمک - دانشگاه علم و صنعت ایران
سازمان اصلی تایید شده: دانشگاه علم و صنعت ایران (Iran university of science and technology)


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-326-1&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233380.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات