این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
یکشنبه 30 آذر 1404
پردازش علائم و داده ها
، جلد ۱۵، شماره ۴، صفحات ۹۵-۱۱۰
عنوان فارسی
رویکردی با ناظر در استخراج واژگان کلیدی اسناد فارسی با استفاده از زنجیرههای لغوی
چکیده فارسی مقاله
واژگان کلیدی، واژگان اصلی و کانونی یک متن و مضمون اصلی مطلب هستند. تهیه این واژگان به روش سنّتی نیازمند صرف زمان و همچنین دانش تخصّصی راجع به موضوع متن است. از آنجا که واژگان کلیدی کاربردهای فراوانی در بهکارگیری مستندات الکترونیکی دارند، شناسایی روشهای خودکار و بهبودیافته برای استخراج این دسته از واژگان همیشه مورد توجه بوده است. رویکرد پژوهش حاضر یک روش باناظر برای استخراج واژگان کلیدی است که در آن با استفاده از زنجیرههای لغوی واژگان متن، ویژگیهای جدیدی برای هر واژه استخراج شده است. در ایجاد زنجیرههای لغوی سعی بر شکلگیری روابط بین معنای واژگان بودهایم، ازاینرو در مدل ارائهشده « فارسنت» نقش مهمی در ایجاد آنها ایفا میکند. دادههای مورد ارزیابی در این پژوهش مقالات علمی پژوهشی نشریات فارسی هستند. نتایج بهدستآمده نشان میدهد که استفاده از روابط معنایی بین واژگان در کنار ویژگیهای آماری، عملکرد مناسبی را در استخراج واژگان کلیدی از مقالات نتیجه میدهد.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Supervised approach for keyword extraction from Persian documents using lexical chains
چکیده انگلیسی مقاله
Keywords are the main focal points of interest within a text, which intends to represent the principal concepts outlined in the document. Determining the keywords using traditional methods is a time consuming process and requires specialized knowledge of the subject. For the purposes of indexing the vast expanse of electronic documents, it is important to automate the keyword extraction task. Since keywords structure is coherent, we focus on the relation between words. Most of previous methods in Persian are based on statistical relation between words and didn't consider the sense relations. However, by existing ambiguity in the meaning, using these statistic methods couldn't help in determining relations between words. Our method for extracting keywords is a supervised method which by using lexical chain of words, new features are extracted for each word. Using these features beside of statistic features could be more effective in a supervised system. We have tried to map the relations amongst word senses by using lexical chains. Therefore, in the proposed model, "FarsNet" plays a key role in constructing the lexical chains. Lexical chain is created by using Galley and McKeown's algorithm that of course, some changes have been made to the algorithm. We used java version of hazm library to determine candidate words in the text. These words were identified by using POS tagging and Noun phrase chunking. Ten features are considered for each candidate word. Four features related to frequency and position of word in the text and the rest related to lexical chain of the word. After extracting the keywords by the classifier, post-processing performs for determining Two-word key phrases that were not obtained in the previous step. The dataset used in this research was chosen from among Persian scientific papers. We only used the title and abstract of these papers. The results depicted that using semantic relations, besides statistical features, would improve the overall performance of keyword extraction for papers. Also, the Naive Bayes classifier gives the best result among the investigated classifiers, of course, eliminating some of the features of the lexical chain improved its performance.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
عطیه شریفی | Atieh Sharifi
دانشگاه بینالمللی امام خمینی
محمد امین مهدوی | M.Amin Mahdavi
دانشگاه بینالمللی امام خمینی
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1359-1&slc_lang=fa&sid=1
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-1358696.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش متن
نوع مقاله منتشر شده
کاربردی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات