این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
چهارشنبه 3 دی 1404
پردازش علائم و داده ها
، جلد ۱۳، شماره ۱، صفحات ۸۷-۱۰۰
عنوان فارسی
ارائه روشی جدید برای شاخصگذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشهبندی متون
چکیده فارسی مقاله
در زبان فارسی کلمات دارای صورتهای نگارشی متنوعی هستند و پوشش کلیه حالات دستوری کلمات با به کارگیری یک سری قواعد معین ناممکن است به همین دلیل استخراج کلمات کلیدی به طور خودکار از متون فارسی دشوار و پیچیده است. در این مقاله سعی شده است با استفاده از اطلاعات زبان شناختی و اصطلاحنامه ، کلمات کلیدی بامعناتری ارائه شود. با استفاده از اصطلاحنامه که از نظامی ساختارمند برخوردار است میتوان شبکه کلمات کلیدی، شامل کلمات هم ارز، کلمات سلسله مراتبی و وابسته را تکمیل کرده و افزایش داد. بنابراین میتوان توافق بین جستجوی کاربران و کلمات کلیدی متنی را بیشتر نمود و جامعیت جستجو را افزایش داد. در مرحله اول کلمات غیر مهم و عمومی حذف میشوند. سپس کلمات متن ریشهیابی میشوند و در ادامه برای مشخص شدن اهمیت نسبی کلمات با استفاده از روشهای وزندهی یک وزن عددی به هر کلمه منسوب میگردد که بیانگر میزان تاثیر کلمه در ارتباط با موضوع متن و درمقایسه با سایر کلمات بکار رفته در متن است. مجموعه عملیات فوق خصوصاً استفاده از اصطلاحنامه باعث میشود که دستهبندی متون دقیقتر انجام گیرد و به نوعی رده علمی سلسله مراتبی متون در حوزه بازیابی اطلاعات نیز مشخص میشود. نتایج آزمایشها روی چندین متن در موضوعات مختلف نشان دهنده دقت و توانایی روش پیشنهادی در استخراج کلمات کلیدی منطبق با خواست کاربر است و در نتیجه خوشهبندی دقیقتر متون میباشد.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Improved Clustering Persian Text Based on Keyword Using Linguistic and Thesaurus Knowledge
چکیده انگلیسی مقاله
Persian words in writing with a diverse and cover all modes of grammatical words with the recruitment of a series of specific rules because it is impossible to extract keywords automatically from Persian texts difficult and complex. This thesis has attempted to use linguistic information and thesaurus, keywords Mnatry be provided. Using the symbol system is structured network can be keywords, including the exchange of words, words and words with hierarchical relationships complete the package has increased. Therefore the agreement between users and search keywords text search and recall is increased. In the first stage non-important words are removed and the public. Supervision in the text are words and more words to clarify the relative importance of using a blower numerical weight is assigned to each word that indicates the effectiveness of the word in connection with the subject and compared with the other words used in the text. Particularly complex operation that makes use of thesaurus keywords are extracted Mnytry that kind of hierarchical category scientific literature in the field of information retrieval is indicated. Test results on different topics several text accurately represents the proposed method and the ability to extract the keywords in accordance with user demand.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
حمید پروین |
دانشگاه آزاد اسلامی،
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-279-3&slc_lang=fa&sid=fa
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233330.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش متن
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات