سامانه اطلاعات پژوهشی ایران

این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند

یکشنبه 23 آذر 1404


پژوهشنامه پردازش و مدیریت اطلاعات، جلد ۳۳، شماره ۴، صفحات ۱۸۴۵-۱۸۶۴


عنوان فارسی	ارائه سیستم خلاصه ساز متون فارسی برمبنای ویژگی های زبان شناختی و رگرسیون

چکیده فارسی مقاله	گسترش روزافزون دادههای متنی فارسی در فضای اینترنت و پیچیدگی جستجو در میان انبوه این اسناد، خلاصه‌سازی خودکار متون فارسی را به یکی از زمینه های تحقیقاتی مورد توجه تبدیل کرده است. در این مقاله روشی کارا برای خلاصه‌سازی خودکار متون فارسی ارائه شده است. روش پیشنهادی که به‌صورت انتخابی و تک سندی است، خلاصه‌سازی را بر اساس رتبه بندی جملات و انتخاب مهم‌ترین آنها انجام میدهد. اهمیت هر جمله از متن با ترکیب خطی مقادیر هفت ویژگی زبان شناختی مستخرج از سند برای هر جمله بدست میآید. وزن بهینه هر ویژگی در این ترکیب از روش رگرسیون خطی و با استفاده از پیکره آموزشی پاسخ محاسبه‌ شده است. پس از محاسبه اهمیت جملات متن، در هر مرحله از الگوریتم، یک جمله با اهمیت بیشتر تا رسیدن به نرخ فشرده سازی مورد نظر انتخاب میشود. این جمله علاوه بر اینکه دارای بیشترین اهمیت است، دارای کمترین میزان شباهت با جملات انتخاب‌شده در مراحل قبلی نیز است. نتایج بدست آمده از مقایسه الگوریتم پیشنهادی با دو سیستم خلاصه‌ساز ایجاز و فارسی سام با استفاده از پیکره پاسخ، نشان می دهد در بیشتر معیارهای ارزیابی پیشرفت قابل توجهی حاصل ‌شده است.

کلیدواژه‌های فارسی مقاله

عنوان انگلیسی	An automatic Persian text summarization system based on linguistic features and regression

چکیده انگلیسی مقاله	Considering the vast amount of existing written information and the shortage of time, optimal summarization of books, articles, news reports, etc. on the Web is a major concern of researchers. In this paper, we propose a new approach for Persian single-document Summarization based on several linguistic features of text. In our approach after extracting the linguistic features for each sentence, the weight of features is learned by a linear regression method. We select one sentence with maximum score at each step of algorithm. The score of each sentence is calculated based on two factors: first, sum of the weighted features and second, the amount of its similarity to the sentences that are selected for final summary previously. We use an automatic evaluation tool to compare our approach with other existing approaches. The result indicates that our method improves the performance of summarization.

کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله	محمود سلطانی \| Mahmood Soltani Quchan University of Advanced Technology دانشگاه مهندسی فناوری‌های نوین قوچان جلال الدین نصیری \| Jalal Nasiri Iranian Research Institute for Information Science and Technology (IRANDOC) پژوهشگاه علوم و فناوری اطلاعات (ایرانداک) احسان عسگریان \| Ehsan Asgarian Engineering Department of Ferdowsi University of Mashhad دانشگاه فردوسی مشهد

نشانی اینترنتی	http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-3807-1&slc_lang=fa&sid=1
فایل مقاله	اشکال در دسترسی به فایل - ./files/site1/rds_journals/1504/article-1504-893082.pdf
کد مقاله (doi)
زبان مقاله منتشر شده	fa
موضوعات مقاله منتشر شده	فناوری اطلاعات
نوع مقاله منتشر شده	پژوهشی

برگشت به: صفحه اول پایگاه \| نسخه مرتبط \| نشریه مرتبط \| فهرست نشریات

ارسال پیام برخط

در صورت مشاهده هر نوع اشکال در داده های پایگاه و یا برای ارسال نظرات و پیشنهاد های خود می توانید با پر کردن فرم تماس ما را در جریان قرار دهید.
برای پر کردن فرم تماس اینجا را کلیک کنید.

آمار پایگاه

نمایه شده در ISI 135

نمایه شده در PubMed 109

نمایه شده در Scopus 192

کاربران برخط 748

بازدید امروز 6473

بازدید کل 39110436

اطلاعات تماس

آدرس : تهران، سعادت آباد، بلوار پاکنژاد شمالی، بالاتر از میدان سرو، نبش کوچه ندا، پلاک ۶۸، ساختمان جاوید، واحد ۱۶

پست الکترونیک: yektaweb-AT-gmail.com

توجه

کلیه حقوق این وب سایت و مطالب آن متعلق به شرکت یکتاوب بوده و استفاده از مطالب آن با ذکر منبع بلامانع است
طراحی و برنامه نویسی: یکتاوب افزار شرق