این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
یکشنبه 23 آذر 1404
رایانش نرم و فناوری اطلاعات
، جلد ۱۳، شماره ۱، صفحات ۱-۱۰
عنوان فارسی
بهبود کارآمدی سامانههای پرسش و پاسخ دامنهباز برای پاسخدهی به پرسشهای چندگامی در زبان فارسی
چکیده فارسی مقاله
امروزه یکی از محبوبترین و چالشبرانگیزترین وظایف در پردازش زبان طبیعی پاسخدهی به پرسشهای پیچیده کاربران است. سامانههای پرسش و پاسخ به عنوان نسل جدید موتورهای جستجو پرسشهای کاربران را به زبان طبیعی و بدون محدودیت معنایی دریافت میکنند و پاسخ را به صورت دقیق بر میگردانند. در سالهای اخیر اکثر پژوهشهای انجام شده در حوزه سامانههای پرسش و پاسخ بر روی زبان انگلیسی متمرکز بوده و در زبانهای با منابع محدود از جمله فارسی تلاش چندانی صورت نگرفته است. این امر سبب میشود این سامانهها در پشتیبانی از زبانهای با منابع محدود همچون فارسی نتوانند کارآمدی خوبی را در مواجه با یک پرسش از خود ارائه دهند. در همین راستا در این مقاله جهت افزایش کارآمدی سامانههای پرسش و پاسخ در زبان فارسی نسبت به تولید و توسعه یک مجموعهداده برای پاسخدهی به پرسش های پیچیده چندگامی یا به اختصار چندگامی اقدام گردید. پرسشهای چندگامی، نیازمند حداقل دو گام استدلال برای دستیابی به پاسخ هستند. این مجموعهداده یا
PersianMHQA
به عنوان اولین مجموعهداده پرسش و پاسخ دامنهباز شامل 7000 پرسش چندگامی بوده و در سازوکاری مشخص با استفاده از متن دانشنامه ویکیپدیا فارسی تولید شده است. به منظور ارزیابی و محکزنی این مجموعهداده روی جدیدترین مدل های زبانی پیش آموزش دیده که از زبان فارسی پشیبانی میکنند تنظیم دقیق شده است. بهترین نتایج دست آمده مبتنی بر دو معیار افوان و تطابقدقیق روی این مجموعهداده به ترتیب 92/75 و 73/71 است. نتایج بدست آمده نشانگر این حقیقت است که این مجموعهداده شروعی قدرتمند برای بهبود پرسش و پاسخ پیچیده چندگامی برای سامانههای پرسش و پاسخ فارسی است.
کلیدواژههای فارسی مقاله
پرسش و پاسخ دامنهباز،پرسش چندگامی،مجموعهداده،زبان فارسی،دانشنامه ویکیپدیا فارسی،
عنوان انگلیسی
Improving the Effectiveness of Open-Domain Question-Answering Systems for Answering Multi-hop Questions in Persian Language
چکیده انگلیسی مقاله
Today, one of the most popular and challenging tasks in natural language processing is answering complex user questions. Question-answering systems, as a new generation of search engines, receive user questions in natural language without semantic limitations and provide precise answers. In recent years, most research in the field of question-answering systems has been focused on the English language, and not much effort has been made in languages with limited resources, such as Persian. This limitation prevents these systems from efficiently handling questions in languages like Persian.
In this regard, this article aims to enhance the efficiency of question-answering systems in the Persian language by creating a dataset for answering complex multi-turn questions. Multi-hop questions, require at least two steps of reasoning to reach an answer. This dataset, called PersianMHQA, is the first open-domain question-answering dataset in Persian and includes 7,000 multi-hop questions. It was generated using the Persian Wikipedia as a knowledge source. To evaluate and benchmark this dataset, it has been fine-tuned on the latest pre-trained language models that support the Persian language.
The best results obtained based on F1 score and exact match on this dataset are 75.92% and 71.73%, respectively. These results indicate that this dataset is a powerful starting point for improving multi-hop complex question-answering for Persian language systems.
In this regard, this article aims to enhance the efficiency of question-answering systems in the Persian language by creating a dataset for answering complex multi-turn questions. Multi-hop questions, require at least two steps of reasoning to reach an answer. This dataset, called PersianMHQA, is the first open-domain question-answering dataset in Persian and includes 7,000 multi-hop questions. It was generated using the Persian Wikipedia as a knowledge source. To evaluate and benchmark this dataset, it has been fine-tuned on the latest pre-trained language models that support the Persian language.
The best results obtained based on F1 score and exact match on this dataset are 75.92% and 71.73%, respectively. These results indicate that this dataset is a powerful starting point for improving multi-hop complex question-answering for Persian language systems.
کلیدواژههای انگلیسی مقاله
پرسش و پاسخ دامنهباز,پرسش چندگامی,مجموعهداده,زبان فارسی,دانشنامه ویکیپدیا فارسی
نویسندگان مقاله
آرش غفوری |
دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران، ایران.
مبینا تاجی |
دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران، ایران.
حسن نادری |
دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران، ایران.
بهروز مینایی بیدگلی |
دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران، ایران.
محمدرضا حسنی آهنگر |
استاد دانشکده و پژوهشکده هوش مصنوعی و علوم شناختی دانشگاه امام حسین(ع)
نشانی اینترنتی
https://jscit.nit.ac.ir/article_207270_a364aab523245721be6cf8b8b552b20c.pdf
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات