این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۲۰، شماره ۴، صفحات ۱۰۷-۱۲۰

عنوان فارسی دادگان پرسش و پاسخ زبان فارسی
چکیده فارسی مقاله پاسخ سریع و دقیق به سؤالات مطرح شده به زبان طبیعی یکی اهداف مهم در توسعه سیستم‌های پرسش‌وپاسخ است که در آن رایانه یک متن و سؤال را درک می‌کند و پاسخ دقیق را برای کاربر ارائه می‌نماید. با اینکه پیشرفت‌های زیادی در این حوزه صورت‌گرفته است اما همچنان جزو مسائلی است که نیاز به ارتقا خصوصاً برای زبان‌های غیر از انگلیسی مثل زبان فارسی است. در این مقاله دادگان پرسش‌وپاسخ زبان فارسی (FarsiQuAD) تهیه شده که توسط انسان و از مقالات ویکی‌پدیای فارسی ایجاد گردیده و در دو نسخه منتشر شده است. نسخه 1 شامل  10000+ پرسش‌وپاسخ و نسخه 2 این شامل مجموعه بیش از 145000+ ردیف است. این دادگان قابلیت تجمیع با نسخه انگلیسی SQuAD و سایر دادگان زبان‌های دیگر که از این استاندارد استفاده کرده باشند را دارد و برای عموم منتشر شده است. این دادگان جهت ساخت مدل‌های هوش مصنوعی مبتی بر یادگیری عمیق و برای استفاده در سامانه‌های پرسش و پاسخ زبان فارسی است.  
نتایج این تحقیق نشان می‌دهد دادگان پرسش‌وپاسخ زبان فارسی ایجاد شده می‌تواند پاسخ به سؤالات مطرح شده به زبان طبیعی فارسی را با معیار تطابق دقیق 78 درصد و معیار F1 87 درصد برساند که هنوز نیازمند ارتقا است.  
 
کلیدواژه‌های فارسی مقاله دادگان پرسش‌وپاسخ زبان فارسی، سیستم‌های پرسش‌وپاسخ، درک مطلب ، یادگیری عمیق، پردازش زبان طبیعی

عنوان انگلیسی Farsi Question and Answer Dataset (FarsiQuAD)
چکیده انگلیسی مقاله Fast and accurate answer to the questions asked in natural language is one of the important goals in the development of question and answer systems in which the computer understands a context and question and provides the exact answer to the user. Although there has been a lot of progress in this area, it is still among the issues that need to be improved, especially for languages ​​other than English, such as Persian. FarsiQuAD (FarsiQuAD) was created by humans from Persian Wikipedia articles and published in two versions. Version 1 contains 10,000+ questions and answers and version 2 contains a collection of over 145,000+ rows. This database has the ability to integrate with the English version of SQuAD and other databases of other languages ​​that have used this standard.The results of this research show that the created Persian language question and answer database can provide the user with the answer to the questions asked in the natural Persian language with an exact matching criterion of 78%  and an F1 criterion of 87%, and it still needs to be improved.
 
کلیدواژه‌های انگلیسی مقاله Question And Answer Dataset, Question And Answer systems, Reading comprehension, Deep Learning, Natural Language Processing

نویسندگان مقاله جواد فروتن راد | Javad ForutanRad


مریم حورعلی | Maryam HourAli
دانشگاه صنعتی مالک اشتر

محمدعلی کیوان راد | MohammadAli KeyvanRad
دانشگاه صنعتی مالک اشتر


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-2352-1&slc_lang=fa&sid=1
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده بنیادی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات