این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۲۱، شماره ۲، صفحات ۳-۱۴

عنوان فارسی به کارگیری تکنیک های داده افزایی برای تحلیل احساسات کاربران درباره بازگشایی مدارس در دوران همه‌گیری کووید-۱۹
چکیده فارسی مقاله از جمله روش­ های موفق برای تحلیل احساسات، روش ­های یادگیری باناظر است که با آموزش یک طبقه­ بند بر روی یک مجموعه داده آموزشی از نظرات دارای برچسب احساس یک مدل پیش ­بینی کننده می ­سازند که قادر است جملات جدید را طبقه ­بندی کند. در زبان فارسی، عدم وجود داده‌های آموزشی کافی و دقت کم ابزارهای پردازش زبان طبیعی، به­ کارگیری الگوریتم‌های باناظر و نیز استخراج ویژگی ­های باکیفیت را با چالش جدی روبرو ساخته است. هدف مقاله حاضر به ­کارگیری روش­های یادگیری ماشین باناظر برای طبقه­ بندی نظرات مطرح شده توسط کاربران فارسی­ زبان در رسانه‌های اجتماعی درباره بازگشایی مدارس در دوران همه‌گیری کووید-19 است. برای غلبه بر مشکل کمبود داده ­های آموزشی یک روش ترکیبی برای داده‌افزایی پیشنهاد شده است که اندازه مجموعه آموزش را حدود 97 درصد افزایش می ­دهد. نتایج آزمایشات انجام گرفته نشان می‌دهد که با اعمال روش پیشنهادی برای داده‌افزایی و به­ کارگیری ویژگی­ های انتخابی در این مقاله، به ترتیب دقت 81 و 79 درصد برای طبقه‌بندی نظرات با استفاده از الگوریتم ­های ماشین بردار پشتیبان و شبکه عصبی پیچشی حاصل می ­شود.
کلیدواژه‌های فارسی مقاله تحلیل احساسات، نظرکاوی، یادگیری باناظر، یادگیری عمیق، داده افزایی، کووید-19

عنوان انگلیسی Using Data Augmentation Techniques for Sentiment Analysis of Users’ Opinions on Reopening of Schools During the Covid-19 Epidemic1
چکیده انگلیسی مقاله Sentiment analysis, also called opinion mining, is one of the sub-areas of natural language processing that aims to classify texts according to the sentiments, beliefs and attitudes expressed in them. In the most current research, texts are divided into two "positive" and "negative" categories. However, there are also other categories such as good/bad" and agree/disagree, every one of which has its applications.
The purpose of this paper is to analyze the opinions expressed by users on social media about the reopening of schools during the Covid-19 outbreak using supervised machine learning techniques, and to classify them into two "agree" and "disagree" categories. Users' opinions, in this paper, are in Persian. The lack of sufficient datasets and also the low accuracy of natural language processing tools are the most important problems of text processing in Persian. Due to the mentioned limitations, the use of supervised machine learning algorithms and also the extraction of effective features for training machine learning classifiers in Persian are facing a serious challenge.
In this paper, first, a small dataset of the users' opinions about the reopening of schools was collected and manually labeled. Then, a combined method was used for data augmentation of the dataset. In the proposed method, first, Persian sentences were translated into English. Then nouns, verbs and adjectives of the English sentences were replaced with their synonyms. Next, the English sentences were translated into Persian again. The new sentence with the class label of the initial sentence was added to the training set. Thus, the size of the training set increased by 97 percent. After that, the efficiency of employing the common pre-processing steps and using common feature sets in sentiment analysis of the English texts for Persian were evaluated and the best of them were selected. Considering the low accuracy of the Persian natural language processing tools, it was tried to select those features that were less dependent on the tools. Finally, machine learning classification was used to determine agree/disagree class of the user opinions of the test sets. The results of the experiments indicated that by applying the proposed method for data augmentation and using selected features in this paper, 81 and 79 percent precision was obtained for the polarity classification of opinions using SVM and CNN algorithms, respectively.
 
کلیدواژه‌های انگلیسی مقاله Sentiment Analysis, Opinion mining, Supervised learning, Deep learning, Data augmentation, Covid-19

نویسندگان مقاله مرضیه میر | Marziye Mir
University Sistan and Baluchestan
دانشگاه سیستان و بلوچستان

سمیرا نوفرستی | Samira Noferesti
University of Sistan and Baluchestan
دانشگاه سیستان و بلوچستان


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-667-4&slc_lang=fa&sid=1
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات