این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
یکشنبه 23 آذر 1404
پژوهشنامه پردازش و مدیریت اطلاعات
، جلد ۳۷، شماره ۴، صفحات ۱۲۴۴-۱۲۱۷
عنوان فارسی
کاربرد یادگیری ماشینی مبتنیبر شبکه عصبی برای دستهبندی مستندات علمی
چکیده فارسی مقاله
از دهه 1380 شمسی، نگارش و انتشار مقالات علمی در ایران شدت بسیار زیادی به خود گرفته و سبب شدهاست علاوهبر سازمانهای دولتی مانند ایرانداک و سازمان اسناد و کتابخانه ملی جمهوری اسلامی ایران، سامانههای برخط متعدد دیگری چون پرتال جامع علوم انسانی، نورمگز، مگایران، علمنت، سیویلیکا و غیره اقدام به مدیریت دانش و تهیه بایگانیهای ساختارمند مستندات علمی کند. هرکدام از این بایگانیها، امکاناتی را در اختیار کاربر قرار میدهد. یکیاز این امکانات، قابلیت جستجو است و جستجوی دقیق میتواند بر کاربری این سامانهها تأثیر بهسزایی بگذارد. برای افزایش دقت جستجو نیاز است حوزه علمی مقالات مشخص شود. دستهبندی حجم زیاد منابع علمی در حوزههای مختلف بسیار زمانبر است که استفاده از روشهای ماشینی بهعنوان یک راه حل میتواند از این کار طاقتفرسا بکاهد. هدف اصلی این مقاله، ارائه یک مدل دستهبندی برای تعیین حوزه مقالات علمی است. اگرچه در پژوهشهای پیشینِ دستهبندی بهطور عمده از الگوریتمهای دستهبندی متداول برای متن ساده بهکار رفتهاست، در این پژوهش تلاش میشود علاوهبر استفاده از این دستهبندها، از دستهبندهای مبتنیبر شبکه عصبی، مانند شبکه عصبی پیچشی[1] و پرسپترون[2]، بههمراه بازنمایی معنایی مبتنیبر بافت، مانند ParsBERT، استفاده گردد و نتایج آن با سایر روشهای متداول در ساخت بردار مستندات، مانند Word2Vec، مقایسه گردد. برای این هدف، از دادههای پرتال علوم انسانی که دربرگیرنده مقالات متنوع علوم انسانی استفاده میکنیم. ویژگی این داده مشخصبودن حوزه تخصصی هر مقاله است. یکیاز ویژگیهای شبکه عصبی این است که برایندی از ویژگیهای نهفته از داده در فضای برداریِ ساختهشده شکل میگیرد و برای آموزش مدل استفاده میگردد. براساس نتایج عملی، دستهبند پرسپترون مبتنیبر ParsBERT بالاترین کارایی 71/74 درصدی براساس امتیاز F میکرو و کارایی 55/72 درصدی براساس امتیاز F ماکرو را بهدست آوردهاست. [1] convolutional neural network [2] perceptron neural network
کلیدواژههای فارسی مقاله
مستندات علمی، علوم انسانی، دستهبندی، شبکه عصبی، فضای برداری، ParsBERT، معناشناسی توزیعی
عنوان انگلیسی
Application of the Neural Network-based Machine Learning Method to Classify Scientific Articles
چکیده انگلیسی مقاله
Since 2001s (1380s according to the Iran's solar calendar), the increasing rate of writing and publishing scientific articles in Iran has become very intense. This caused in addition to the governmental organizations, such as Irandoc & the National Library and Archives of the Islamic Republic of Iran, numerous other online systems, such as the General Portal of Humanities, Noormags, Magiran, Elmnet, Civilica, etc, to manage knowledge and to provide structured archives of the scientific documents. Each of these archives provides facilities to the user. One of these facilities is searching on the documents. An accurate search can greatly improve the usage of these online systems. To increase the accuracy of the search result, it is necessary to determine the scientific field of articles. Classifying large volumes of scientific resources in different fields is very time-consuming. Using machinery methods can be a solution to reduce the severity of the task. The main contribution of this paper is to provide a classification model to classify Persian scientific articles. Although in previous studies, the classification task has been mainly used for simple texts, in this study, the neural network-based classification models, such as convolutional and perceptron neural networks, are used with the contextualized semantic representation, such as ParsBERT; and the results are compared with the other common method utilized for vectorization, namely Word2Vec. To this end, we use the data from the General Portal of Humanities, which includes various articles in the Humanities and each article contains the label of the field. One of the neural network characteristics is that a set of hidden features from the data in the vector space is created and used to train the model. According to the experimental results, the Perceptron classifier that utilized ParsBERT representation obtained the highest performance which is 74.71% based on the Micro F-score, and 72.55% based on the Macro F-score.
کلیدواژههای انگلیسی مقاله
scientific publications, humanities, classification, neural network, vector space, BERT
نویسندگان مقاله
مسعود قیومی | Masood Ghayoomi
Institute for Humanities and Cultural Studies; Tehran, Iran.
پژوهشکده زبانشناسی؛پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران؛ ایران.
مریم موسویان | Maryam Mousavian
Department of Computer Engineering; Amirkabir University of Technology; Tehran, Iran.
دانشکده مهندسی کامپیوتر؛دانشگاه صنعتی امیرکبیر، تهران؛ ایران.
نشانی اینترنتی
http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-5181-2&slc_lang=fa&sid=1
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
ابزارهای زبانی و زبانشناختی
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات