این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
سه شنبه 25 آذر 1404
پژوهشنامه پردازش و مدیریت اطلاعات
، جلد ۳۸، شماره ۴، صفحات ۱۳۴۵-۱۳۶۸
عنوان فارسی
تخمین تعداد موضوعات در مدلسازی موضوعی روی مقالات علمی فارسی
چکیده فارسی مقاله
این مقاله روشی را برای یافتن تعداد موضوعات در مقالات علمی فارسی ارائه میدهد که یکی از چالشهای اصلی در مدلسازی موضوعی است و در واقع، فرایند تشخیص خودکار موضوعات در یک متن با هدف کشف الگوهای پنهان است. پژوهش حاضر از نوع کاربردی است که با مقایسه دو روش، یکی مبتنی بر «گریدی» و دیگری مبتنی بر نظریه بازبهنجاری پارامتر تعداد موضوعات را برای مقالات نشریات فارسی تخمین میزند. روش «گریدی» با تعریف یک معیار برای ارزیابی مدل موضوعی و بهدست آوردن این معیار با توجه به مقادیر مختلف تعداد موضوعات میتواند تعداد موضوعات بهینه را تخمین بزند. الگوریتم دیگر مبتنی بر نظریه بازبهنجاری است که در واقع، یک فرمولاسیون ریاضی برای ساخت یک رویّه برای تغییر مقیاس سیستم تحت بررسی است بهصورتی که رفتار سیستم حفظ شود و تغییری در روند آن ایجاد نشود. با استفاده از این نظریه و استفاده از اطلاعات مرحله قبل میتوان تعداد موضوعات را با سرعت تخمین زد. همچنین، مدت زمان اجرای هر دو الگوریتم روی مقالات نشریات مختلف فارسی، ارائه و با یکدیگر مقایسه شده است. یافتهها نشاندهنده کارایی روش مبتنی بر نظریه بازبهنجاری در تخمین تعداد موضوعات موجود در مقالات نشریات فارسی است. نتایج نشان میدهد که روش مبتنی بر نظریه بازبهنجاری نسبت به روش «گریدی» با سرعت بالاتری میتواند تعداد موضوعات را تخمین بزند. از این روش میتوان پارامتر تعداد موضوعات در مقالات نشریات فارسی را تخمین زد که در نهایت، به مدلسازی موضوعی نشریات فارسی با توجه به مقالات چاپشده در آن منجر میشود.
کلیدواژههای فارسی مقاله
نظریه بازبهنجاری، آنتروپی رونو، جستوجوی گریدی، توزیع دیریکله،
عنوان انگلیسی
Estimating Number of Topics in Topic Modeling on Persian Research Articles
چکیده انگلیسی مقاله
This article presents a method to find the number of topics in Persian research articles, which is actually one of the main challenges in topic modeling. It is the process of automatically recognizing topics in a text with the aim of discovering hidden patterns. This study has estimated the number of topics for Persian research articles using two approaches. The first is based on the greedy search and later uses Renormalization theory, which is a mathematical formalism to construct a procedure for changing the scale of the system so that the behavior of the system preserves. Also, the execution time of both algorithms on Persian academic articles has been compared with each other. The findings indicate that the renormalization approach predicts the number of topics in Persian research articles with the lower time complexity in comparison to the greedy based approach. The approach based on Renormalization has high efficiency for estimating the number of topics in Persian academic articles.
کلیدواژههای انگلیسی مقاله
نظریه بازبهنجاری, آنتروپی رونو, جستوجوی گریدی, توزیع دیریکله
نویسندگان مقاله
نیلوفر مظفری |
مرکز منطقه ای اطلاع رسانی علوم و فناوری
نشانی اینترنتی
https://jipm.irandoc.ac.ir/article_701394_e29faecb44fc8c928f4560e9909d8164.pdf
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات