این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
یکشنبه 23 آذر 1404
پژوهشنامه پردازش و مدیریت اطلاعات
، جلد ۳۷، شماره ۴، صفحات ۱۲۶۸-۱۲۴۵
عنوان فارسی
تجزیه متون استنادی در زبان فارسی با استفاده از ماشین بردار پشتیبان
چکیده فارسی مقاله
یک متن استنادی را میتوان به عنوان مجموعهای از مولفهها مانند نام نویسندگان، عنوان، محل نشر، سال نشر، شماره صفحات و ... در نظر گرفت. در حالیکه تجزیه متون استنادی موجود در انتهای یک مدرک علمی توسط کاربر انسانی به راحتی انجامپذیر است، تنوع موجود در شیوههای استناددهی در کنار اشتباهات رخ داده توسط نویسندگان در نگارش این متون، خودکارسازی انجام این عملیات را دشوار نموده است. روشهای زیادی برای خودکارسازی تجزیه متون استنادی ارائه شده اما، این روشها وابسته به زبان بوده و امکان استفاده از یک روش ارائه شده برای یک زبان در زبانی دیگر منجر به نتایجی اشتباه میشود. تحقیقات صورت گرفته بیانگر این است که تاکنون هیچ روشی برای خودکارسازی تجزیه متون استنادی در زبان فارسی ارائه نشده است. با توجه به این مهم و نقش گسترده این مسئله در ساخت خودکار شبکههای استنادی مدارک علمی و فرایندهای بازیابی اطلاعات، در این مقاله به این مسئله پرداخته شده و با استفاده از روش یادگیری ماشین بردار پشتیبان به عنوان یک دستهبند چند دستهای، یک روش هوشمند برای مسئله تجزیه متون استنادی در زبان فارسی ارائه شده است. با توجه به اهمیت انتخاب ویژگیهای مناسب برای استفاده در دستهبند ماشین بردار پشتیبان، در این پژوهش این مهم با توجه به ویژگیهای استفاده شده در زبان انگلیسی و ویژگیهای زبان فارسی و ارجاعدهی در این زبان انجام شده است. نتایج پیادهسازی و آزمایش روش پیشنهادی با استفاده از مجموعه دادهای ایجاد شده در این پژوهش نشانگر مقدار 0.95 برای پارامترهای دقت، فراخوانی و اف-1 است.
کلیدواژههای فارسی مقاله
تجزیه متون استنادی، دستهبندی، دستهبندی چند دستهای، ماشین بردار پشتیبان، ساخت خودکار شبکههای استنادی.
عنوان انگلیسی
A Persian Citation Parsing Method Using Support Vector Machine
چکیده انگلیسی مقاله
Human users can easily divide a bibliographic reference to its constructing fields such as authors, title, journal, year, etc. However, due to the variations in formats and errors made by the authors in citing documents, it is difficult to automate this task. There exist many solutions for this problem, known as citation parsing problem in the literature, however, none of them is compatible with Persian language. This is mainly due to high language-sensitivity of these solutions. Considering the important role of citation parsing in tasks such as autonomous citation indexing and information retrieval, in this paper, we propose an intelligent method for citation parsing in Persian language. The proposed method uses the support vector machine (SVM) classification method as its core. The results of testing the proposed method using a dataset designed for this task show 95% in average for precision, recall and F1 measures for extracting different fields from a bibliographic reference, which is quite plausible.
کلیدواژههای انگلیسی مقاله
Citation parsing, classification, multi-class classification, supports vector machine, autonomous citation indexing.
نویسندگان مقاله
نصراله پاکنیت | Nasrollah Pakniat
Iranian Research Institute for Information Science and Technology (IranDoc); Thran; Iran.
پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)، تهران؛ ایران.
جلالالدین نصیری | Jalal A Nasiri
Faculty of Mathematical Sciences, Ferdowsi University of Mashhad, mashhad; Iran.
دانشکده علوم ریاضی، دانشگاه فردوسی مشهد، مشهد؛ ایران.
نشانی اینترنتی
http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-4266-2&slc_lang=fa&sid=1
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
سازماندهی
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات