سامانه اطلاعات پژوهشی ایران

این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند

چهارشنبه 3 دی 1404


پردازش علائم و داده ها، جلد ۱۳، شماره ۱، صفحات ۷۱-۸۵


عنوان فارسی	طراحی سامانۀ تشخیص دستبرد ادبی جمله‌بنیاد در متون فارسی به کمک هم‌جوشی گواه‌ها

چکیده فارسی مقاله	در حال حاضر، افراد به راحتی می‌توانند سند جدیدی را با رونوشت‌برداری از منابع وسیع اینترنتی درست و به نام خود ثبت کنند که مصداقی از دستبرد ادبی است. سامانه‌های دستبرد ادبی موجود قابلیت شناسایی کامل انواع دستبرد را ندارند. چالش اساسی در این زمینه یافتن الگوریتمی مناسب برای بهبود میزان یافته‌های مشابه و زمان بررسی آنهاست. تاکنون سنجه‌های مختلفی برای ارزیابی مشابهت دو سند ارائه شده که کارایی آنها به محتوای متن و منابع مورد استفاده برای مقایسۀ بین واژه‌های دو سند محدود است. در این مقاله روشی ارائه شده است که با توجه به کیفی و ناکامل بودن عوامل اثرگذار بر سنجش شباهت بین دو متن، از نظریۀ گواه برای هم‌جوشی اطلاعات به منظور ارزیابی تشابه دو سند فارسی و کشف دستبرد ادبی استفاده می‌کند. سامانۀ طراحی‌شده در مرحلۀ اول جمله‌های موجود در سند را به دو بخش عمومی و تخصصی تقسیم کرده و سپس با استفاده از سنجه‌های متفاوت و استفاده از منابعی همانند «هستان‌نگار تخصصی» امتیاز تشابه برای هر بخش را محاسبه و در نهایت در دو سطح، میزان شباهت بین دو سند را استنتاج می‌کند؛ به طوری‌که در سطح اول نتایج سنجه‌های شباهت‌سنجی به عنوان گواه (با باور پایۀ مشخص) با قاعدۀ دمپستر-شفر با هم ترکیب شده و به عنوان گواهی جدید به سطح دوم منتقل می‌شوند. در سطح دوم نتیجۀ سطح اول ‌و‌گواه جدید از طریق قاعدۀ میانگین‌گیری ترکیب شده و توابع باور و مقبولیت نهایی محاسبه و شباهت بین دو جمله(سند) ارزیابی می‌شود. سامانۀ مذکور بر داده‌های واقعی در محیط زبان فارسی مورد ارزیابی قرار گرفته که با دقت بیش از 90% امکان شناسایی اسناد مشابه را داراست و به همین دلیل توانمندی لازم برای استفاده در حوزۀ شناسایی دستبرد ادبی را داراست.

کلیدواژه‌های فارسی مقاله

عنوان انگلیسی	Design a Sentence Based Plagiarism Detection System by Evidences Fusion in Persian Text

چکیده انگلیسی مقاله	Today, there are many documents on Internet, such that users can generate new documents by coping them and existing Plagiarism Detection systems (PDS) couldn't detect all kind of plagiarism. The main challenge is finding a suitable algorithm to improving the amount of similar documents and their assessing time. It’s difficult to do assessing similarity in Persian texts that different characteristics affect on it and also many of them are ambiguous. For this reason Dempster - Shefer (Evidence) theory has been used in this paper. The proposed system will assess in a two-level and in the first stage, sentences will divide in general and expert terms and then assessing by suitable measures and domain ontology. These results will be delivered to first level as "basic belief" and will be integrated by using a Dempster combination rule to create one of the second level inputs. In second level, the previous level result and another similarity measures will be weighted and combined belief and plausibility functions for final assessment will be distinguished. This system has been used for real data assessment and compared the actual results shows that the precision between the system results and actual results is about 90%, which implies that the system can be used as Plagiarism Detection System.

کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله	حمید آهنگربهان \| hamid ahangarbahan p.o. box 14115-179 صندوق پستی 179- 14115 غلامعلی منتظر \| gholam ali montazer p.o. box 14115-179 صندوق پستی 179- 14115

نشانی اینترنتی	http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-629-1&slc_lang=fa&sid=fa
فایل مقاله	اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233329.pdf
کد مقاله (doi)
زبان مقاله منتشر شده	fa
موضوعات مقاله منتشر شده	مقالات پردازش متن
نوع مقاله منتشر شده	پژوهشی

برگشت به: صفحه اول پایگاه \| نسخه مرتبط \| نشریه مرتبط \| فهرست نشریات

ارسال پیام برخط

در صورت مشاهده هر نوع اشکال در داده های پایگاه و یا برای ارسال نظرات و پیشنهاد های خود می توانید با پر کردن فرم تماس ما را در جریان قرار دهید.
برای پر کردن فرم تماس اینجا را کلیک کنید.

آمار پایگاه

نمایه شده در ISI 135

نمایه شده در PubMed 109

نمایه شده در Scopus 192

کاربران برخط 450

بازدید امروز 15283

بازدید کل 39725303

اطلاعات تماس

آدرس : تهران، سعادت آباد، بلوار پاکنژاد شمالی، بالاتر از میدان سرو، نبش کوچه ندا، پلاک ۶۸، ساختمان جاوید، واحد ۱۶

پست الکترونیک: yektaweb-AT-gmail.com

توجه

کلیه حقوق این وب سایت و مطالب آن متعلق به شرکت یکتاوب بوده و استفاده از مطالب آن با ذکر منبع بلامانع است
طراحی و برنامه نویسی: یکتاوب افزار شرق