این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
پنجشنبه 27 آذر 1404
رایانش نرم و فناوری اطلاعات
، جلد ۱۱، شماره ۱، صفحات ۱۸-۳۱
عنوان فارسی
شباهت یابی بین زبانی جملات فارسی-انگلیسی با استفاده از یادگیری عمیق
چکیده فارسی مقاله
شباهتیابی معنایی متون یکی از زیرشاخههای پردازش زبان طبیعی محسوب میشود که در چند سال اخیر تحقیقات گستردهای را به خود معطوف کرده است. سنجش تشابه معنایی بین کلمات یا اصطلاحات، جملات، پاراگراف و اسناد، نقش مهمی در پردازش زبان طبیعی و زبانشناسی رایانشی ایفا میکند. شباهتیابی معنایی متون در سامانههای پرسش و پاسخ، کشف تقلب، ترجمه ماشینی، بازیابی اطلاعات و نظیر آن کاربرد دارد. منظور از شباهتیابی معنایی، محاسبه میزان شباهت معنایی بین دو سند متنی، پاراگراف یا جمله میباشد که به دو صورت تکزبانه و چندزبانه مطرح است. در این مقاله با استفاد از پیکره موازی میزان، برای اولین بار مدل بین زبانی شباهت معنایی جملات فارسی-انگلیسی را ارائه داده و در ادامه مدل خود را با مدل برت چندزبانه مورد آزمون و مقایسه قرار دادیم. نتایج حاکی از آن است که با استفاده از پیکرههای موازی میتوان کیفیت تعبیه جملات را در دو زبان مختلف بهبود بخشید. در روش پیشنهادی، معیار همبستگی پیرسون بر اساس شباهت کسینوسی بین بردارهای معنایی حاصل از برت چندزبانه از 65 درصد به 73.77 درصد افزایش یافته است. روش پیشنهادی بر جفت زبان عربی-انگلیسی نیز مورد آزمون قرار گرفت که نتایج حاصله بیانگر برتری روش پیشنهادی نسبت به برت چند زبانه است.
کلیدواژههای فارسی مقاله
پردازش زبان طبیعی، شباهت معنایی، بین زبانی، یادگیری عمیق،
عنوان انگلیسی
Semantic Textual Similarity of Persian-English sentences using deep learning
چکیده انگلیسی مقاله
Semantic Textual similarity is one of the subtasks of natural language processing that has attracted extensive rese arch in recent years. Measuring semantic similarity between words, sentences, paragraphs, and documents plays an important role in natural language processing and computational linguistics. Semantic similarity of texts is used in question-answering systems, fraud detection, machine translation, information retrieval and etc. Semantic similarity means calculating the degree of similarity between two textual documents, paragraphs or sentences, which are presented in both monolingual and cross lingual forms. In this article, by using the parallel corpus, for the first time, the cross lingual model of semantic similarity for Persian-English sentences is presented, and then we test and compare our model with the Multilingual BERT model. The results show that by using parallel corpuses, the quality of sentence embedding in two different languages can be improved. Pearson correlation criterion based on cosine similarity between sentence's vector of multilingual Bert has increased from 65% to 73.77% by the proposed method. The proposed method was also tested on the Arabic-English language pair, and the results show that the proposed method is superior to the multilingual Bert.
کلیدواژههای انگلیسی مقاله
پردازش زبان طبیعی, شباهت معنایی, بین زبانی, یادگیری عمیق
نویسندگان مقاله
محمد عبدوس |
هوش مصنوعی و رباتیک، دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران، ایران.
بهروز مینایی بیدگلی |
دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت
نشانی اینترنتی
https://jscit.nit.ac.ir/article_148336_07cb4c31de6103dd7db7f35fe92fb5f4.pdf
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات