این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
International Journal of Information and Communication Technology Research (IJICT، جلد ۵، شماره ۱، صفحات ۳۹-۵۲

عنوان فارسی
چکیده فارسی مقاله
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Statistical Machine Translation (SMT) for Highly-Inflectional Scarce-Resource Language
چکیده انگلیسی مقاله Statistical Machine Translation (SMT) is a machine translation paradigm, in which translations are generated on the base of statistical models. In this system, parameters are derived from an analysis of a parallel corpus, and SMT quality depends on the ability of learning word translations. Enriching the SMT by a suitable morphology analyser decreases out of vocabulary words and dictionary size dramatically. This could be more considerable when it deals with a highly-inflectional, low-resource, language like Persian. Defining a suitable granularity for word segment may improve the alignment quality in the parallel corpus. In this paper different schemes and word's combinations segments in a SMT's experiment from Persian to English language are prospected and the best one-to-one alignment, which is called En-like scheme, is proposed. By using the mentioned scheme the translation's quality from Persian to English is improved about 3 points with respect to BLEU measure over the phrase-based SMT.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله | Saman Namdar


| Hesham Faili


| Shahram Khadivi



نشانی اینترنتی http://ijict.itrc.ac.ir/browse.php?a_code=A-10-27-138&slc_lang=fa&sid=1
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/417/article-417-1212441.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده فناوری اطلاعات
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات