این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
International Journal of Information and Communication Technology Research (IJICT، جلد ۱، شماره ۳، صفحات ۱۵-۲۶

عنوان فارسی
چکیده فارسی مقاله
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Corpus-Based Analysis for Multi-Token Units in Persian
چکیده انگلیسی مقاله Because of the joining behavior of Persian script and its orthographic variation, the morphological and syntactic annotations of multi-token units meet various issues. By the analysis of Perso-Arabic script and its problems, the various collocation types of the tokens including the compositional, non-compositional and the new semi­compositional constructions are described in the present paper. Then, to illustrate these constructions, the static and dynamic multi-token units will be presented for the generative and non-generative structures of the main categories including the verbs, infinitives, prepositions, conjunctions, adverbs, adjectives and nouns. Defining the multi-token unit templates for these categories is one of the important results of this research. The findings can be input to the segmentation module of the Persian Treebank generator system. The other usage of the present research is in the design and implementation of the morphological analyzers and syntactical parsers.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله | Masoud Sharifi Atashgah
Department of Literature and Human Science University,Tehran University,Tehran,Iran


| Mahmoud Bijankhan
Department of Literature and Human Science University,Tehran University,Tehran,Iran



نشانی اینترنتی http://ijict.itrc.ac.ir/browse.php?a_code=A-10-27-257&slc_lang=en&sid=1
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/417/article-417-1212542.pdf
کد مقاله (doi)
زبان مقاله منتشر شده en
موضوعات مقاله منتشر شده فناوری اطلاعات
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات