این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
جمعه 21 آذر 1404
Journal of Artificial Intelligence and Data Mining
، جلد ۱۰، شماره ۳، صفحات ۳۷۳-۳۸۳
عنوان فارسی
چکیده فارسی مقاله
کلیدواژههای فارسی مقاله
عنوان انگلیسی
A Transformer-based Approach for Persian Text Chunking
چکیده انگلیسی مقاله
Over the last few years, text chunking has taken a significant part in sequence labeling tasks. Although a large variety of methods have been proposed for shallow parsing in English, most proposed approaches for text chunking in Persian language are based on simple and traditional concepts. In this paper, we propose using the state-of-the-art transformer-based contextualized models, namely BERT and XLM-RoBERTa, as the major structure of our models. Conditional Random Field (CRF), the combination of Bidirectional Long Short-Term Memory (BiLSTM) and CRF, and a simple dense layer are employed after the transformer-based models to enhance the model's performance in predicting chunk labels. Moreover, we provide a new dataset for noun phrase chunking in Persian which includes annotated data of Persian news text. Our experiments reveal that XLM-RoBERTa achieves the best performance between all the architectures tried on the proposed dataset. The results also show that using a single CRF layer would yield better results than a dense layer and even the combination of BiLSTM and CRF.
کلیدواژههای انگلیسی مقاله
Persian text chunking, sequence labeling, deep learning, contextualized word representation
نویسندگان مقاله
P. Kavehzadeh |
Computer Engineering Department, Amirkabir University of Technology, Tehran, Iran.
M. M. Abdollah Pour |
Computer Engineering Department, Amirkabir University of Technology, Tehran, Iran.
S. Momtazi |
Computer Engineering Department, Amirkabir University of Technology, Tehran, Iran.
نشانی اینترنتی
https://jad.shahroodut.ac.ir/article_2455_bb18bb2f7d37ea3cb28427dd014d7074.pdf
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
en
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات