این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 1 دی 1404
پردازش علائم و داده ها
، جلد ۱۲، شماره ۳، صفحات ۹۹-۱۰۸
عنوان فارسی
تصحیح خودکار خطا در درخت بانک نحوی با استفاده از یادگیری ماشینی انتقال محور
چکیده فارسی مقاله
درخت بانک یکی از پرکاربردترین منابع در به کارگیری روش های یادگیری باسرپرستی و نیمه سرپرستی در سامانه های پردازش زبان های طبیعی مانند ابزارهای شناسایی گفتار، تحلیلگرهای نحوی و نرم افزارهای مترجم ماشینی است. روش های مختلفی جهت تولید درخت بانک وجود دارد که می توان آن ها را به دو طبقه ی اصلی، روش های تولید دستی و روش های تولید خودکار تقسیم کرد. در هر یک از این روش ها، درخت بانک حاصل دارای خطاهایی هستند که البته میزان این خطاها در روش تولید خودکار به مراتب بیشتر است. وجود خطا در درخت بانک باعث میشود که نتوان از آن به عنوان یک منبع مناسب استفاده کرد. در این مقاله یک روش کاملا خودکار ارائه شده است که در آن سعی شده یک درخت بانک که با دستور درخت-پیوندی لغوی برچسب گذاری شده است، اصلاح گردد. روش ارائه شده نوعی روش تشخیص و تصحیح خطا براساس یادگیری انتقال محور است و بر روی یک درخت بانک که پیشتر به روش خودکار تولید شده بود اجرا شد و سبب بهبود آن بانک از 68% به 79% طبق معیار F1 شد.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
A machine learning approach for correcting the errors of a Treebank
چکیده انگلیسی مقاله
The Treebank is one of the most useful resources for supervised or semi-supervised learning in many NLP tasks such as speech recognition, spoken language systems, parsing and machine translation. Treebank can be developded in different ways that could be, generally, categorized in manually and statistical approaches. While the resulted Treebank in each of these methods has the annotation error, one which accomplished by statistical method has much more errors than the other. Error in Treenabanks causes that they are not useful anymore. In this paper an statistical method is proposed which aims to correct the errors in a specific English LTAG-Treebank. The proposed method was applied to a automatically generated Treebank and an improvement from 68% to 79% respect to F-measure is retrieved.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
فرزانه زارعی | farzaneh zarei
دانشگاه تهران
سازمان اصلی تایید شده
: دانشگاه تهران (Tehran university)
هشام فیلی | hesham faili
دانشگاه تهران
سازمان اصلی تایید شده
: دانشگاه تهران (Tehran university)
مریم میریان | maryam mirian
دانشگاه تهران
سازمان اصلی تایید شده
: دانشگاه تهران (Tehran university)
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-484-2&slc_lang=fa&sid=fa
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233350.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش گفتار
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات