این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 1 دی 1404
پردازش علائم و داده ها
، جلد ۱۳، شماره ۲، صفحات ۱۲۱-۱۳۷
عنوان فارسی
تولید درخت بانک سازهای زبان فارسی به روش تبدیل خودکار
چکیده فارسی مقاله
درخت بانک از مهمترین و پرکاربردترین منابع مورد استفاده در زمینه پردازش زبان طبیعی است. دو نوع از پرکاربردترین درخت بانکها، درخت بانک وابستگی و درخت بانک سازهای است. با توجه به نبود درخت بانک سازهای با حجم بزرگ در زبان فارسی در این مقاله به بررسی روشی ارائه شده در تبدیل درخت بانک وابستگی به سازهای میپردازیم. سپس مشکلات این روش را در زبان فارسی و انگلیسی بررسی و با ارائه راهکارهایی کیفیت تبدیل را بهبود میبخشیم. اولین راهکار، تصحیح مکان اتصال سازهها در درخت سازهای به ازای هر رابطهی وابستگی است. راهکار دوم، انجام مکاشفهای به صورت پسپردازش و بر روی خروجیِ ساختار سازهای این روش است که، کیفیت نهایی درختهای سازهای را بهبود میبخشد. نتایج حاصل از آزمایشها نشان میدهد که، روش تبدیل با کمک راهکارهای ارائه شده حدود 85/25 درصد در زبان فارسی و 39/4 درصد در زبان انگلیسی دارای کیفیت بالاتری نسبت به حالتی است که از راهکارهای پیشنهادی استفاده نشود. در ادامه با کمک روش تبدیل و درخت بانک وابستگی موجود در زبان فارسی، یک درخت بانک سازهای تولید کرده و به کمک آن تجزیهگری سازهای را آموزش دادهایم. کیفیت تجزیهگر آموزش داده شده با استفاده از درخت بانک حاصل از روش تبدیل و راهکارهای پیشنهادی این پژوهش نسبت به حالتی که از راهکارهای پیشنهادی استفاده نشود، بهبودی 21 درصدی را نشان میدهد.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Generating the Persian Constituency Treebank in an Automatic Converting Method
چکیده انگلیسی مقاله
Treebanks is one of important and useful resource in Natural Language Processing tasks. Dependency and phrase structures are two famous kinds of treebanks. There have already made many efforts to convert dependency structure to phrase structure. In this paper we study an approach to convert dependency structure to phrase structure because of lack of a big phrase structure Treebank in Persian. Also we study the algorithm’s errors and propose a solution to solve the problem and improve the quality of conversion process. The experiment results show that we can improve the quality of conversion, about 25.85 percent, in Persian and about 4.39 percent in English. With the help of the conversion algorithm and the dependency Treebank, we produce the phrase structure treebank and train a parser using the resulted treebank. Our parser output is about 21 percent, better than the same parser introduced as baseline.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
محمد حسین دهقان | mohammad hossein dehghan
university of tehran, college of engineering, school of electrical and computer engineering, -109
دانشکده برق و کامپیوتر دانشگاه تهران، ساختمان جدید، -109
سازمان اصلی تایید شده
: دانشگاه تهران (Tehran university)
هشام فیلی | heshaam faili
university of tehran, college of engineering, school of electrical and computer engineering, 309
دانشکده برق و کامپیوتر دانشگاه تهران، ساختمان جدید، 309
سازمان اصلی تایید شده
: دانشگاه تهران (Tehran university)
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-707-1&slc_lang=fa&sid=fa
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233322.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش متن
نوع مقاله منتشر شده
کاربردی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات