این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۳، شماره ۲، صفحات ۱۲۱-۱۳۷

عنوان فارسی تولید درخت بانک سازه‌ای زبان فارسی به روش تبدیل خودکار
چکیده فارسی مقاله درخت بانک از مهم­ترین و پرکاربردترین منابع مورد استفاده در زمینه پردازش زبان طبیعی است. دو نوع از پرکاربردترین درخت بانک­‌ها، درخت بانک وابستگی و درخت بانک سازه­‌ای است. با توجه به نبود درخت بانک سازه‌­ای با حجم بزرگ در زبان فارسی در این مقاله به بررسی روشی ارائه شده در تبدیل درخت بانک وابستگی به سازه‌­ای می­‌پردازیم. سپس مشکلات این روش را در زبان فارسی و انگلیسی بررسی و با ارائه راهکارهایی کیفیت تبدیل را بهبود می‌بخشیم. اولین راهکار، تصحیح مکان اتصال سازه‌ها در درخت سازه‌ای به ازای هر رابطه‌ی وابستگی است. راهکار دوم، انجام مکاشفه‌ای به صورت پس‌پردازش و بر روی خروجیِ ساختار سازه‌ای این روش است که، کیفیت نهایی درخت‌های سازه‌ای را بهبود می‌بخشد. نتایج حاصل از آزمایش‌ها نشان می­دهد که، روش تبدیل با کمک راهکارهای ارائه شده حدود 85/25 درصد در زبان فارسی و 39/4 درصد در زبان انگلیسی دارای کیفیت بالاتری نسبت به حالتی است که از راهکارهای پیشنهادی استفاده نشود. در ادامه با کمک روش تبدیل و درخت بانک وابستگی موجود در زبان فارسی، یک درخت بانک سازه‌ای تولید کرده و به کمک آن تجزیه‌گری سازه‌ای را آموزش داده‌ایم. کیفیت تجزیه‌گر آموزش داده شده با استفاده از درخت بانک حاصل از روش تبدیل و راهکارهای پیشنهادی این پژوهش نسبت به حالتی که از راهکارهای پیشنهادی استفاده نشود، بهبودی 21 درصدی را نشان می‌دهد.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Generating the Persian Constituency Treebank in an Automatic Converting Method
چکیده انگلیسی مقاله Treebanks is one of important and useful resource in Natural Language Processing tasks. Dependency and phrase structures are two famous kinds of treebanks. There have already made many efforts to convert dependency structure to phrase structure. In this paper we study an approach to convert dependency structure to phrase structure because of lack of a big phrase structure Treebank in Persian. Also we study the algorithm’s errors and propose a solution to solve the problem and improve the quality of conversion process. The experiment results show that we can improve the quality of conversion, about 25.85 percent, in Persian and about 4.39 percent in English. With the help of the conversion algorithm and the dependency Treebank, we produce the phrase structure treebank and train a parser using the resulted treebank. Our parser output is about 21 percent, better than the same parser introduced as baseline.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله محمد حسین دهقان | mohammad hossein dehghan
university of tehran, college of engineering, school of electrical and computer engineering, -109
دانشکده برق و کامپیوتر دانشگاه تهران، ساختمان جدید، -109
سازمان اصلی تایید شده: دانشگاه تهران (Tehran university)

هشام فیلی | heshaam faili
university of tehran, college of engineering, school of electrical and computer engineering, 309
دانشکده برق و کامپیوتر دانشگاه تهران، ساختمان جدید، 309
سازمان اصلی تایید شده: دانشگاه تهران (Tehran university)


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-707-1&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233322.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده کاربردی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات