این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۶، شماره ۱، صفحات ۳-۲۰

عنوان فارسی بهبود هزینه محاسباتی در سامانه‌های استخراج آزاد اطلاعات با استفاده از مدل لاگ لینیر
چکیده فارسی مقاله استخراج اطلاعات شامل توسعه الگوریتم‌­هایی است که به‌صورت خودکار متن غیرساخت‌­یافته را پردازش و پایگاه داده‌­ای از موجودیت­‌ها، روابط و وقایع را تولید می­‌کنند. یکی از مشکلات اساسی استخراج اطلاعات، هزینه بالای محاسباتی این روش‌­ها است. این موضوع در دامنه‌هایی با مقیاس بزرگ نظیر وب اهمیت زیادی دارد. در سال­‌های اخیر رو‌ش‌­های استخراج آزاد اطلاعات زیادی پیشنهاد شده است. این روش‌­ها محدوده وسیعی را از ابزارهای پردازش زبان طبیعی را اعم از سطحی (نظیر برچسب‌­زن اجزای کلام) تا عمیق (نظیر برچسب‌زن نقش معنایی) در برمی‌­گیرند. در این مقاله روشی بهینه­ برای استخراج آزاد اطلاعات نشان داده شده که بر پایه ترکیب مزایای استخراج‌­گرهای سطحی و عمیق و اجتناب از معایب آنها بنا شده است. استخراج‌گر که هسته اصلی روش پیشنهادی است، با استفاده از پارامترهای مؤثر، زیرمجموعه‌­ای را با کارایی بالا با استفاده از یک روش بهینه به کمک مدل لاگ لینیر به‌وجود می­‌آورد که قابل اجرا در مقیاس وب است. این روش با بررسی جمله ورودی و انتساب آن به مناسب­‌ترین استخراج­‌گر باعث استفاده بهینه از زمان و در‌نتیجه، کاهش هزینه محاسباتی شده و علاوه‌بر‌این به‌دقت قابل قبولی نیز دست می­‌یابد. 
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی A New Method for Improving Computational Cost of Open Information Extraction Systems Using Log-Linear Model
چکیده انگلیسی مقاله Information extraction (IE) is a process of automatically providing a structured representation from an unstructured or semi-structured text. It is a long-standing challenge in natural language processing (NLP) which has been intensified by the increased volume of information and heterogeneity, and non-structured form of it. One of the core information extraction tasks is relation extraction which aims at extracting semantic relations among entities from natural language text. Traditional relation extraction techniques were relation-specific, producing new instances of relations determined a priori. While effective, this model is not applicable in cases where the relations are not defined a priori or when the number of relations is high. Open Relation Extraction (ORE) methods were developed to elicit instances of arbitrary relations while requiring fewer training examples. Since ORE systems are employed by the applications depended on large-scale relation extraction, high performance and low computational cost are major requirements for ORE methods. This is particularly important in the large scales such as the Web. Many OIE systems have been proposed in recent years. These approaches range from shallow (such as part-of-speech tagging) to deep (such as semantic role labeling), therefore they differ in their performance level and computational cost. In this paper, we use the state-of-the-art shallow NLP tools to extract instances of relations. A supervised log-linear model for OIE is presented which is based on using advantages of shallow NLP tools, as they are fast and lead to a low computational time. Extractor which is the main core of proposed approach integrates a high performance subset of the shallow NLP tools with the strength of the deep NLP tools by using a supervised log linear model and produces a high performance method that is scalable. This causes efficient use of time and therefore reduces computational cost and increases precision. Proposed approach achieves higher precision and recall than ReVerb, one of the most successful shallow OIE system.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله وحیده رشادت | Vahideh Reshadat
Miyaneh Technical and Engineering Faculty, University of Tabriz
دانشکده فنی مهندسی میانه، دانشگاه تبریز

مریم حورعلی | Maryam HoorAli
Malek-Ashtar University of Technology
دانشگاه صنعتی مالک اشتر

هشام فیلی | Heshaam Faili
College of Engineering, University of Tehran
پردیس دانشکده‌های فنی دانشگاه تهران


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1342-1&slc_lang=fa&sid=1
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-1593805.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات