این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۳، شماره ۴، صفحات ۹۳-۱۰۸

عنوان فارسی ارائه یک روش جدید بازیابی اطلاعات مناسب برای متون حاصل از بازشناسی گفتار
چکیده فارسی مقاله در این مقاله، یک پیش پردازش روی روش‎های بازیابی اطلاعات، ارائه می شود که برای بازیابی اطلاعات حاصل از متون بازشناسی شده ی گفتاری، مناسب است. این پیش پردازش، به شکل ترکیبی از اصلاح و گسترش پرس‏ و جو می ‏باشد. ورودی‏ های مسئله، اسناد متنی بدست آمده از بازشناسی گفتار و پرس‏ و جو می باشد و هدف، یافتن اسناد مرتبط با کلمه پرس ‏و جو است. مشکل آن است که متن حاصل از بازشناسی گفتار، همواره دارای درصد خطایی در بازشناسی است که ممکن است منجر به این شود که کلماتی که در واقع مرتبط هستند و به‏ علت وقوع خطای بازشناسی دگرگون شده‏ اند مرتبط تشخیص داده نشوند. ایده ی روش ارائه شده، تشخیص خطای بازشناسی در کلمات و در نظر گرفتن کلمات مشابه برای آن دسته از کلماتی است که به عنوان خطا تشخیص داده‌شده اند. برای تشخیص کلمه ی خطا، پارامتری به عنوان احتمال خطا در کلمه تعریف می‏ شود که بزرگ بودن آن بیانگر امکان بیشتر وقوع خطا در کلمه است. همچنین برای تشخیص کلمات مشابه، ابتدا با استفاده از معیار فاصله لونشتاین، کلمات مشابه اولیه را پیدا می کنیم. سپس احتمال تبدیل این کلمات مشابه به کلمه پرس ‏و جوی اصلی، محاسبه می شود. کلمات مشابه معنایی، از بین کلماتی که احتمال تبدیل بیشتری دارند، بر اساس یک سطح آستانه انتخاب می‌شوند. اکنون در الگوریتم بازیابی، علاوه‏ بر کلمه اصلی، کلمات مشابه آن نیز در جستجو، مرتبط در نظر گرفته می‏ شوند. نتایج پیاده‏سازی‏ها نشان می‏دهد که الگوریتم ارائه‌شده، معیار F را به میزان حداکثر 30‎% بهبود می‌بخشد.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Introducing a new information retrieval method applicable for speech recognized texts
چکیده انگلیسی مقاله In this article a pre-processing method is introduced which is applicable in speech recognized texts retrieval task. We have a text corpus that generated from a speech recognition system and a query as inputs, want to search queries in these documents and find relevant documents. The main problem is that the typical speech recognized texts suffer from some percentage of recognition error. This problem causes terms to have erroneously assign to irrelevant documents. The idea of our proposed method, is to detect error-prone terms and to find similar words for each term. A parameter is defined which calculate the probability for occurring error in the error-prone words. To recognize similar words for each specific term, based on a criterian which is called average detection rate (ADR) and levenshtein distance criterion, some candidates are chosen as the initial similar words set. Then, a conversion probability is defined based on the conversion rate (CR) and the noisy channel model (NCM) and the words with higher probability based on a threshold level are selected as the final similar words. In the retrieval process, these words are considered in the search step in addition to the base word. Implementation result shows a significant improvement up to 30% in F-measure in information retrieval method with consideration this pre-processing.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله روح الله دیانت | rouhollah dianat
qom, qom univ, it group 09127473049
قم،دانشگاه قم، گروه فناوری اطلاعات 09127473049
سازمان اصلی تایید شده: دانشگاه قم (Qom university)

مرتضی علی احمدی | morteza ali ahmadi
qom, qom univ, it group
قم،دانشگاه قم، گروه فناوری اطلاعات
سازمان اصلی تایید شده: دانشگاه قم (Qom university)

یحیی اخلاقی | yahya akhlaghi
kabol, khatamolnabiyin univ, computer sience group
کابل، دانشگاه خاتم النبیین، گروه علوم کامپیوتر

باقر باباعلی | bagher babaali
tehran, tehran univ,statistics and computer sience group
تهران، دانشگاه تهران، گروه آمار و علوم کامپیوتر
سازمان اصلی تایید شده: دانشگاه تهران (Tehran university)


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-733-2&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-402470.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده کاربردی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات