این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۴، شماره ۱، صفحات ۱۳۵-۱۵۱

عنوان فارسی مدل میکروسکوپی دوگوشی مبتنی بر فیلتر بانک مدولاسیون برای پیش گویی قابلیت فهم گفتار در افراد دارای شنوایی عادی
چکیده فارسی مقاله در این مطالعه، مدل پیش‌گویی قابلیت فهم دوگوشی میکروسکوپی بر مبنای فیلتربانک مدولاسیون ارائه می‌شود. تاکنون در مدل‌های دوگوشی، از معیارهای طیفی مانند STI و SII و یا دیگر روابط تحلیلی برای تعیین میزان قابلیت فهم دوگوشی استفاده شده است. در مدل پیشنهادی، بر خلاف تمام مدل‌های پیش‌گویی قابلیت فهم دوگوشی، از بازشناساگر خودکار گفتار در قسمت پایانی به­عنوان واحد تصمیم‌گیری استفاده می‌شود. یک مزیت استفاده از این روش، امکان تحلیل میزان بازشناسی قسمت‌های کوچک گفتار مانند واج و سیلاب­ می‌باشد. مزیت دیگر این مدل استفاده از پیش‌پردازش‌هایی است که وجود آنها در سیستم‌ شنوایی انسان به اثبات رسیده است. با استفاده از ماتریس ویژگی پیشنهادی در بازشناساگر گفتار، این مدل دارای پیش‌گویی­‌های خوبی در حضور یک منبع نویز ایستان شبه­گفتار است. مقایسه نتایج مدل با نتایج حاصل از تست‌های شنوایی، مقادیر همبستگی بالا و میانگین قدر مطلق خطای پایین را نشان می‌دهد. همچنین، ماتریس‌های ابهام برای همخوان‌ها همبستگی بالایی را بین پیش­گویی­ها و اندازه‌گیری‌ها نشان می­دهد. آستانه ادراک گفتار پیش­گویی­شده توسط مدل پیشنهادی دارای میانگین قدر مطلق خطای کمتری (0.6 دسیبل) در مقایسه با مدل مبنای BSIM می­باشد. 
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Binaural Microscopic Model Based on Modulation Filterbank for the Prediction of Speech Intelligibility in Normal-Hearing Listeners
چکیده انگلیسی مقاله In this study, a binaural microscopic model for the prediction of speech intelligibility based on the modulation filterbank is introduced. So far, the spectral criteria such as the STI and SII or other analytical methods have been used in the binaural models to determine the binaural intelligibility. In the proposed model, unlike all models of binaural intelligibility prediction, an automatic speech recognizer (ASR) is used in the back-end as the decision unit. One advantage of using this approach is the possibility of analyzing the recognition rate of small parts of speech such as phonemes and syllables. Another advantage of this model lies in the use of pre-processings that their existence in the human auditory system have been verified. Using the proposed feature matrix in the speech recognizer, this model has good predictions in the presence of one source of stationary speech-shaped noise. Comparing the results of the proposed model with those of listening tests show high correlations and low mean absolute error values. Also, the confusion matrices of the consonants represent high correlation between the predictions and the measurements. The predicted speech reception threshold by the proposed model has a smaller mean absolute error (0.6 dB) than the baseline model of BSIM.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله مسعود گراوانچی زاده | masoud geravanchizadeh
29 bahman blvd., faculty of electrical amp;amp; computer eng., university of tabriz, 5166615813, tabriz
تبریز، بلوار 29 بهمن، دانشگاه تبریز، دانشکده مهندسی برق و کامپیوتر
سازمان اصلی تایید شده: دانشگاه تبریز (Tabriz university)

علی فلاح | ali fallah
29 bahman blvd., faculty of electrical amp;amp; computer eng., university of tabriz, 5166615813, tabriz
تبریز، بلوار 29 بهمن، دانشگاه تبریز، دانشکده مهندسی برق و کامپیوتر
سازمان اصلی تایید شده: دانشگاه تبریز (Tabriz university)


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-813-1&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-417054.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش گفتار
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات