این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
پنجشنبه 27 آذر 1404
پردازش علائم و داده ها
، جلد ۱۴، شماره ۱، صفحات ۱۳۵-۱۵۱
عنوان فارسی
مدل میکروسکوپی دوگوشی مبتنی بر فیلتر بانک مدولاسیون برای پیش گویی قابلیت فهم گفتار در افراد دارای شنوایی عادی
چکیده فارسی مقاله
در این مطالعه، مدل پیشگویی قابلیت فهم دوگوشی میکروسکوپی بر مبنای فیلتربانک مدولاسیون ارائه میشود. تاکنون در مدلهای دوگوشی، از معیارهای طیفی مانند STI و SII و یا دیگر روابط تحلیلی برای تعیین میزان قابلیت فهم دوگوشی استفاده شده است. در مدل پیشنهادی، بر خلاف تمام مدلهای پیشگویی قابلیت فهم دوگوشی، از بازشناساگر خودکار گفتار در قسمت پایانی بهعنوان واحد تصمیمگیری استفاده میشود. یک مزیت استفاده از این روش، امکان تحلیل میزان بازشناسی قسمتهای کوچک گفتار مانند واج و سیلاب میباشد. مزیت دیگر این مدل استفاده از پیشپردازشهایی است که وجود آنها در سیستم شنوایی انسان به اثبات رسیده است. با استفاده از ماتریس ویژگی پیشنهادی در بازشناساگر گفتار، این مدل دارای پیشگوییهای خوبی در حضور یک منبع نویز ایستان شبهگفتار است. مقایسه نتایج مدل با نتایج حاصل از تستهای شنوایی، مقادیر همبستگی بالا و میانگین قدر مطلق خطای پایین را نشان میدهد. همچنین، ماتریسهای ابهام برای همخوانها همبستگی بالایی را بین پیشگوییها و اندازهگیریها نشان میدهد. آستانه ادراک گفتار پیشگوییشده توسط مدل پیشنهادی دارای میانگین قدر مطلق خطای کمتری (0.6 دسیبل) در مقایسه با مدل مبنای BSIM میباشد.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Binaural Microscopic Model Based on Modulation Filterbank for the Prediction of Speech Intelligibility in Normal-Hearing Listeners
چکیده انگلیسی مقاله
In this study, a binaural microscopic model for the prediction of speech intelligibility based on the modulation filterbank is introduced. So far, the spectral criteria such as the STI and SII or other analytical methods have been used in the binaural models to determine the binaural intelligibility. In the proposed model, unlike all models of binaural intelligibility prediction, an automatic speech recognizer (ASR) is used in the back-end as the decision unit. One advantage of using this approach is the possibility of analyzing the recognition rate of small parts of speech such as phonemes and syllables. Another advantage of this model lies in the use of pre-processings that their existence in the human auditory system have been verified. Using the proposed feature matrix in the speech recognizer, this model has good predictions in the presence of one source of stationary speech-shaped noise. Comparing the results of the proposed model with those of listening tests show high correlations and low mean absolute error values. Also, the confusion matrices of the consonants represent high correlation between the predictions and the measurements. The predicted speech reception threshold by the proposed model has a smaller mean absolute error (0.6 dB) than the baseline model of BSIM.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
مسعود گراوانچی زاده | masoud geravanchizadeh
29 bahman blvd., faculty of electrical amp;amp; computer eng., university of tabriz, 5166615813, tabriz
تبریز، بلوار 29 بهمن، دانشگاه تبریز، دانشکده مهندسی برق و کامپیوتر
سازمان اصلی تایید شده
: دانشگاه تبریز (Tabriz university)
علی فلاح | ali fallah
29 bahman blvd., faculty of electrical amp;amp; computer eng., university of tabriz, 5166615813, tabriz
تبریز، بلوار 29 بهمن، دانشگاه تبریز، دانشکده مهندسی برق و کامپیوتر
سازمان اصلی تایید شده
: دانشگاه تبریز (Tabriz university)
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-813-1&slc_lang=fa&sid=fa
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-417054.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش گفتار
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات