این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
هوش محاسباتی در مهندسی برق، جلد ۱۱، شماره ۱، صفحات ۶۳-۸۰

عنوان فارسی بهسازی گفتار تک‌کاناله با استفاده از ترکیب مدل قطعی نمایی و مدل تصادفی t Location-Scale
چکیده فارسی مقاله بیشتر روش‌های بهسازی گفتار، تخمینگری کاملاً متکی به مدل تصادفی گفتار ارائه می‌دهند. در این مقاله، یک تخمینگر کمترین میانگین مربعات خطا تحت یک مدل قطعی - تصادفی پیشنهاد می‌شود که در آن از یک توزیع دنباله - سنگین به نام(tls) t location-scale برای مدل‌کردن ضرایب تبدیل فوریه گسسته گفتار تمیز و از مدل نمایی و سینوسی به‌عنوان مدل قطعی استفاده شده است. در مدل نمایی به‌کاررفته، تخمین فرکانس و ضریب میرایی به روش ماتریس پِنسِل انجام می‌شود. همچنین، در پژوهش‌های قبلی تعداد مؤلفه‌های نمایی در ساخت مدل قطعی برای بهسازی گفتار، یک در نظر گرفته شده است که در این مقاله، مدل نمایی به تعداد دلخواه مؤلفه‌های نمایی بسط داده می‌شود‌. پیاده‌سازی‌ها در سه حالت ترکیبی نمایی - گاوسی (روش پیشنهادی نخست)، نمایی - tls (روش پیشنهادی دوم)‌ و سینوسی - گاوسی انجام شده‌اند و با روش موجود نمایی – گاوسی (تنها با یک مؤلفه نمایی) و تخمینگرهای تصادفی وینر و مبتنی بر tls مقایسه می‌شوند. نتایج پیاده‌سازی در حضور شش نویز از مجموعه داده نویز noisex-92 نشان می‌دهند که دو روش پیشنهادی در قیاس با روش‌های مبتنی بر مدل تصادفی صرف، به بهبود معیار نسبت سیگنال به نویز قطعه‌ای منجر شده‌اند و در ارزیابی ادراکی کیفیت گفتار عملکرد نسبتاً برابری دارند.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Single-channel Speech Enhancement using the Combination of Exponential Deterministic Model and t Location-scale Stochastic Model
چکیده انگلیسی مقاله Most speech enhancement algorithms focus on obtaining an estimator relying on stochastic models. In this paper, a minimum mean-square error (MMSE) estimator under a stochastic–deterministic model is proposed where a heavy-tail distribution called t-Location-Scale (tls) is used for modeling Discrete Fourier Transform coefficients of clean speech signals and exponential and sinusoidal models are employed as deterministic models. In the exponential model, the frequency and damping coefficient are estimated by using the Matrix Pencil method. Also, in previous studies, the number of exponential components in the deterministic model for stochastic-deterministic speech enhancement algorithm has been considered to be one. In this paper, the corresponding exponential model is developed to have an arbitrary number of exponential components. The speech enhancement experiments are performed in three modes, exponential-Gaussian (the first proposed method), exponential-tls (the second proposed method), and sinusoidal-Gaussian. Comparisons are made with the exponential-Gaussian method (with only one exponential component), as well as with the Weiner and tls stochastic estimators. The implementation results in the presence of six noise types from Noisex-92 dataset show that the two proposed methods improve the segSNR values and have quite similar PESQ values comparing with the stochastic based speech enhancement methods.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله زهرا امینی |
دانشجوی کارشناسی ارشد، گروه مهندسی برق - دانشگاه بین‌المللی امام خمینی (ره) - قزوین - ایران

ندا فرجی |
استادیار، گروه مهندسی برق - دانشگاه بین‌المللی امام خمینی (ره) - قزوین - ایران


نشانی اینترنتی http://isee.ui.ac.ir/article_24220_a33a32a7fc8785f6d75d867e9369c331.pdf
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1306/article-1306-2246368.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات