این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 1 دی 1404
هوش محاسباتی در مهندسی برق
، جلد ۱۱، شماره ۱، صفحات ۶۳-۸۰
عنوان فارسی
بهسازی گفتار تککاناله با استفاده از ترکیب مدل قطعی نمایی و مدل تصادفی t Location-Scale
چکیده فارسی مقاله
بیشتر روشهای بهسازی گفتار، تخمینگری کاملاً متکی به مدل تصادفی گفتار ارائه میدهند. در این مقاله، یک تخمینگر کمترین میانگین مربعات خطا تحت یک مدل قطعی - تصادفی پیشنهاد میشود که در آن از یک توزیع دنباله - سنگین به نام(tls) t location-scale برای مدلکردن ضرایب تبدیل فوریه گسسته گفتار تمیز و از مدل نمایی و سینوسی بهعنوان مدل قطعی استفاده شده است. در مدل نمایی بهکاررفته، تخمین فرکانس و ضریب میرایی به روش ماتریس پِنسِل انجام میشود. همچنین، در پژوهشهای قبلی تعداد مؤلفههای نمایی در ساخت مدل قطعی برای بهسازی گفتار، یک در نظر گرفته شده است که در این مقاله، مدل نمایی به تعداد دلخواه مؤلفههای نمایی بسط داده میشود. پیادهسازیها در سه حالت ترکیبی نمایی - گاوسی (روش پیشنهادی نخست)، نمایی - tls (روش پیشنهادی دوم) و سینوسی - گاوسی انجام شدهاند و با روش موجود نمایی – گاوسی (تنها با یک مؤلفه نمایی) و تخمینگرهای تصادفی وینر و مبتنی بر tls مقایسه میشوند. نتایج پیادهسازی در حضور شش نویز از مجموعه داده نویز noisex-92 نشان میدهند که دو روش پیشنهادی در قیاس با روشهای مبتنی بر مدل تصادفی صرف، به بهبود معیار نسبت سیگنال به نویز قطعهای منجر شدهاند و در ارزیابی ادراکی کیفیت گفتار عملکرد نسبتاً برابری دارند.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Single-channel Speech Enhancement using the Combination of Exponential Deterministic Model and t Location-scale Stochastic Model
چکیده انگلیسی مقاله
Most speech enhancement algorithms focus on obtaining an estimator relying on stochastic models. In this paper, a minimum mean-square error (MMSE) estimator under a stochastic–deterministic model is proposed where a heavy-tail distribution called t-Location-Scale (tls) is used for modeling Discrete Fourier Transform coefficients of clean speech signals and exponential and sinusoidal models are employed as deterministic models. In the exponential model, the frequency and damping coefficient are estimated by using the Matrix Pencil method. Also, in previous studies, the number of exponential components in the deterministic model for stochastic-deterministic speech enhancement algorithm has been considered to be one. In this paper, the corresponding exponential model is developed to have an arbitrary number of exponential components. The speech enhancement experiments are performed in three modes, exponential-Gaussian (the first proposed method), exponential-tls (the second proposed method), and sinusoidal-Gaussian. Comparisons are made with the exponential-Gaussian method (with only one exponential component), as well as with the Weiner and tls stochastic estimators. The implementation results in the presence of six noise types from Noisex-92 dataset show that the two proposed methods improve the segSNR values and have quite similar PESQ values comparing with the stochastic based speech enhancement methods.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
زهرا امینی |
دانشجوی کارشناسی ارشد، گروه مهندسی برق - دانشگاه بینالمللی امام خمینی (ره) - قزوین - ایران
ندا فرجی |
استادیار، گروه مهندسی برق - دانشگاه بینالمللی امام خمینی (ره) - قزوین - ایران
نشانی اینترنتی
http://isee.ui.ac.ir/article_24220_a33a32a7fc8785f6d75d867e9369c331.pdf
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1306/article-1306-2246368.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات