این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
پنجشنبه 27 آذر 1404
پردازش علائم و داده ها
، جلد ۱۴، شماره ۱، صفحات ۱۱۱-۱۳۴
عنوان فارسی
مقایسه روش های طیفی برای شناسایی زبان گفتاری
چکیده فارسی مقاله
شناسایی خودکار زبان گفتاری به تشخیص زبان از روی سیگنال گفتار گفته میشود. شناسایی زبان معمولاً به یکی از دو دسته روش آوایی و طیفی انجام میشود. در این مقاله، انواع روشهای مختلف طیفی برای بازشناسی زبان گفتاری معرفی شده و نتایج بهکارگیری آنها بر روی یک مجموعه دادگان گفتاری تلفنی محاورهای مقایسه شده است. روش طیفی پایه شناسایی زبان، مدل مخلوط گوسی-مدل جهانی (GMM-UBM) است. برای بهبود مدل گوسی هر زبان از روش تمایزی MMI و برای مدلکردن دینامیک زبان از مدل پنهان مارکوف ارگودیک (EHMM) استفاده میشود. روشهای GSV-SVM و روش نشانهگذار مبتنی بر GMM (GMM Tokenizer) نیز دو روش طیفی دیگر است که مورد بررسی قرار گرفته است. در این مقاله همچنین روشهای جدیدِ مدلسازی تنوعات کانال و گوینده (تحلیل توأم عاملها (JFA) و بردار شناسایی (i-Vector)) بکار رفته و برای بهبود نتایج آن از چند روش جبرانسازی تنوعات استفاده گردیده است. علاوه بر این برای سهولت تصمیمگیری و کاهش خطای سیستم شناسایی زبان، از پسپردازش امتیاز استفاده شده است. این مقاله بخشی از هفت سال تحقیقات ارزشمند در زمینه شناسایی زبان گفتاری در پژوهشگاه توسعه فناوریهای پیشرفته خواجه نصیرالدین طوسی است و تنها خلاصهای از روشها و نتایج بدست آمده در این مقاله آورده شده است.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
A survey on spectral methods in spoken language identification
چکیده انگلیسی مقاله
Automatic spoken language identification is the identification of language from the speech signal. Language identification methods are usually divided into phonetic and spectral approaches. In this paper, different spectral methods are introduced and the results are compared on a telephone speech dataset. The basic language identification method is Gaussian Mixture Model-Universal Background Model (GMM-UBM). In this paper, the MMI discrimination method is used to improve the Gaussian model of each language. Moreover, in order to model the language dynamically, GMM is replaced with the ergodic hidden Markov model (EHMM). Furthermore GSV-SVM and GMM tokenizer methods are implemented as two popular spectral approaches. In this paper, novel speaker and channel variation modeling methods are used as language identification approaches, including joint factor analysis (JFA) and identity vector (i-Vector) and several variations compensation methods are exploited to improve the results of i-Vector. In order to boost the performance of language recognition systems, different post-processing methods are applied. This paper is a part of seven years of valuable research in spoken language identification conducted in research center for development of advanced technologies and only a summary of the methods and results are presented in this paper.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
جهانشاه کبودیان | jahanshah kabudian
razi university,kermanshah
دانشگاه رازی کرمانشاه
سازمان اصلی تایید شده
: دانشگاه رازی (Razi university)
شقایق رضا | shaghayegh reza
amirkabir university
دانشگاه امیبرکبیر
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-798-1&slc_lang=fa&sid=fa
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-417053.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش گفتار
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات