این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۴، شماره ۱، صفحات ۱۱۱-۱۳۴

عنوان فارسی مقایسه روش های طیفی برای شناسایی زبان گفتاری
چکیده فارسی مقاله شناسایی خودکار زبان گفتاری به تشخیص زبان از روی سیگنال گفتار گفته می­شود. شناسایی زبان معمولاً به یکی از دو دسته روش آوایی و طیفی انجام می­شود. در این مقاله، انواع روش­های مختلف طیفی برای بازشناسی زبان گفتاری معرفی شده و نتایج به­کارگیری آنها بر روی یک مجموعه دادگان گفتاری تلفنی محاوره­ای مقایسه شده است. روش طیفی پایه شناسایی زبان، مدل مخلوط گوسی-مدل جهانی (GMM-UBM) است. برای بهبود مدل گوسی هر زبان از روش تمایزی MMI و برای مدل­کردن دینامیک زبان از مدل پنهان مارکوف ارگودیک (EHMM) استفاده می­شود. روش­های GSV-SVM و روش نشانه­گذار مبتنی بر GMM (GMM Tokenizer) نیز دو روش طیفی دیگر است که مورد بررسی قرار گرفته است. در این مقاله همچنین روش­های جدیدِ مدل­سازی تنوعات کانال و گوینده (تحلیل توأم عامل­ها (JFA) و بردار شناسایی (i-Vector)) بکار رفته و برای بهبود نتایج آن از چند روش­ جبران­سازی تنوعات استفاده گردیده است. علاوه بر این برای سهولت تصمیم­گیری و کاهش خطای سیستم شناسایی زبان، از پس­پردازش امتیاز استفاده شده است. این مقاله بخشی از هفت سال تحقیقات ارزشمند در زمینه شناسایی زبان گفتاری در پژوهشگاه توسعه فناوری­های پیشرفته خواجه نصیرالدین طوسی است و تنها خلاصه­ای از روش­ها و نتایج بدست آمده در این مقاله آورده شده است.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی A survey on spectral methods in spoken language identification
چکیده انگلیسی مقاله Automatic spoken language identification is the identification of language from the speech signal. Language identification methods are usually divided into phonetic and spectral approaches. In this paper, different spectral methods are introduced and the results are compared on a telephone speech dataset. The basic language identification method is Gaussian Mixture Model-Universal Background Model (GMM-UBM). In this paper, the MMI discrimination method is used to improve the Gaussian model of each language. Moreover, in order to model the language dynamically, GMM is replaced with the ergodic hidden Markov model (EHMM). Furthermore GSV-SVM and GMM tokenizer methods are implemented as two popular spectral approaches. In this paper, novel speaker and channel variation modeling methods are used as language identification approaches, including joint factor analysis (JFA) and identity vector (i-Vector) and several variations compensation methods are exploited to improve the results of i-Vector. In order to boost the performance of language recognition systems, different post-processing methods are applied. This paper is a part of seven years of valuable research in spoken language identification conducted in research center for development of advanced technologies and only a summary of the methods and results are presented in this paper.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله جهانشاه کبودیان | jahanshah kabudian
razi university,kermanshah
دانشگاه رازی کرمانشاه
سازمان اصلی تایید شده: دانشگاه رازی (Razi university)

شقایق رضا | shaghayegh reza
amirkabir university
دانشگاه امیبرکبیر


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-798-1&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-417053.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش گفتار
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات