این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
پنجشنبه 27 آذر 1404
پردازش علائم و داده ها
، جلد ۱۷، شماره ۳، صفحات ۳۷-۵۴
عنوان فارسی
بازشناسی خودکار واجهای فارسی با استفاده از مدلسازی واجگونهها
چکیده فارسی مقاله
یکی از مراحل زیربنایی در بازشناسی خودکار گفتار، بازشناسی واجها و از موانع جدی برای بازشناسی واجها، همتولیدی است. یک روش برای جبران تأثیر همتولیدی، استفاده از مدلهای وابسته به بافت در بازشناسی واجهاست. در این پژوهش، از یک روش زبانشناختی برای مدلسازی واجگونهها استفاده شده است. بدینمنظور ابتدا قواعد وقوع واجگونهها در زبان فارسی استخراج و مشخص شده است که هر واج چه واجگونههایی دارد. برای مدلسازی و شناسایی واجگونهها، یک پیکره واجگونهای لازم است که بهمنظور تولید آن، از پیکره فارسدات کوچک استفاده و برچسبگذاری واجگونهای آن انجام و از این پیکره، برای مدلسازی و سپس شناسایی واجگونههای مختلف گفتار ورودی استفاده شده است. درنهایت، با قرارگرفتن هر یک از واجگونههای شناساییشده در دسته واجی مربوط به خود، بازشناسی واجها از مسیر واجگونهها انجام شده است. با این روش، دقت بازشناسی واجها در زبان فارسی در مقایسه با بهترین نتایج گزارششده تاکنون، بهبود قابلملاحظهای نشان داده است.
کلیدواژههای فارسی مقاله
بازشناسی خودکار گفتار، بازشناسی خودکار واج، مدلهای وابسته به بافت، واج، واجگونه، همتولیدی
عنوان انگلیسی
Allophone-based acoustic modeling for Persian phoneme recognition
چکیده انگلیسی مقاله
Phoneme recognition is one of the fundamental phases of automatic speech recognition. Coarticulation which refers to the integration of sounds, is one of the important obstacles in phoneme recognition. In other words, each phone is influenced and changed by the characteristics of its neighbor phones, and coarticulation is responsible for most of these changes. The idea of modeling the effects of speech context, and using the context-dependent models in phoneme recognition is a method which used to compensate the negative effects of coarticulation. According to this method, if two similar phonemes in speech have different contexts, each of them constitute a separate model. In this research, a linguistic method called allophonic modeling has been used to model context effects in Persian phoneme recognition. For this purpose, in the first phase, the rules required for occurrence of various allophones of each phoneme, are extracted from Persian linguistic resources. So each phoneme is considered as a class, consisting of its various context-dependent forms named allophones. The necessary prerequisites for modeling and identifying allophones, is an allophonic corpus. Since there was no such corpus in Persian language, SMALL FARSDAT corpus has been used. This corpus is segmented and labelled manually for each sentence, word and phoneme. So the phonological and lingual context required for the realization of allophones, is implemented in this corpus. For example, the syllabification has been performed on the corpus and then, for each phoneme, its position (first, middle and end) in the word and syllable is specified using different numeric tags. In the next step, allophonic labeling has been performed by searching for each of the allophonic contexts in the corpus. These allophonic corpus is used to model and recognize the allophones of input speech. Finally, each allophone is assigned to a proper phonemic class so phoneme recognition has been done using allophones. The experimental results show a high accuracy of the proposed method in phenome recognition, indicating a significant improvement comparing with other state-of-the-art methods.
کلیدواژههای انگلیسی مقاله
automatic speech recognition, automatic phoneme recognition, context-dependent models, phoneme, allophone, coarticulation
نویسندگان مقاله
طاهره احمدی | Tahere Ahmadi
Isfahan university
دانشکده زبانهای خارجی، دانشگاه اصفهان
حسین کارشناس | Hossein Karshenas
Isfahan university
دانشکده کامپیوتر، دانشگاه اصفهان
باقر باباعلی | Bagher Babaali
Tehran university
دانشکده ریاضی، آمار و علوم کامپیوتر، دانشگاه تهران
بتول علینژاد | Batool Alinejad
Isfahan university
دانشکده زبانهای خارجی، دانشگاه اصفهان
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1631-1&slc_lang=fa&sid=1
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش گفتار
نوع مقاله منتشر شده
کاربردی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات