این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 4 اسفند 1404
پژوهش های زبان شناسی تطبیقی
، جلد ۶، شماره ۱۲، صفحات ۶۷-۸۲
عنوان فارسی
طراحی و ضبط پایگاهدادگان گفتاری برای سیستمهای تبدیل متن به گفتار فارسی
چکیده فارسی مقاله
مقاله حاضر به ارائه روشی برای طراحی و ساختِ پایگاهدادگانی مختص سیستمهای تبدیل متن به گفتار با در نظر گرفتن ساخت نوایی فارسی میپردازد. این مجموعه به لحاظ آوایی و نوایی غنی و مشتمل بر 2826 نمونه جمله فارسی است. این نمونه جملات در شرایط استودیو و با تکصدای گوینده خانم که به صورت حرفهای در زمینه صدا فعالیت میکند ضبط شده است. پوشش حالتهای مختلف نوایی در کنار پوشش حالتهای مختلف آوایی از نقاط قوت این پایگاه است که برای نخستین بار در سیستمهای تبدیل متن به گفتارِ فارسی لحاظ میشود. این مجموعه در کنار فایلهای صوتی، دارای برچسبهای متن و صورت آوایی است که به صورت دستی اصلاح شدهاند. در نهایت، با بکارگیری مجموعه دادگان مذکور و با استفاده از روش بازسازی گفتار آماری ـ پارامتری ساخت صدا انجام گرفت. آزمودنیها کیفیت صدای ساختهشده را با استفاده از معیار میانگینِ امتیازاتِ نظردهی (MOS) 4.3 ارزیابی کردند.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Designing and Recording a Speech Database for Persian TTS Systems
چکیده انگلیسی مقاله
This paper presents a method for designing and building a speech database for Persian TTS systems taking account of Persian prosodic structure. This collection, containing 2826 phonetically and prosodically rich utterances, was recorded under studio conditions with a female voice talent speaker. In addition to common practice of covering phonetic units, the coverage of prosodic units has been considered in preparation of this collection as a novel procedure in building Persian databases. The current database consists of sound files and their corresponding manually-corrected orthographic and phonetic transcriptions. Finally, we used the prepared database to do speech synthesis using a statistical-parametric method. The subjects evaluated the generated voices 4.3 in terms of MOS criterion.
کلیدواژههای انگلیسی مقاله
Speech database, text-to-speech, speech prosody, text corpus
نویسندگان مقاله
مرتضی طاهری اردلی |
دانشجو پژوهشگاه علوم انسانی و مطالعات فرهنگی
سازمان اصلی تایید شده
: پژوهشگاه علوم انسانی و مطالعات فرهنگی
سهیل خرم |
پژوهشگر دانشگاه صنعتی شریف
سازمان اصلی تایید شده
: دانشگاه صنعتی شریف (Sharif university of technology)
مصطفی عاصی |
استاد پژوهشگاه علوم انسانی و مطالعات فرهنگی
سازمان اصلی تایید شده
: پژوهشگاه علوم انسانی و مطالعات فرهنگی
حسین صامتی |
استاد دانشگاه صنعتی سریف
محمود بی جن خان |
استاد دانشگاه تهران
سازمان اصلی تایید شده
: دانشگاه تهران (Tehran university)
نشانی اینترنتی
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات