سامانه اطلاعات پژوهشی ایران

این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند

دوشنبه 4 اسفند 1404


پژوهش های زبان شناسی تطبیقی، جلد ۶، شماره ۱۲، صفحات ۶۷-۸۲


عنوان فارسی	طراحی و ضبط پایگاه‌دادگان گفتاری برای سیستم‌های تبدیل متن به گفتار فارسی

چکیده فارسی مقاله	مقاله حاضر به ارائه روشی برای طراحی و ساختِ پایگاه‌دادگانی مختص سیستم‌های تبدیل متن به گفتار با در نظر گرفتن ساخت نوایی فارسی می‌پردازد. این مجموعه به لحاظ آوایی و نوایی غنی و مشتمل بر 2826 نمونه جمله فارسی است. این نمونه جملات در شرایط استودیو و با تک‌صدای گوینده خانم که به صورت حرفه‌ای در زمینه صدا فعالیت می‌کند ضبط شده است. پوشش حالت‌های مختلف نوایی در کنار پوشش حالت‌های مختلف آوایی از نقاط قوت این پایگاه است که برای نخستین بار در سیستم‌های تبدیل متن به گفتارِ فارسی لحاظ می‌شود. این مجموعه در کنار فایل‌های صوتی، دارای برچسب‌های متن و صورت آوایی است که به صورت دستی اصلاح شده‌‌اند. در نهایت، با بکارگیری مجموعه دادگان مذکور و با استفاده از روش بازسازی گفتار آماری ـ پارامتری ساخت صدا انجام گرفت. آزمودنی‌ها کیفیت صدای ساخته‌شده را با استفاده از معیار میانگینِ امتیازاتِ نظردهی (MOS) 4.3 ارزیابی کردند.

کلیدواژه‌های فارسی مقاله

عنوان انگلیسی	Designing and Recording a Speech Database for Persian TTS Systems

چکیده انگلیسی مقاله	This paper presents a method for designing and building a speech database for Persian TTS systems taking account of Persian prosodic structure. This collection, containing 2826 phonetically and prosodically rich utterances, was recorded under studio conditions with a female voice talent speaker. In addition to common practice of covering phonetic units, the coverage of prosodic units has been considered in preparation of this collection as a novel procedure in building Persian databases. The current database consists of sound files and their corresponding manually-corrected orthographic and phonetic transcriptions. Finally, we used the prepared database to do speech synthesis using a statistical-parametric method. The subjects evaluated the generated voices 4.3 in terms of MOS criterion.

کلیدواژه‌های انگلیسی مقاله	Speech database, text-to-speech, speech prosody, text corpus

نویسندگان مقاله	مرتضی طاهری اردلی \| دانشجو پژوهشگاه علوم انسانی و مطالعات فرهنگی سازمان اصلی تایید شده: پژوهشگاه علوم انسانی و مطالعات فرهنگی سهیل خرم \| پژوهشگر دانشگاه صنعتی شریف سازمان اصلی تایید شده: دانشگاه صنعتی شریف (Sharif university of technology) مصطفی عاصی \| استاد پژوهشگاه علوم انسانی و مطالعات فرهنگی سازمان اصلی تایید شده: پژوهشگاه علوم انسانی و مطالعات فرهنگی حسین صامتی \| استاد دانشگاه صنعتی سریف محمود بی جن خان \| استاد دانشگاه تهران سازمان اصلی تایید شده: دانشگاه تهران (Tehran university)

نشانی اینترنتی
فایل مقاله	فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده	fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده

برگشت به: صفحه اول پایگاه \| نسخه مرتبط \| نشریه مرتبط \| فهرست نشریات

ارسال پیام برخط

در صورت مشاهده هر نوع اشکال در داده های پایگاه و یا برای ارسال نظرات و پیشنهاد های خود می توانید با پر کردن فرم تماس ما را در جریان قرار دهید.
برای پر کردن فرم تماس اینجا را کلیک کنید.

آمار پایگاه

نمایه شده در ISI 135

نمایه شده در PubMed 109

نمایه شده در Scopus 192

کاربران برخط 916

بازدید امروز 19359

بازدید کل 41203064

اطلاعات تماس

آدرس : تهران، سعادت آباد، بلوار پاکنژاد شمالی، بالاتر از میدان سرو، نبش کوچه ندا، پلاک ۶۸، ساختمان جاوید، واحد ۱۶

پست الکترونیک: yektaweb-AT-gmail.com

توجه

کلیه حقوق این وب سایت و مطالب آن متعلق به شرکت یکتاوب بوده و استفاده از مطالب آن با ذکر منبع بلامانع است
طراحی و برنامه نویسی: یکتاوب افزار شرق