این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
چهارشنبه 3 دی 1404
ماشین بینایی و پردازش تصویر
، جلد ۹، شماره ۴، صفحات ۵۷-۷۸
عنوان فارسی
مروری بر پژوهشهای لبخوانی خودکار:دادگان و روشها
چکیده فارسی مقاله
لبخوانی یا فرآیند بازشناسی دیداری گفتار روش تشخیص گفتار از روی حرکات لب گوینده است. در سالهای اخیر علاقه به لبخوانی خودکار رو به افزایش بوده و تحقیقات بسیاری در این زمینه انجام شده است و همچنان به عنوان یک موضوع تحقیقی پیشرو مطرح است. در این مقاله مروری بر تحقیقات انجام شده در زمینه لبخوانی خودکار ارائه شده است. فهرستی از پایگاه دادههای مورد استفاده با در نظر گرفتن خصوصیاتی نظیر تعداد گوینده، محتوای گفتار و کیفیت تصاویر ارائه شده است. در این مقاله، تحقیقات متنوع لبخوانی در زمینه تشخیص اعداد، حروف، کلمات و جملات و روشهای سنتی استخراج ویژگی و دستهبندی تا روشهای جدید مبتنی بر یادگیری عمیق مرور شدهاند. بعلاوه فعالیتهای لبخوانی زبان فارسی شامل پایگاه دادههای فراهم شده و تحقیقات مرتبط با جامعیت بیشتر معرفی شده است.
کلیدواژههای فارسی مقاله
لبخوانی، بازشناسی دیداری گفتار، استخراج ویژگی، یادگیری ماشینی، یادگیری عمیق، شناسایی الگو،
عنوان انگلیسی
A review of researches on automatic lipreading: databases and methods
چکیده انگلیسی مقاله
Lip-reading or the process of visual recognition of speech is a way to distinguish speech from the movements of the speaker's lips. In recent years, the interest in automatic lip-reading has been increasing and a lot of researches have been done in this field and it is still a leading research topic. This paper provides an overview of researches in automatic lip-reading. A list of used databases in the researches is provided with specifications such as number of speakers, speech content and image quality. In this article, various lip-reading researches are reviewed from recognizing numbers, letters, words and sentences, and traditional methods of feature extraction and classification to the new methods based on deep learning. In addition, Persian lip-reading activities include provided databases and related researches are introduced more comprehensively.
کلیدواژههای انگلیسی مقاله
لبخوانی, بازشناسی دیداری گفتار, استخراج ویژگی, یادگیری ماشینی, یادگیری عمیق, شناسایی الگو
نویسندگان مقاله
مهسا هدایتی پور |
دانشآموخته کارشناسی ارشد مهندسی کامپیوتر گرایش هوش مصنوعی و رباتیکز، دانشگاه شهید بهشتی، تهران، ایران
یاسر شکفته |
گروه هوش مصنوعی رباتیک و رایانش شناختی ، دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی، تهران، ایران
محسن ابراهیمی مقدم |
گروه هوش مصنوعی رباتیک و رایانش شناختی ، دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی، تهران، ایران
نشانی اینترنتی
https://jmvip.sinaweb.net/article_149681_cdba6a68b74b524e1fa945d2a1035ce7.pdf
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات