این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
چهارشنبه 3 دی 1404
ماشین بینایی و پردازش تصویر
، جلد ۸، شماره ۴، صفحات ۵۱-۸۵
عنوان فارسی
مروری بر روش های یادگیری ژرف در بازشناسی نوری نویسهها با تاکید بر رسم الخط های فارسی، عربی و اردو
چکیده فارسی مقاله
در سالهای اخیر موفقیت شبکههای عصبی کانولوشنی ژرف در تشخیص و بازشناسی اشیا سبب جلب توجه بسیاری از حوزههای مختلف یادگیری ماشین، از جمله حوزه بازشناسی نوری نویسه ها، به این مقوله شده است. یکی از چالشهای مهم این حوزه، استخراج ویژگیهای متمایزکننده و حاوی اطلاعات است. غالب روشهایی که در سال های گذشته در بازشناسی نوری حروف مطرح شدند، مبتنی بر ویژگیهای دستی هستند که توانایی تعمیمپذیری محدودی دارند. امروزه به کمک شبکههای کانولوشنی میتوان استخراج ویژگی را به صورت خودکار و با کارایی فوق العادهای به ماشین سپرد و بازشناسی حروف جدا، ارقام و لیگاتورها را بادقت بالایی انجام داد. همچنین، ساختارهایی بر مبنای ترکیب شبکه های کانولوشنی و بازگشتی پیشنهاد شده اند، که می توانند بدون نیاز به جداسازی حروف، بازشناسی را انجام دهند. این رویکرد در سالهای اخیر مورد توجه زیاد محققان بینایی ماشین قرار گرفته است؛ چرا که به کمک این شبکهها میتوان به شکل مستقل از زبان، بازشناسی را تنها با توجه به مجموعه آموزشی انجام داد. هدف از این مقاله، مروری بر کارهای انجام شده با این رویکرد نوین در حوزه بازشناسی نوری نویسهها است. در ادامه، پس از بیان مسئله و مروری مختصر بر روشهای قبل، روشهای مبتنی بر الگوریتم های ژرف و ویژگیهای آنها با تفصیل بیشتری ارزیابی میشوند. از آنجا که تاکید این مقاله روی تحقیقات بازشناسی نوری حروف در رسم الخط های پیوسته، نظیر فارسی، عربی و اردو است، کارهای انجام شده در این حوزه ها نیز در بخشی جداگانه مرور می شوند. همچنین، ضمن معرفی مجموعه های داده معروف برای کاربردهای مختلف و مروری بر معیارهای ارزیابی روش های بازشناسی نوری حروف، مهم ترین نرم افزارهای اختصاصی و بسته های نرم افزاری متن بازی که برای بازشناسی حروف استفاده میشوند، معرفی خواهند شد.
کلیدواژههای فارسی مقاله
بازشناسی نوری نویسه ها، الگوریتم های یادگیری ژرف، پایگاه های داده، رسم الخط فارسی، عربی و اردو،
عنوان انگلیسی
A review on deep learning approaches for optical character recognition with emphasis on Persian, Arabic and Urdu scripts
چکیده انگلیسی مقاله
In recent years, the success of deep convolutional neural networks in object recognition has attracted the attention of many different areas of machine learning, including the field of optical character recognition, to this category. One of the major challenges in this area is to extract distinctive and informative features. Most of the methods proposed in the optical recognition of letters in recent years are based on hand-crafted features that have limited generalizability. Today, with the help of convolutional networks, feature extraction can be left to the machine automatically and with high efficiency. Also, structures based on the combination of convolutional and recursive networks have been proposed, which can perform recognition without the need for letter separation. This approach has received a great deal of attention from machine vision researchers in recent years; since, with the help of these networks, recognition can be done independently of the language and only according to the training set. The purpose of this article is to review the work done with this new approach in the field of optical character recognition. To this end, after stating the problem and a brief overview of the previous methods, methods based on deep learning algorithms and their characteristics are evaluated in more detail. Since the emphasis of this article is on research on optical recognition of letters in continuous scripts, such as Persian, Arabic and Urdu, the work done in these areas is also reviewed in a separate section. Also, while introducing famous datasets for different applications and reviewing the evaluation criteria of optical character recognition methods, the most important software and open source packages that are used for optical character recognition will be introduced.
کلیدواژههای انگلیسی مقاله
بازشناسی نوری نویسه ها, الگوریتم های یادگیری ژرف, پایگاه های داده, رسم الخط فارسی, عربی و اردو
نویسندگان مقاله
شیما کاشف |
گروه پژوهشی سیستم های هوشمند واژه، کرمان، ایران
حسین نظام آبادی پور |
دانشگاه شهید باهنر کرمان، بخش مهندسی برق
الهام شعبانی نیا |
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی سیرجان، سیرجان، ایران
نشانی اینترنتی
https://jmvip.sinaweb.net/article_132419_dc667aaa14b6ea1c987873d5e9d5adbe.pdf
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات