این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
ماشین بینایی و پردازش تصویر، جلد ۸، شماره ۴، صفحات ۵۱-۸۵

عنوان فارسی مروری بر روش های یادگیری ژرف در بازشناسی نوری نویسه‌ها با تاکید بر رسم الخط های فارسی، عربی و اردو
چکیده فارسی مقاله در سال‌های اخیر موفقیت شبکه‌های عصبی کانولوشنی ژرف در تشخیص و بازشناسی اشیا سبب جلب توجه بسیاری از حوزه‌های مختلف یادگیری ماشین، از جمله حوزه بازشناسی نوری نویسه ­ها، به این مقوله شده است. یکی از چالش‌های مهم این حوزه، استخراج ویژگی‌های متمایزکننده و حاوی اطلاعات است. غالب روش‌هایی که در سال های گذشته در بازشناسی نوری حروف مطرح شدند، مبتنی بر ویژگی‌های دستی هستند که توانایی تعمیم‌پذیری محدودی دارند. امروزه به کمک شبکه‌های کانولوشنی می‌توان استخراج ویژگی را به صورت خودکار و با کارایی فوق العاده‌ای به ماشین سپرد و بازشناسی حروف جدا، ارقام و لیگاتورها را بادقت بالایی انجام داد. همچنین، ساختارهایی بر مبنای ترکیب شبکه های کانولوشنی و بازگشتی پیشنهاد شده اند، که می توانند بدون نیاز به جداسازی حروف، بازشناسی را انجام دهند. این رویکرد در سال‌های اخیر مورد توجه زیاد محققان بینایی ماشین قرار گرفته است؛ چرا که به کمک این شبکه‌ها می‌توان به شکل مستقل از زبان، بازشناسی را تنها با توجه به مجموعه آموزشی انجام داد. هدف از این مقاله، مروری بر کارهای انجام شده با این رویکرد نوین در حوزه بازشناسی نوری نویسه‌ها است. در ادامه، پس از بیان مسئله و مروری مختصر بر روش‌های قبل، روش‌های مبتنی بر الگوریتم های ژرف و ویژگی‌های آن‌ها با تفصیل بیشتری ارزیابی می­شوند. از آنجا که تاکید این مقاله روی تحقیقات بازشناسی نوری حروف در رسم الخط های پیوسته، نظیر فارسی، عربی و اردو است، کارهای انجام شده در این حوزه ها نیز در بخشی جداگانه مرور می شوند. همچنین، ضمن معرفی مجموعه­ های داده معروف برای کاربردهای مختلف و مروری بر معیارهای ارزیابی روش های بازشناسی نوری حروف، مهم ترین نرم افزارهای اختصاصی و بسته های نرم افزاری متن بازی که برای بازشناسی حروف استفاده می­شوند، معرفی خواهند شد.
کلیدواژه‌های فارسی مقاله بازشناسی نوری نویسه ها، الگوریتم های یادگیری ژرف، پایگاه های داده، رسم الخط فارسی، عربی و اردو،

عنوان انگلیسی A review on deep learning approaches for optical character recognition with emphasis on Persian, Arabic and Urdu scripts
چکیده انگلیسی مقاله In recent years, the success of deep convolutional neural networks in object recognition has attracted the attention of many different areas of machine learning, including the field of optical character recognition, to this category. One of the major challenges in this area is to extract distinctive and informative features. Most of the methods proposed in the optical recognition of letters in recent years are based on hand-crafted features that have limited generalizability. Today, with the help of convolutional networks, feature extraction can be left to the machine automatically and with high efficiency. Also, structures based on the combination of convolutional and recursive networks have been proposed, which can perform recognition without the need for letter separation. This approach has received a great deal of attention from machine vision researchers in recent years; since, with the help of these networks, recognition can be done independently of the language and only according to the training set. The purpose of this article is to review the work done with this new approach in the field of optical character recognition. To this end, after stating the problem and a brief overview of the previous methods, methods based on deep learning algorithms and their characteristics are evaluated in more detail. Since the emphasis of this article is on research on optical recognition of letters in continuous scripts, such as Persian, Arabic and Urdu, the work done in these areas is also reviewed in a separate section. Also, while introducing famous datasets for different applications and reviewing the evaluation criteria of optical character recognition methods, the most important software and open source packages that are used for optical character recognition will be introduced.
کلیدواژه‌های انگلیسی مقاله بازشناسی نوری نویسه ها, الگوریتم های یادگیری ژرف, پایگاه های داده, رسم الخط فارسی, عربی و اردو

نویسندگان مقاله شیما کاشف |
گروه پژوهشی سیستم های هوشمند واژه، کرمان، ایران

حسین نظام آبادی پور |
دانشگاه شهید باهنر کرمان، بخش مهندسی برق

الهام شعبانی نیا |
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی سیرجان، سیرجان، ایران


نشانی اینترنتی https://jmvip.sinaweb.net/article_132419_dc667aaa14b6ea1c987873d5e9d5adbe.pdf
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات