این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
رایانش نرم و فناوری اطلاعات، جلد ۱۳، شماره ۳، صفحات ۳۱-۴۵

عنوان فارسی GCOCR، روشی برای تشخیص حروف براساس شبکه‌های دروازه‌دار کانولوشنی و بازگشتی
چکیده فارسی مقاله در دو دهه اخیر شناسایی دست‌نوشته یکی از چالش‌برانگیزترین زمینه‌ها در بینایی کامپیوتر بوده است، چراکه دستخط هر فرد با دیگری متفاوت بوده و تنها منبع اطلاعاتی چنین سیستمی، تصاویر دستخط می‌باشند. برای این چالش، معماری‌های متفاوتی بر مبنای در دسترس بودن داده‌های برچسب‌ گزاری ‌شده در مقیاس بزرگ ارائه‌شده است. در این پژوهش، یک معماری ترکیبی مبتنی بر روش‌های یادگیری عمیق، شبکه‌های عصبی بازگشتی کانولوشنی و شبکه‌های دروازه‌ای کانولوشنی بانام GCOCR‌ ارائه گردیده است. در این معماری، ابتدا پیش‌پردازش داده‌ها با استفاده ازروش‌های لایه گزاری، رفع کجی حروف و افزایش تعداد نمونه‌ها انجام شده است، سپس لایه‌های ترکیبی کانولوشنی دروازه‌دار، توابع فعال‌ساز رلو، پولینگ و شبکه عصبی دوجهته معماری GCOCR را پیاده‌سازی می‌کنند. نتایج عملکرد این معماری بر روی دیتاست IAM حاکی از آن است که خطای حرف GCOCR، 6/8‌% و خطای کلمه GCOCR، 4/2‌% کمتر از قوی‌ترین پژوهش‌های مشابه می‌باشد.
کلیدواژه‌های فارسی مقاله شبکه‌های عصبی بازگشتی کانولوشنی،شبکه‌های عصبی کانولوشنی دروازه‌دار،افزونگی داده،یادگیری عمیق،شناسایی دستخط،

عنوان انگلیسی GCOCR: A Method for Recognition of Characters Using Gated Convolutional and Recurrent Networks
چکیده انگلیسی مقاله Handwriting recognition has been a highly challenging area in computer vision for the past twenty years. The main source of data for such systems is handwriting images, leading to the proposal of various architectures based on the availability of extensive labeled data. This study introduces a hybrid architecture called GCOCR, which utilizes deep learning methods and gated convolutional recurrent neural networks to intelligently recognize characters. The architecture incorporates pre-processing techniques such as padding, deslanting, and data augmentation. Additionally, it implements gated convolutional layers, ReLU activation functions, pooling, and a bidirectional neural network. The performance results of this architecture on the IAM dataset indicate that the character error rate (CER) of GCOCR is 8.6% lower and the word error rate (WER) of GCOCR is 2.4% lower than the strongest comparable research studies.
کلیدواژه‌های انگلیسی مقاله شبکه‌های عصبی بازگشتی کانولوشنی,شبکه‌های عصبی کانولوشنی دروازه‌دار,افزونگی داده,یادگیری عمیق,شناسایی دستخط

نویسندگان مقاله سیدمحمدرضا موسوی |
دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی سجاد، مشهد، ایران.

امیر باوفای طوسی |
دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی سجاد، مشهد، ایران.


نشانی اینترنتی https://jscit.nit.ac.ir/article_212386_be240344e1b34ec7c44b734f383a50ec.pdf
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات