این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
پنجشنبه 27 آذر 1404
رایانش نرم و فناوری اطلاعات
، جلد ۱۳، شماره ۳، صفحات ۳۱-۴۵
عنوان فارسی
GCOCR، روشی برای تشخیص حروف براساس شبکههای دروازهدار کانولوشنی و بازگشتی
چکیده فارسی مقاله
در دو دهه اخیر شناسایی دستنوشته یکی از چالشبرانگیزترین زمینهها در بینایی کامپیوتر بوده است، چراکه دستخط هر فرد با دیگری متفاوت بوده و تنها منبع اطلاعاتی چنین سیستمی، تصاویر دستخط میباشند. برای این چالش، معماریهای متفاوتی بر مبنای در دسترس بودن دادههای برچسب گزاری شده در مقیاس بزرگ ارائهشده است. در این پژوهش، یک معماری ترکیبی مبتنی بر روشهای یادگیری عمیق، شبکههای عصبی بازگشتی کانولوشنی و شبکههای دروازهای کانولوشنی بانام GCOCR ارائه گردیده است. در این معماری، ابتدا پیشپردازش دادهها با استفاده ازروشهای لایه گزاری، رفع کجی حروف و افزایش تعداد نمونهها انجام شده است، سپس لایههای ترکیبی کانولوشنی دروازهدار، توابع فعالساز رلو، پولینگ و شبکه عصبی دوجهته معماری GCOCR را پیادهسازی میکنند. نتایج عملکرد این معماری بر روی دیتاست IAM حاکی از آن است که خطای حرف GCOCR، 6/8% و خطای کلمه GCOCR، 4/2% کمتر از قویترین پژوهشهای مشابه میباشد.
کلیدواژههای فارسی مقاله
شبکههای عصبی بازگشتی کانولوشنی،شبکههای عصبی کانولوشنی دروازهدار،افزونگی داده،یادگیری عمیق،شناسایی دستخط،
عنوان انگلیسی
GCOCR: A Method for Recognition of Characters Using Gated Convolutional and Recurrent Networks
چکیده انگلیسی مقاله
Handwriting recognition has been a highly challenging area in computer vision for the past twenty years. The main source of data for such systems is handwriting images, leading to the proposal of various architectures based on the availability of extensive labeled data. This study introduces a hybrid architecture called GCOCR, which utilizes deep learning methods and gated convolutional recurrent neural networks to intelligently recognize characters. The architecture incorporates pre-processing techniques such as padding, deslanting, and data augmentation. Additionally, it implements gated convolutional layers, ReLU activation functions, pooling, and a bidirectional neural network. The performance results of this architecture on the IAM dataset indicate that the character error rate (CER) of GCOCR is 8.6% lower and the word error rate (WER) of GCOCR is 2.4% lower than the strongest comparable research studies.
کلیدواژههای انگلیسی مقاله
شبکههای عصبی بازگشتی کانولوشنی,شبکههای عصبی کانولوشنی دروازهدار,افزونگی داده,یادگیری عمیق,شناسایی دستخط
نویسندگان مقاله
سیدمحمدرضا موسوی |
دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی سجاد، مشهد، ایران.
امیر باوفای طوسی |
دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی سجاد، مشهد، ایران.
نشانی اینترنتی
https://jscit.nit.ac.ir/article_212386_be240344e1b34ec7c44b734f383a50ec.pdf
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات