این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
ماشین بینایی و پردازش تصویر، جلد ۱۰، شماره ۲، صفحات ۳۱-۴۶

عنوان فارسی معرفی یک مجموعه داده برای کاربرد های درک و ناحیه بندی تصاویر اسناد فارسی
چکیده فارسی مقاله وجود مجموعه ‌داده‌های تصویری نقش اساسی در زمینه تشخیص نویسه خوان نوری (OCR) و بازیابی اسناد دارد. علی‌رغم اینکه تا به امروز مجموعه ‌داده‌های تصویری زیادی با اشیا متفاوت در حوزه درک و ناحیه‌بندی اسناد غیرفارسی منتشر شده است، رسم الخط فارسی از این پیشرفت عقب ‌مانده است و تاکنون در زمینه درک و ناحیه‌بندی اسناد فارسی، مجموعه‌ دادگانی با دسترسی عمومی ارائه نشده است. از سوی دیگر، اگرچه زبان‌های فارسی و عربی شباهت‌های زیادی‌ دارند، اما تفاوت بین ساختار این دو زبان باعث می‌شود که سیستم‌های آموزش‌‌دیدهOCR با مجموعه ‌داده عربی، دقت مناسبی روی تصاویر اسناد فارسی نداشته باشند. در این مقاله، یک مجموعه داده‌ برای تصاویر اسناد فارسی معرفی می‌گردد که مشتمل بر 5598 تصویر است. تصاویر تهیه شده متعلق به روزنامه‌ها، کتاب‌های درسی، مقالات علمی، فایل‌های PDF فارسی، پایان‌نامه‌ها، انواع لوگو ایرانی، کتب دست‌نوشته‌ قدیمی و جزوات تایپ شده و دست‌نویس ریاضی هستند. در مجموعه داده معرفی شده، اشیا درون تصاویر به 6 گروه پاراگراف (متن)، شکل، جدول، لوگو، رابطه ریاضی و سرصفحه دسته‌بندی و برچسب‌گذاری شده‌اند. برای ارزیابی کارایی مجموعه تصویر پیشنهادی، سه روش شناخته ‌شده مبتنی بر یادگیری عمیق پیاده سازی و نتایج بر مبنای معیارهای مختلف گزارش شده است.
کلیدواژه‌های فارسی مقاله پردازش تصویر، اسناد متن فارسی، ناحیه‌بندی سند، درک سند، مجموعه داده،

عنوان انگلیسی Introducing a database for Farsi document image understanding and segmentation
چکیده انگلیسی مقاله Document images segmentation is one of the recent activities that have attracted researchers' attention. Unfortunately, there is no report on a benchmark dataset for Farsi document images understanding and segmentations applications that be available in the web. In the current article, a benchmark image dataset for the sake of the Farsi document images segmentation is presented, which includes 5598 images. The provided images are taken from the newspapers, textbooks and academic articles. Objects in the images are categorized and labeled into six different groups to be used easily in the subsequent applications. The object groups used in the dataset are paragraph(text), figure, table, logo, mathematical equation and header. To asset the effectiveness of the proposed document image dataset, three existing well-known methods based on deep learning are implemented on it and the results are presented.
کلیدواژه‌های انگلیسی مقاله پردازش تصویر, اسناد متن فارسی, ناحیه‌بندی سند, درک سند, مجموعه داده

نویسندگان مقاله امین فرجی |
دانشجوی کارشناسی ارشد بخش مهندسی کامپیوتر دانشگاه شهید باهنر کرمان

مسعود سعید |
دانشکده فنی و مهندسی دانشگاه شهید باهنر کرمان

حسین نظام آبادی پور |
دانشکده فنی و مهندسی دانشگاه شهید باهنر کرمان


نشانی اینترنتی https://jmvip.sinaweb.net/article_164674_2da594d59770a5ccf9b83b0e38d1ae50.pdf
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات