این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۶، شماره ۳، صفحات ۱۱۶-۱۰۱

عنوان فارسی کاهش فضای جستجو در بازشناسی زیرواژگان تایپی فارسی با استفاده از موقعیت نقاط و علائم
چکیده فارسی مقاله در این مقاله با استفاده از روشی ساده، اما کارا سعی شده دامنه جستجوی زیرواژگان به‌شدّت کاهش یابد. در گام آموزش، داده‌های آموزشی بر‌اساس موقعیت علائم گروه‌بندی می‌شوند، در گروه‌هایی که تعداد عناصر بیش از ده زیرواژه است، برای کاهش فضای جستجو با توجه به تعداد عناصر گروه، با استخراج ویژگی‌های ساده‌ای از پروفایل‌های افقی و عمودی خوشه‌بندی صورت می‌گیرد. در مرحله بازشناسی در نخستین مرحله با تعیین نسبت پهنا به ارتفاع زیرواژه (با علائم و بی‌علائم) و کد موقعیت نقاط و علائم، دامنه جستجو به زیرواژگانی با این کد موقعیت که در محدوده‌ای از نسبت‌های یاد‌شده باشند، محدود می‌‌شود؛ در‌صورتی‌که تعداد زیرواژگان محدود‌شده در این مرحله کمتر از ده باشد، این محدوده پذیرفته و در غیر این‌صورت در مرحله بعد با استخراج ویژگی‌های ساده‌ای از پروفایل‌های افقی و عمودی فضای جستجو به تعدادی از نزدیکترین خوشه‌ها به این زیرواژه که شرط نسبت پهنا به ارتفاع را نیز ارضا کنند محدود می‌‌شود. با اعمال روش پیشنهادی این مقاله فضای جستجو تا حد قابل قبولی کاهش یافته است.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Search Space Reduction for Farsi Printed Subwords Recognition by Position of the Points and Signs
چکیده انگلیسی مقاله In the field of the words recognition, three approaches of words isolation, the overall shape and combination of them are used. Most optical recognition methods recognize the word based on break the word into its letters and then recogniz them. This approach is faced some problems because of the letters isolation dificulties and its recognition accurcy in texts with a low image quality. Therefore, an approach based on none separating recognition could be useful in such cases. In methods based on the overall shapes for subword recognition after extraction of subword features usually these features are searched in the image dictionary created in the training phase. Therefore, by considering that we are faced with massive amounts of classes, proposing ways to limit the scope of the search are the main challenges in the overall shape methods. Thus, the information of the overall shape usually is used to reduce the scope search in a hierarchical form. In this paper, it is tried to reduce the search space of the subwords severely by using a simple and efficient method.  In training phase, training data is grouped based on the location of the points and signs, in the groups where have more than 10 subwords, to reduce the search space, according to the number of elements in the group, by extracting the simple features of horizontal and vertical profiles clustering takes place. In recognition phase, in the first step, by determining the width to height ratio of the subword (with signs and without signs) and the position code of the points and signs, the search scope is limited to subwords with this position code that are within the range of the ratios mentioned. This range would be accepted if the number of subwords in this phase is less than ten. Otherwise, in the next step, by extracting the simple features of the horizontal and vertical profiles of the subwords, the search space will be limited to a number of the closest clusters to this subword that also satisfies the width-to-height ratio. By using the proposed method of this paper, the search space has fallen to an acceptable level. In this study, a database of 12700 subwords with five Lotus, Zar, Nazanin, Mitra and Yaghut fonts scanned 400 dpi was used. The four Lotus, Zar, Nazanin and Mitra fonts were used in the training phase and in the test phase, Yaghut ​​font is used.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله اسماعیل میری | Esmail Miri
University of Birjand
گروه الکترونیک، دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند

سیدمحمد رضوی | Seyyed Mohammad Razavi
University of Birjand
گروه الکترونیک، دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند

ناصر مهرشاد | Nasser Mehrshad
University of Birjand
گروه الکترونیک، دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-233-3&slc_lang=fa&sid=1
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-2198286.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات