این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
ماشین بینایی و پردازش تصویر، جلد ۶، شماره ۲، صفحات ۴۳-۵۹

عنوان فارسی بهبود شبکه عمیق R-FCN در آشکارسازی و برچسب‎زنی اشیاء
چکیده فارسی مقاله امروزه آشکارسازی و برچسب‎زنی اشیاء در تصاویر یکی از چالش‎های اساسی در برخی از کاربردهای بینایی‎ماشین می‎باشد. در سال‎های اخیر استفاده از یادگیری عمیق مورد توجه محققان قرار گرفته است. در همین راستا، در این مقاله ابتدا جدیدترین شبکه‎های عمیق موجود معرفی، سپس نقاط قوت و ضعف آنها تحلیل می‌شود. در ادامه شبکه‎ای بهبود یافته از شبکه R-FCN ارائه می‎شود. روش پیشنهادی بر پایه معماری ResNet و شبکه تمام کانولوشن است. در این روش، معماری جدیدی مبتنی بر شبکه عمیق برای پیشنهاد ناحیه کاندید و روشی ترکیبی مبتنی بر SVMفازی دوکلاسه و SVR برای آشکارسازی و برچسب‎زنی اشیاء ارائه شده است. در این روش از تابع زیان جدید با عنوان اختلاف کوشی-شوارتز استفاده شده است. این تابع زیان از لحاظ سرعت و دقت، عملکرد بهتری از خود نشان داده است. روش پیشنهادی با معماری 101-ResNet بر روی مجموعه داده SUN برای آشکارسازی و برچسب‎زنی 36 شی مورد آزمایش قرار گرفت و نتایج بدست آمده نشان دهنده بهبود عملکرد این روش نسبت به روش پایه شبکه R-FCN است. روش پیشنهادی از لحاظ معیار mAP، عملکرد 48/38% و مدت زمان متوسط برای هر تصویر 0/13 را دارد، و نسبت به بهترین روش در این حوزه تقریبا 2% در عملکرد و 0/4 ثانیه در زمان بهتر عمل کرده است.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Improvement of the R-FCN's deep network in object detection and annotation
چکیده انگلیسی مقاله Today, the detection and annotation of objects in images is one of the major challenges in some applications of machine vision. In recent years, the use of deep learning has attracted the attention of researchers. In this regard, this paper first introduces the newest deep networks and analyzes the strengths and weaknesses of these methods. An improved network of R-FCN network has been presented. The proposed method is based on the ResNet architecture and the fully- convolutional network. In this method, a new architecture is proposed based on region proposal deep network and a combined method based on the binary fuzzy SVM and the SVR for final detection and categorization of objects. Also, a new loss function called Cauchy-Schwartz Divergence loss, has been used. This function has shown better performance in terms of speed and accuracy. The proposed ResNet-101 architecture was tested on the SUN dataset for the detection and annotation of 36 objects, and the results indicate improved performance of this method compared to the basic R-FCN network method. The proposed method, In terms of Mean Average Precision, has 48.38% performance and average duration for each image is 0.13 Compared to the best method in this area, it performed about 2% in performance and 0.04 seconds in better time.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله علی قنبری سرخی |
دانشجوی دکتری مهندسی کامپیوتر، دانشگاه صنعتی شاهرود

حمید حسن پور |
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود

منصور فاتح |
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود


نشانی اینترنتی http://jmvip.sinaweb.net/article_80238_4e49ef482e899a342f2b99acffa041be.pdf
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1041/article-1041-2309594.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات