این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 1 دی 1404
ماشین بینایی و پردازش تصویر
، جلد ۶، شماره ۲، صفحات ۴۳-۵۹
عنوان فارسی
بهبود شبکه عمیق R-FCN در آشکارسازی و برچسبزنی اشیاء
چکیده فارسی مقاله
امروزه آشکارسازی و برچسبزنی اشیاء در تصاویر یکی از چالشهای اساسی در برخی از کاربردهای بیناییماشین میباشد. در سالهای اخیر استفاده از یادگیری عمیق مورد توجه محققان قرار گرفته است. در همین راستا، در این مقاله ابتدا جدیدترین شبکههای عمیق موجود معرفی، سپس نقاط قوت و ضعف آنها تحلیل میشود. در ادامه شبکهای بهبود یافته از شبکه R-FCN ارائه میشود. روش پیشنهادی بر پایه معماری ResNet و شبکه تمام کانولوشن است. در این روش، معماری جدیدی مبتنی بر شبکه عمیق برای پیشنهاد ناحیه کاندید و روشی ترکیبی مبتنی بر SVMفازی دوکلاسه و SVR برای آشکارسازی و برچسبزنی اشیاء ارائه شده است. در این روش از تابع زیان جدید با عنوان اختلاف کوشی-شوارتز استفاده شده است. این تابع زیان از لحاظ سرعت و دقت، عملکرد بهتری از خود نشان داده است. روش پیشنهادی با معماری 101-ResNet بر روی مجموعه داده SUN برای آشکارسازی و برچسبزنی 36 شی مورد آزمایش قرار گرفت و نتایج بدست آمده نشان دهنده بهبود عملکرد این روش نسبت به روش پایه شبکه R-FCN است. روش پیشنهادی از لحاظ معیار mAP، عملکرد 48/38% و مدت زمان متوسط برای هر تصویر 0/13 را دارد، و نسبت به بهترین روش در این حوزه تقریبا 2% در عملکرد و 0/4 ثانیه در زمان بهتر عمل کرده است.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Improvement of the R-FCN's deep network in object detection and annotation
چکیده انگلیسی مقاله
Today, the detection and annotation of objects in images is one of the major challenges in some applications of machine vision. In recent years, the use of deep learning has attracted the attention of researchers. In this regard, this paper first introduces the newest deep networks and analyzes the strengths and weaknesses of these methods. An improved network of R-FCN network has been presented. The proposed method is based on the ResNet architecture and the fully- convolutional network. In this method, a new architecture is proposed based on region proposal deep network and a combined method based on the binary fuzzy SVM and the SVR for final detection and categorization of objects. Also, a new loss function called Cauchy-Schwartz Divergence loss, has been used. This function has shown better performance in terms of speed and accuracy. The proposed ResNet-101 architecture was tested on the SUN dataset for the detection and annotation of 36 objects, and the results indicate improved performance of this method compared to the basic R-FCN network method. The proposed method, In terms of Mean Average Precision, has 48.38% performance and average duration for each image is 0.13 Compared to the best method in this area, it performed about 2% in performance and 0.04 seconds in better time.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
علی قنبری سرخی |
دانشجوی دکتری مهندسی کامپیوتر، دانشگاه صنعتی شاهرود
حمید حسن پور |
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود
منصور فاتح |
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود
نشانی اینترنتی
http://jmvip.sinaweb.net/article_80238_4e49ef482e899a342f2b99acffa041be.pdf
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1041/article-1041-2309594.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات