این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
ماشین بینایی و پردازش تصویر، جلد ۷، شماره ۱، صفحات ۲۹-۴۵

عنوان فارسی استفاده از سیگنال‌های بالابه‌پایین مبتنی بر محتوا برای بهبود بازشناسی شییء
چکیده فارسی مقاله بازشناسی شییء در صحنه‌های پیچیده‌ی ازجمله توانایی‌های شگرف سامانه بینایی انسان است که تاکنون مدل‌های محاسباتی بینایی در پیاده‌سازی آن چندان موفق نبوده‌اند. در این راستا محققان سعی دارند با شناسایی سازوکار مغز و الهام از آن این مدل را بهبود بخشند. یکی از موفق‌ترین مدل‌های ارائه‌شده در بازشناسی شییء شبکه‌های عصبی کانولوشنی (CNN’s) هستند. این مدل‌ها تنها قادر به شبیه‌سازی مسیر پیش‌روی بینایی انسان می‌باشند. با این حال شواهد مطالعات علوم اعصاب نشان می‌دهند سامانه بینایی انسان سیگنال‌های بالا‌به‌پایین انتظار را در راستای افزایش دقت و سرعت بازشناسی شییء در زمینه‌های پیچیده به کار می‌بندد. در این مقاله با بهره‌مندی از سیگنال‌های بالا‌به‌پایین انتظار، سعی بر شبیه‌سازی مسیر بازخوردی سیستم بینایی انسان شده است. به این منظور مدل کانولوشنی AlexNet به‌عنوان مسیر پیش‌رو سیستم بینایی استفاده شد. برای بازشناسی شییء از مدل آموزش یافته با مجموعه داده‌ی ImageNet و برای بازشناسی صحنه از مدل آموزش یافته با مجموعه تصاویر صحنه Places استفاده شد. شبکه آموزش دیده بر روی تصاویر صحنه (Place_CNN) برای تولید بردار بازخورد مبتنی بر اطلاعات حاصل از صحنه در نظر گرفته شد. سیگنال‌های بازخوردی شامل اطلاعاتی از فراوانی تکرار شییء موردنظر در صحنه‌ی جاری هستند. این سیگنال‌ها با قاعده‌ی ‌پس‌انتشار در قالب سیگنال‌های بالابه‌پایین با اطلاعات مسیر پیش‌رو تلفیق و در شبکه‌ی تشخیص شییء بازخورد می‌شوند. به‌منظور سنجش مدل پیشنهادی آزمایش‌هایی با استفاده از چند مجموعه داده صورت گرفت. نتایج نشان داد که ترکیب اطلاعات بازخوردی با مسیر پیش‌رو باعث بهبود معنی دار عملکرد مدل پیشنهادی نسبت به مدل پایه‌ی AlexNet می شود. استفاده از اطلاعات محتوایی تصاویر باعث بهبود عملکرد بازشناسی شییء می‌شود به‌خصوص هنگامی که شییء هدف در شرایط چالشی قرار گرفته است.
کلیدواژه‌های فارسی مقاله شبکه عصبی کانولوشنی، بازشناسی شییء، محتوا، شبکه‌ی Place_CNN، شبکه‌ی AlexNet،

عنوان انگلیسی Improving object recognition using context based top-down signals
چکیده انگلیسی مقاله Human visual system can recognize object accurately, swiftly, and effortlessly even when objects are under challenging conditions. Many research groups try to model this ability; however, these computational models could not achieve human performance. Convolutional neural networks (CNN’s) are the state-of-the-art successful computational vision models that try to implement feedforward path of human visual system. However, evidence shows that human visual system uses top-down expectation signals to increase accuracy and speed of object recognition under dificult conditons. In this study, we extend a well-known model using top-down expectation signals. In this regard, Alexnet network is considered as feedforward path. We used a pre-trained network on ImageNet dataset for object recognition and a pre-trained network on Places dataset for scene recognition. The pre-trained network on places was used to provide top-down feedback signals based on scene information. The feedback signals contain occurrence frequency information of the objects in the scene. These signals are integrated with information from feedforward path. To evaluate the proposed model several experiments were done on different image sets. The results showed that integrating the feedback information with the feedforward information significantly improve object recognition accuracy in comparison to the base model. This support the idea that content information facilitates object recognition ability, specifically when objects are under challenging conditions.
کلیدواژه‌های انگلیسی مقاله شبکه عصبی کانولوشنی, بازشناسی شییء, محتوا, شبکه‌ی Place_CNN, شبکه‌ی AlexNet

نویسندگان مقاله الهه سلطاندوست ناری |
کارشناس ارشد کامپیوتر، دانشکده مهندسی کامپیوتر، دانشگاه تربیت دبیر شهید رجایی

رضا ابراهیم پور |
دانشکده مهندسی کامپیوتر، دانشگاه تربیت دبیر شهید رجایی

کریم رجایی |
دانشجوی دکتری علوم اعصاب شناختی، پژوهشکده علوم‌شناختی، پژوهشگاه دانش‌های بنیادی


نشانی اینترنتی https://jmvip.sinaweb.net/article_91949_cb13c2afa962f92ba2241bd61926612d.pdf
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات