این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 1 دی 1404
ماشین بینایی و پردازش تصویر
، جلد ۸، شماره ۲، صفحات ۴۳-۵۵
عنوان فارسی
افزایش دقت بازشناسی صحنههای طبیعی پویا با استفاده از همبستگی بین نقشههای ویژگی در شبکههای عصبی پیچشی
چکیده فارسی مقاله
بازشناسی صحنه های پویا یکی از زمینه های تحقیقاتی اساسی در حوزه بینایی ماشین بشمار می رود. در این مقاله با استفاده از شبکه های عصبی پیچشی (CNN)، روشی مؤثر جهت بازشناسی صحنه های پویا ارائه می شود. در روش پیشنهادی، همبستگی بین نقشه های ویژگی حاصل از لایه های مختلف یک شبکه عصبی به عنوان بردارهای ویژگی حاوی اطلاعات ویدئو، مورد استفاده قرار گرفته است. در این روش، ابتدا N فریم از ویدئو انتخاب شده و به کمک یک شبکه عصبی پیچشی، نقشه های ویژگی مربوط به فریم های منتخب، استخراج شده و برای هر فریم، یک ماتریس گرام محاسبه میشود که بیانگر ویژگی های مکانی فریم های ویدئو است. سپس با قطعه بندی زمانی فریم های منتخب و میانگین گیری بر روی ماتریس های گرام این فریم ها، اطلاعات زمانی نیز لحاظ می شود. با انجام عملیات کدینگ ویژگیها و سپس pooling، برای هر ویدئو یک بردار ویژگی به منظور طبقه بندی ویدئو حاصل می شود. نتایج شبیه سازی ها بر روی سه مجموعه داده مطرح در این زمینه نشان میدهد که روش پیشنهادی از دقت بازشناسی بهتری در مقایسه با سایر روش های مطرح در این زمینه تحقیقاتی برخوردار بوده و دقت بازشناسی را تا 9% برای مجموعه داده Maryland و 3% برای مجموعه داده YUP++ بهبود بخشیده است.
کلیدواژههای فارسی مقاله
بازشناسی صحنه های پویا، شبکه عصبی پیچشی، همبستگی نقشه های ویژگی،
عنوان انگلیسی
Improving the Accuracy of Natural Dynamic Scenes Recognition using Correlation of Feature Maps in CNNs
چکیده انگلیسی مقاله
Dynamic scene recognition is one of the fundamental research fields in machine vision. In this paper, an effective dynamic scene recognition method using convolutional neural networks is proposed. In the proposed method the correlation of feature maps of different layers in a neural network is exploited as a feature vector containing video information. Firstly, N frames of video are selected and fed into a network to exploit the feature maps, then a Gram matrix indicating the spatial information of the frames of video is calculated. Subsequently, using temporal slicing over selected frames and averaging over the Gram matrices of these frames, temporal information is considered. Encoding features followed by pooling operation, a feature vector is obtained for classification. Experimental evaluations on benchmark dynamic scene datasets demonstrate the effectiveness of the proposed method in comparison with the state-of-the-art methods in this research field and has improved the recognition accuracy about 9% for Maryland dataset and about 3% for YUP++ dataset.
کلیدواژههای انگلیسی مقاله
بازشناسی صحنه های پویا, شبکه عصبی پیچشی, همبستگی نقشه های ویژگی
نویسندگان مقاله
صفورا حیدری |
دانشجوی دکتری مهندسی برق، دانشکده مهندسی، دانشگاه فردوسی مشهد، مشهد، ایران
عباس ابراهیمی مقدم |
گروه مهندسی برق، دانشکده مهندسی، دانشگاه فردوسی مشهد، مشهد، ایران
مرتضی خادمی |
گروه مهندسی برق، دانشکده مهندسی، دانشگاه فردوسی مشهد، مشهد، ایران
هادی هادی زاده |
گروه مهندسی مخابرات، دانشگاه صنعتی قوچان
نشانی اینترنتی
https://jmvip.sinaweb.net/article_118502_5ce4c76c8035c5bd2eeba18aa146787b.pdf
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات