این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پژوهشنامه پردازش و مدیریت اطلاعات، جلد ۳۷، شماره ۳، صفحات ۸۹۵-۹۱۸

عنوان فارسی ارائه روشی برای برچسب زدن تصاویر موجود در متون علمی فارسی با استفاده از روش‌های پردازش متن
چکیده فارسی مقاله در این مقاله یک روش جدید برای برچسب‌گذاری تصاویر موجود در متون علمی فارسی معرفی می‌شود. در اسناد و مقالات علمی، تصاویر حاوی اطلاعلات مهمی هستند و در بسیاری از موارد با بررسی آنها به تنهایی می‌توان به ایده اصلی و یا نتایج مهم مقاله علمی پی برد، بدون اینکه لازم باشد کل مقاله را مطالعه کرد. به خاطر رشد روز افزون داده‌های تصویری، بازیابی تصاویر از اسناد علمی توجه زیادی به خود جلب کرده است و تبدیل به یک موضوع رو به رشد در ادبیات شده است. اولین قدم در بازیابی تصاویر تخصیص برچسب‌های توصیف کننده به هر تصویر است.  در اینجا برای استخراج برچسب تصویر از متن سندی که تصویر به آن تعلق دارد استفاده شده است. زیرنویس و قسمتی از متن سند که در آن، به تصویر مورد نظر اشاره شده است در نظر گرفته می‌شود. عبارات اسمی در متن همراه تصویر با استفاده از پنج روش متفاوت؛ فراوانی عبارات در سند، معکوس فراوانی سند، فراوانی کلمه- معکوس فراوانی سند، شباهت کسینوسی عبارات با زیرنویس و ترکیب روش فراوانی کلمه- معکوس فراوانی سند و شباهت کسینوسی با زیرنویس، رتبه بندی می‌شوند. برچسب‌های انتخابی برای تصویر در هر روش، عبارات اسمی با رتبه بالاتر در آن روش است. روش‌های معرفی شده با استفاده از داده آزمایشی از پایگاه اطلاعات علمی ایران (گنج) که منبع اصلی اسناد علمی فارسی است، ارزیابی می‌شوند. طبق نتایج بدست آمده در این تحقیق روش فراوانی کلمه- معکوس فراوانی سند بهترین روش برای برچسب زدن تصاویر موجود در اسناد علمی است.
کلیدواژه‌های فارسی مقاله برچسب زدن تصویر، نشانه‌گذاری تصویر، بازیابی تصویر، پردازش متن، استخراج فراداده، فناوری اطلاعات

عنوان انگلیسی Automatic Annotation of Images in Persian Scientific Documents Based on Text Analysis Methods
چکیده انگلیسی مقاله In this paper, a new method for annotating images in Persian scientific documents is suggested.  Images in scientific documents contain valuable information. In many cases, by analyzing images one can understand the main idea and important results of the document. Due to the explosive growth of image data, automatic image annotation has attracted extensive attention and become one of the growing subjects in the literature. Image annotation is the first step in image retrieval methods, in which descriptive tags are assigned to each image. Here, for image annotation the associated text is used. The caption and the part of the document that includes the reference to the image are considered. None phrases in the associated text are ranked based on five different methods; term frequency, inverse document frequency, term frequency–inverse document frequency, cosine similarity between word embedding of noun phrases in the text and the caption and using both term frequency–inverse document frequency and cosine similarity methods. Image tags in every method are the noun phrases with the highest rank. Suggested methods are evaluated on the test data from Iran scientific information database (Ganj), the main database of Persian scientific documents. Term frequency–inverse document frequency method gives the best results.
کلیدواژه‌های انگلیسی مقاله Image Tagging, Text analysis, Image Annotation, Image retrieval, metadata extraction, Information technology

نویسندگان مقاله آزاده فخرزاده | Azadeh fakhrzadeh
Iranian Research Institute for Information Science and Technology (IranDoc);Tehran, Iran
پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)، تهران؛ ایران

محدثه رهنما | Mohadeseh Rahnama
Alzahra University;Tehran, Iran
گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه الزهرا (س)، تهران؛ ایران

جلال‌الدین نصیری | Jalal A Nasiri
Faculty of Mathematical Sciences, Ferdowsi University of Mashhad, mashhad; Iran.
دانشکده علوم ریاضی، دانشگاه فردوسی مشهد، مشهد؛ ایران.


نشانی اینترنتی http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-5614-2&slc_lang=fa&sid=1
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده تحلیل داده‌های کلان
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات