این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۳، شماره ۲، صفحات ۱۱-۲۳

عنوان فارسی خوشه‌بندی فراابتکاری اسناد فارسی اِکس‌اِم‌اِل مبتنی بر شباهت ساختاری و محتوایی
چکیده فارسی مقاله با توجه به رشد فزاینده‌ی تعداد اسناد XML، سازماندهی موثر این اسناد به منظور بازیابی اطلاعات مفید از آنها ضروری می‌باشد. یک راه‌حل امکان‌پذیر، انجام خوشه‌بندی بر روی اسناد XML به منظور کشف دانش است. مسئله کلیدی در خوشه‌بندی اسناد XML این است که چگونه می‌توان شباهت بین اسناد XML را اندازه‌گیری کرد. استفاده از روش‌های متداول خوشه‌بندی اسناد متنی که اطلاعات محتوایی را برای اندازه‌گیری شباهت سند بکار می‌گیرند، باعث می‌شود اطلاعات ساختاری موجود در اسناد XML نادیده گرفته شود. در این مقاله، مدل جدیدی با نام مدل فضای ماتریسی برای بازنمایی هر دو ویژگی ساختاری و محتوایی داده‌ها در اسناد XML، پیشنهاد می‌شود. بر اساس این مدل، معیار شباهت جاکارد را تعریف و در نهایت از الگوریتم رقابت استعماری برای خوشه‌بندی اسناد XML استفاده می‌شود. نتایج تجربی نشان می‌دهد که مدل پیشنهادی و تابع نزدیکی معرفی شده در شناسایی اسناد مشابه که دارای اطلاعات ساختاری و محتوایی یکسان هستند، موثر است. این روش می‌تواند به منظور بهبود دقت خوشه‌بندی و افزایش بهره‌وری در بازیابی اطلاعات XML مورد استفاده قرار گیرد.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Persian XML Documents Metaheuristic Clustering Based on Structure and Content Similarity
چکیده انگلیسی مقاله Due to the increasing number of documents, XML, effectively organize these documents in order to retrieve useful information from them is essential. A possible solution is performed on the clustering of XML documents in order to discover knowledge. Clustering XML documents is a key issue of how to measure the similarity between XML documents. Conventional clustering of text documents using a document similarity measure used in information content, they can cause structural information contained in XML documents is ignored. In this paper, a new model named matrix space model to represent both structural and content features of documents in XML, is proposed. Based on this model, the Jaccard similarity measure is defined and the colonial competitive algorithm for clustering XML documents is used. Experimental results show that the proposed model function in identifying similar documents which closely identified with the same structure and content information are effective. This method can improve the accuracy of clustering, and XML data can be used to increase productivity.
کلیدواژه‌های انگلیسی مقاله Clustering, Persian, colonial competitive algorithm,

نویسندگان مقاله علی مرادی | ali moradi
department of computer engineering, faculty of engineering, university of guilan, rasht, iran
رشت، کیلومتر 5 جاده تهران، پردیس دانشگاه گیلان، دانشکده فنی، گروه مهندسی کامپیوتر
سازمان اصلی تایید شده: دانشگاه گیلان (Guilan university)

اسدالله شاه بهرامی | asadollah shahbahrami
department of computer engineering, faculty of engineering, university of guilan, rasht, iran
رشت، کیلومتر 5 جاده تهران، پردیس دانشگاه گیلان، دانشکده فنی، گروه مهندسی کامپیوتر
سازمان اصلی تایید شده: دانشگاه گیلان (Guilan university)

رضا ابراهیمی آتانی | reza ebrahimi atani
department of computer engineering, faculty of engineering, university of guilan, rasht, iran
رشت، کیلومتر 5 جاده تهران، پردیس دانشگاه گیلان، دانشکده فنی، گروه مهندسی کامپیوتر
سازمان اصلی تایید شده: دانشگاه گیلان (Guilan university)

مهران علیدوست نیا | mehran alidoust nia
department of computer engineering, faculty of engineering, university of guilan, rasht, iran
رشت، کیلومتر 5 جاده تهران، پردیس دانشگاه گیلان، دانشکده فنی، گروه مهندسی کامپیوتر
سازمان اصلی تایید شده: دانشگاه گیلان (Guilan university)


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-182-1&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233315.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده کاربردی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات