این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پژوهشنامه پردازش و مدیریت اطلاعات، جلد ۳۷، شماره ۲، صفحات ۵۲۷-۵۵۶

عنوان فارسی مروری نظام‌مند بر پژوهش‌های بهبود الگوریتم کا-میانه برای خوشه‌بندی داده‌ها
چکیده فارسی مقاله خوشه‌بندی به‌عنوان یک فرایند جهت شناخت ماهیت و ساختار داده‌ها در بسیاری از حوزه‌های علوم و فناوری‌های مرتبط با آن نقش مهمی در سازماندهی داده‌ها دارد. یکی از الگوریتم‌های پرکاربرد و ساده خوشه‌بندی، کا-میانه است. پژوهش حاضر با هدف مرور نظام‌مند تحقیقات در زمینه بهبود الگوریتم کا-میانه برای خوشه‌بندی داده‌ها صورت گرفته است. این پژوهش با یک راهبرد جدید بر مبنای کاستی‌های الگوریتم کا-میانه به بررسی تحقیقات انجام‌شده در این زمینه و نقش آن در سازماندهی داده‌ها در محدوده سال‌های 2010 تا 2020 می‌پردازد. برای این منظور میزان توجه پژوهشگران به رفع هر یک از کاستی‌های این الگوریتم برای بهبود طی سال‌های مزبور در قالب پرسش‌های پژوهش تدوین شده است. در این پژوهش با استفاده از استراتژی‌ جست‌وجو، پالایش، و استخراج مقاله‌ها در نهایت، 47 منبع مرتبط شناسایی و مورد بررسی قرار گرفت. یافته‌ها نشان داد که بیشترین تحقیقات صورت‌گرفته با غلبه بر کاستی حساس به مراکز خوشه اولیه در جهت بهبود الگوریتم کا-میانه انجام شده است. همچنین، از 47 تحقیق مورد بررسی، الگوریتم بهبودیافته کا-میانه در 35 تحقیق بر روی داده‌های غیرمتنی و در 12 تحقیق بر روی داده‌های متنی اعمال شده است. سرانجام، نتیجه حاصل از بررسی 6 تحقیق از تحقیقات صورت‌گرفته نشان داد که حجم داده‌ها رابطه‌ای مستقیم با عملکرد الگوریتم بهبودیافته کا-میانه دارد. به‌عبارت دیگر، این الگوریتم باید به‌نوعی اصلاح شود که با اعمال بر روی حجم متفاوت داده‌ها خوشه‌بندی کارآمد و دقیقی انجام دهد.
کلیدواژه‌های فارسی مقاله خوشه‌بندی داده، بهبود الگوریتم‌ کا-میانه، خوشه‌بندی، مرور نظام‌مند

عنوان انگلیسی A Systematic review of K-means Algorithm Improvement Research for Data Clustering
چکیده انگلیسی مقاله Clustering as a process to understand the nature and structure of data plays an important role in organizing data in many areas of science and technology. One of the most widely used and simple algorithms for clustering is K-means. The present study was conducted to systematically reviewing research on improving K-means algorithm on data clustering. This research examines the researches conducted in this field and its role in organizing data in the range of 2010 to 2020 with a new strategy based on the shortcomings of the K-means algorithm. For this purpose, the amount of attention of researchers to eliminate any of the shortcomings of this algorithm in order to improve it in recent years has been compiled in the form of research questions. In this study, with the use of a search strategy for refining and extracting articles, 47 related sources were identified and examined. Findings showed that most researches have been done by overcoming the sensitive shortcomings to initial cluster centers to improve the K-means algorithm. Also, out of a total of 47 studies, the improved K-means algorithm has been applied in 35 studies on non-textual data and in 12 studies on textual data. Finally, the results of a review of six studies showed that the amount of data is directly related to the performance of improved K-means algorithm. In other words, this algorithm must be modified in such a way as to perform efficient and accurate clustering by applying it to different amounts of data.
کلیدواژه‌های انگلیسی مقاله Data Clustering, K-means Algorithm, Clustering Improvement, Systematic Review

نویسندگان مقاله الهام یلوه | Elham Yalveh
University of Qom; Qom;, Iran.
دانشگاه قم؛ قم، ایران؛

یعقوب نوروزی | Yaghoub Norouzi
Department of Knowledge and Information science; University of Qom; Qom, Iran;
گروه علم اطلاعات و دانش‌شناسی؛ دانشگاه قم؛ قم، ایران؛

اشکان خطیر | Ashkan Khatir
Iranian Research Institute for Information Science and Technology (IranDoc);Tehran, Iran
پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)؛ تهران، ایران؛


نشانی اینترنتی http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-491-23&slc_lang=fa&sid=1
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده تحلیل داده‌های کلان
نوع مقاله منتشر شده مروری
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات