این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
یکشنبه 30 آذر 1404
مجله دانشگاه علوم پزشکی خراسان شمالی
، جلد ۳، شماره ۵، صفحات ۶۷-۷۸
عنوان فارسی
مقایسه روشهای خوشهبندی در دادههای بیان ژنی
چکیده فارسی مقاله
چکیده زمینه و هدف: با گسترش روشهای استخراج دادههای ژنتیکی، روشهای تجزیه و تحلیل این نوع دادهها نیز در حال توسعه میباشند. این مطالعه با هدف مقایسه یکی از پرکاربردترین روشهای تجزیه و تحلیل این نوع داده ها، یعنی خوشهبندی انجام شده است. مواد و روش کار: در این پژوهش با استفاده از 5 مجموعه داده مایکروآرایه، نه ترکیب روش خوشهبندی سلسله مراتبی تجمعی، سلسله مراتبی تقسیمشونده و K- میانگین با متریکهای فاصله اقلیدسی، منهاتان و ضریب همبستگی پیرسون پیوند و با استفاده از شاخص پهنای نیمرخ با استفاده از روش نمونهگیری بوت استرپ مقایسه شده است. یافتهها: نتایج نشان داد روش خوشهبندی سلسله مراتبی تجمعی با پیوند متوسط دارای بهترین عملکرد بود. همچنین این روش در مقایسه با دیگر روشها از پایایی بیشتری برخوردار بود. درعین حال روش خوشهبندی سلسله مراتبی تقسیم شونده عملکرد نسبتاً مشابهی با روش خوشهبندی K- میانگین داشته است. نتیجهگیری: با توجه به نتایج می توان گفت که مبتنی بر شرایط موجود در داده ها بهترین روش خوشهبندی انتخاب می شود
کلیدواژههای فارسی مقاله
عنوان انگلیسی
CCK (Clustering-Classification-Kappa) a new validation index to assessing clustering results of gene expression data
چکیده انگلیسی مقاله
Abstract Background& Objective: The use of clustering methods for the discovery of cancer subtypes has drawn a great deal of attention in the scientific community. While bioinformaticians have proposed new clustering methods that take advantage of characteristics of the gene expression data, the medical community has a preference for using "classic" clustering methods. There have been no studies thus far performing a large-scale evaluation of different clustering methods in this context. Method & Material: We present CCK index for assessing clustering result of gene expression data. This index was made by combining two arbitrary classification and clustering algorithms result and finally. the first large-scale analysis of nine different clustering methods, Hierarchical clustering with Single, Average, Complete and Ward linkages, UPGMA, Diana, K-means, PAM and CLARA methods for the analysis of 5 cancer gene expression data sets. Afterward we use Margin Trees method for assessing quality of result of clustering methods. Ultimately we calculate quality of result of clustering methods via Kappa coefficient between result of clustering methods and result of Margin Tree method for each clustering methods. Results: Our results reveal that the PAM, followed closely by CLARA, exhibited the best performance in terms of recovering the true structure of the data sets. Also we found that Partitioning clustering methods (PAM, CLARA and K-means) have better performance than Hierarchical clustering methods (Hierarchical clustering with Single, Average, Complete and Ward linkages, UPGMA and Diana). Conclusion: The validation technique was used in this paper (Margin Trees) can aid in the selection of an optimal algorithm, for a given data set, from a collection of available clustering algorithms.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
محمد تقی شاکری | mt shakeri
احسان صباغیان | e sabaghian
حبیب الله اسماعیلی | h esmaeili
نشانی اینترنتی
http://journal.nkums.ac.ir/browse.php?a_code=A-10-25-230&slc_lang=fa&sid=fa
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/192/article-192-320426.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
علوم پایه
نوع مقاله منتشر شده
مقاله پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات