سامانه اطلاعات پژوهشی ایران

این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند

سه شنبه 21 بهمن 1404


مدیریت اطلاعات سلامت، جلد ۱۸، شماره ۱، صفحات ۱-۶


عنوان فارسی	جایگذاری مقادیر گمشده در مجموعه داده‌های دیابت و سرطان سینه با استفاده از شبکه عصبی پرسپترون دو لایه

چکیده فارسی مقاله	مقدمه: جایگذاری مقادیر گمشده در مجموعه داده‌های اطلاعاتی پزشکی، یکی از چالش‌های مهم در مسایل داده‌کاوی به شمار می‌رود. بنابراین، پژوهش حاضر با هدف جایگذاری مقادیر گمشده برخی از ویژگی‌های مجموعه داده‌های دیابت و سرطان سینه انجام شد. روش بررسی: در این مطالعه توصیفی، از مجموعه داده سرطان سینه شامل 699 نمونه که 458 نمونه خوش‌خیم و 241 نمونه بدخیم و مجموعه داده دیابت شامل 768 نمونه که 500 نمونه فاقد بیماری دیابت و 268 نمونه دیگر دارای بیماری دیابت بودند، استفاده گردید. برای جایگذاری مقادیر گمشده در این دو مجموعه داده، مدلی بر پایه شبکه عصبی پرسپترون دو لایه طراحی شد. به منظور ارزیابی، ماشین بردار پشتیبان SVM (Support Vector Machine) و آزمون t مورد استفاده قرار گرفت. یافته‌ها: میزان میانگین مربعات خطا MSE (Mean Squared Error) به دست آمده در مدل شبکه عصبی پرسپترون دو لایه در مجموعه داده دیابت، حدود 03/0 و در مجموعه داده سرطان سینه، حدود 04/0 کمتر از MSE‌های به دست آمده در روش جایگذاری با مقدار میانگین گزارش گردید. مقادیر جایگذاری شده با استفاده از مدل نسبت به مقادیر جایگذاری شده با مقدار میانگین، به مقدار واقعی نزدیک‌تر بود. صحت و حساسیت طبقه‌بندی بیماری در حالتی که مقادیر گمشده توسط شبکه عصبی پرسپترون جایگذاری شده بود، در مقایسه با دو روش مرسوم مقدار میانگین و روش حذف مقادیر گمشده در مجموعه داده دیابت به ترتیب در حدود 2، 4، 2 و 4 درصد و در مجموعه داده سرطان سینه به ترتیب در حدود 1، 3، 2، 5 درصد بیشتر شد. تفاوت معنی‌داری بین دو روش جایگذاری مقادیر گمشده با مقدار میانگین و جایگذاری مدل وجود داشت. نتیجه‌گیری: جایگذاری مقایر گمشده در مجموعه داده‌های پزشکی توسط شبکه عصبی پرسپترون دو لایه نسبت به دو روش جایگذاری با مقدار میانگین و روش حذف مقادیر گمشده، نتایج بهتری در طبقه‌بندی بیماری نشان می‌دهد.

کلیدواژه‌های فارسی مقاله	داده‌کاوی، مدل‌های شبکه عصبی، ماشین بردار پشتیبان،

عنوان انگلیسی	Imputing of Missing Values in Diabetes and Breast Cancer Datasets through a Two-Layer Perceptron Neural Network

چکیده انگلیسی مقاله	Introduction: Imputation of missing values in a medical data set is one of the important challenges in data mining. Therefore, this study was performed with the aim of imputation the missing values of some features of the diabetes and breast cancer datasets. Methods: In this descriptive study, a breast cancer dataset consisting of 699 specimens including 458 benign and 241 malignant specimens, along with a diabetes dataset consisting of 768 specimens including 500 non-diabetic specimens and 268 other specimens with diabetes, were used. For the purpose of the imputation of missing values in these two datasets, a model based on a two-layer perceptron neural network was developed, and for the purpose of assessment, support vector machine (SVM) and t test were used. Results: The mean squared errors (MSEs) obtained in the two-layer perceptron neural network model, in the diabetes dataset about 0.03 and in the breast cancer dataset about 0.04, were less than the MSEs obtained in the imputation method with the mean value. The values imputed by the model were closer to the actual value than the values imputed with the mean value. Accuracy and sensitivity of disease classification in the case of missing values imputed by the perceptron neural network increased in comparison with the two conventional methods of mean value and the method of deleting missing values, about 2, 4, 2, and 4 percent in the diabetes dataset, and about 1, 3, 2, 5 percent in the dataset breast cancer, respectively. There was a significant difference between the two methods of imputation of missing values with the mean value and imputation by the model. Conclusion: The imputation of the missing values in the medical data set by the two-layer perceptron neural network showed better results in the classification of the disease than the two methods of imputation with the mean value and the method of deleting missing values.

کلیدواژه‌های انگلیسی مقاله	Data Mining,Neural Network Models,Support Vector Machine

نویسندگان مقاله	الهام پورجانی \| استادیار، شبکه، گروه کامپیوتر، دانشکده مهندسی برق، واحد یادگار امام (ره)، دانشگاه آزاد اسلامی، شهرری، ایران سارا نجف‌زاده \| دانشیار، الکترونیک، گروه مهندسی برق، دانشکده علوم و فن‌آوری‌های پزشکی، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران نادر جعفرنیا دابانلو \|

نشانی اینترنتی	http://him.mui.ac.ir/index.php/him/article/view/4194
فایل مقاله	اشکال در دسترسی به فایل - ./files/site1/rds_journals/110/article-110-2481927.pdf
کد مقاله (doi)	10.22122/him.v18i1.4194
زبان مقاله منتشر شده	fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده	مقاله پژوهشی

برگشت به: صفحه اول پایگاه \| نسخه مرتبط \| نشریه مرتبط \| فهرست نشریات

ارسال پیام برخط

در صورت مشاهده هر نوع اشکال در داده های پایگاه و یا برای ارسال نظرات و پیشنهاد های خود می توانید با پر کردن فرم تماس ما را در جریان قرار دهید.
برای پر کردن فرم تماس اینجا را کلیک کنید.

آمار پایگاه

نمایه شده در ISI 135

نمایه شده در PubMed 109

نمایه شده در Scopus 192

کاربران برخط 627

بازدید امروز 1762

بازدید کل 40533099

اطلاعات تماس

آدرس : تهران، سعادت آباد، بلوار پاکنژاد شمالی، بالاتر از میدان سرو، نبش کوچه ندا، پلاک ۶۸، ساختمان جاوید، واحد ۱۶

پست الکترونیک: yektaweb-AT-gmail.com

توجه

کلیه حقوق این وب سایت و مطالب آن متعلق به شرکت یکتاوب بوده و استفاده از مطالب آن با ذکر منبع بلامانع است
طراحی و برنامه نویسی: یکتاوب افزار شرق