این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
مجله اپیدمیولوژی ایران، جلد ۱۱، شماره ۳، صفحات ۴۳-۵۱

عنوان فارسی مقایسه روش الگوریتم EM و روش‌های متداول جانهی داده‌های گمشده: مطالعه‌روی پرسشنامه خوددرمانی بیماران دیابتی
چکیده فارسی مقاله مقدمه و اهداف: داده‌های گمشده، چالش بزرگی در پژوهش‌ها به‌شمار می‌آیند. به فراخور نوع مطالعه و نوع متغیرهای مورد بررسی، روش‌های گوناگونی برای کار با این داده‌ها تا کنون معرفی شده است. هدف این مطالعه مقایسه پنج روش جانهی متداول در برخورد با گمشدگی در داده‌های پرسشنامه‌ای بود. روش کار: در این مطالعه تعداد500 پرسشنامه مربوط به خوددرمانی در بیماران دیابتی مورد استفاده قرار گرفت. گمشدگی در مشاهده‌ها به‌صورت تصنعی و با انتخاب تصادفی سؤالاتسؤالات و سپس حذف آن‌ها تولید شد. پنج روش جانهی عبارت بودند از: 1- میانگین سؤالاتسؤالات؛ 2- میانگین فردی؛ 3- نمای فردی؛ 4- رگرسیون خطی؛ و 5- الگوریتم EM. برای هر روش میانگین و انحراف معیار نمرات جانهی شده با مقادیر اصلی مقایسه گردید. هم‌چنین ضریب همبستگی اسپیرمن، درصد دسته‌بندی اشتباه و آماره کاپا نیز محاسبه شد. یافته ها: مقدار آماره کاپای بالاتر از 81/0 برای سطح گمشدگی 10 درصد بیانگر توافق تقریباً کامل در این سطح از گمشدگی بود. الگوریتم EM بالاترین میزان توافق با نتایج داده‌های واقعی را با مقدار آماره کاپای 886/0 نشان داد. هم‌چنین با افزایش میزان گمشدگی اطلاعات به 30 درصد، الگوریتم EM و روش میانگین فردی با مقدار کاپای 697/0 و 687/0از توافق نسبتاً مشابهی برخوردار بودند. نتیجه‏ گیری: در این مطالعه الگوریتم EM دقیق‌ترین روش برای کار با داده‌های گمشده در تمام الگوهای مورد ارزیابی شناخته شد. روش میانگین فردی به دلیل سادگی کار با داده‌های گمشده به‌ویژه برای بیش‌تر خوانندگان غیرآماری می‌تواند مورد توجه قرار گیرد.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Comparison Of EM Algorithm and Standard Imputation Methods For Missing Data: A Questionnaire Study On Diabetic Patients
چکیده انگلیسی مقاله Background and Objectives: Missing data is a big challenge in the research. According to the type of the study and of the variables, different ways have been proposed to work with these data. This study compared five popular imputation approaches in addressing missing data in the questionnaires. Methods: In this study, 500 questionnaires were used for self-medication in diabetic patients. Missing in the observations was artificially generated by random selection of questions and then deleting them. Five imputation ways included: 1) the mean of the questions, 2) the mean of the person, 3) the mode of the person, 4) linear regression, and 5) EM algorithm. For each method, the mean and standard deviation were compared with imputation. The Spearman correlation coefficient, the percentage of incorrectly classified and kappa statistic were also calculated. Results: A kappa higher than 0.81 represented almost perfect agreement at 10% missingness. The EM algorithm showed the highest level of agreement with the results of actual data with a Kappa of 0.886. With increasing missingness to 30%, the EM algorithm and the mean of the person showed a rather similar agreement with a Kappa of 0.697 and 0.687, respectively. Conclusion: In this study, the EM algorithm was the most accurate method for handling missing data in all models. The mean of the person method is easy for handling missing data, especially for most non statisticians.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله علیرضا افشاری صفوی | a afshari safavi
assistant professor, chronic diseases reseaarchcommittee, isfahan university of medical sciences, isfahan, iran
گروه آمار و اپیدمیولوژی، دانشکده بهداشت، دانشگاه علوم پزشکی اصفهان
سازمان اصلی تایید شده: دانشگاه علوم پزشکی اصفهان (Isfahan university of medical sciences)

حسین کاظم زاده قره چبق | h kazemzadeh gharechobogh
msc of statistics, social security organization, tehran
اداره کل آمار، اداره کل شرق تهران بزرگ ، سازمان تأمین اجتماعی

منصور رضایی | m rezaei
department of biostatistics and epidemiology, kermanshah university of medical sciences, kermanshah, iran
گروه آمار و اپیدمیولوژی، دانشکده بهداشت، مرکز تحقیقات توسعه اجتماعی و ارتقاء سلامت دانشگاه علوم پزشکی کرمانشاه
سازمان اصلی تایید شده: دانشگاه علوم پزشکی کرمانشاه (Kermanshah university of medical sciences)


نشانی اینترنتی http://irje.tums.ac.ir/browse.php?a_code=A-10-25-5128&slc_lang=fa&sid=fa
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده عمومی
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات