این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
یکشنبه 30 آذر 1404
مجله دانشگاه علوم پزشکی خراسان شمالی
، جلد ۳، شماره ۵، صفحات ۹۳-۱۰۱
عنوان فارسی
آنالیز جنگل های تصادفی: یک روش آماری مدرن برای غربالگری در مطالعات با بعد بالا و کاربرد آن در یک مطالعه همبستگی ژنتیکی جمعیت-پایه
چکیده فارسی مقاله
چکیده زمینه و هدف: پیشرفت های سریع تکنولوژی قرن اخیر در زمینه مطالعات ژنتیکی ما را با حجم زیاد اطلاعات مواجه کرده و چالشی را در تحلیل این قبیل داده های با تعداد بسیار زیاد متغیر پیشگو بوجود آورده است. مطالعه حاضر با در نظر گرفتن داده ها با تعداد متغیرهای بسیار زیاد همراه با اثرات متقابل آنها که ممکن است در تحلیل آماری داده های ژنتیکی با آن مواجه شویم و با هدف بررسی روش های نوین برای تحلیل اینگونه داده های با بعد زیاد انجام پذیرفت. مواد و روش کار: در این مطالعه روش آماری ناپارامتری و نوین جنگل های تصادفی برای تعیین فاکتورهای مهم و اثرگذار ژنتیکی بر روی بیماری آنکیلوزان اسپوندیلیت بکار برده شد. داده ها حاوی اطلاعات مربوط به ژن HLA-B27 و 12 پلی مرفیسم تک نوکلئوتیدی ژنی موسوم به ERAP-1 از 401 بیمار مبتلا به آنکیلوزان اسپوندیلیت و 316 کنترل سالم بود. تحلیل های فوق متعاقبأ به کمک رگرسیون لجستیک نیز اجرا شد و نتایج آن با جنگل های تصادفی مقایسه گردید. یافته ها: بر اساس نتایج مدل رگرسیون لجستیک گام به گام متغیرهای HLA-B27 و پلی مرفیسم rs28096 به طور معنی دار در ارتباط با بیماری مذکور بودند در حالیکه روش جنگل های تصادفی متغیرهای HLA-B27 و rs1065407 را متغیرهای اصلی اثرگذار روی این بیماری تشخیص داد و rs28096 در رتبه سوم اهمیت قرار داشت. نتیجه گیری: نتایج حاصل از این مطالعه حاکی از ارتباط زیاد HLA-B27 با بیماری آنکیلوزان اسپوندیلیت بود. روش کلاسیک و متداول رگرسیون لجستیک پلی مرفیسم rs28096 را مهم ترین فاکتور خطر در رابطه با بیماری معرفی کرد در حالیکه روش جنگل های تصادفی rs1065407 را نیز مهمترین پلی مرفیسم تشخیص داد. لذا محققین بایستی نتایج آماری حاصل از روش های متداول کلاسیک را با روش های جامع و کامل تر نوین از قبیل جنگل های تصادفی در مطالعات غربالگری مدنظر داشته باشند
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Random forests analysis: A modern statistical method for screening in high-dimensional studies and its application in a population-based genetic association study
چکیده انگلیسی مقاله
Abstract Background & Objectives: Technology advances in this century, especially, in molecular generics yields high volume, high dimensional data. This creates many unprecedented challenges for statisticians who are responsible for analysis of such data. Although logistic regression method is quite popular in association analysis in medical researches but it has some serious limitations in handling high dimensional data. In present study, our goal is introduce a modern model-free statistical method called random forest that we believe is able to overcome difficulties of the classical statistical methods in finding association between predictors and a trait. Material & Methods: In this study, the nonparametric random forest technique was employed to determine the important factors associated with ankylosing spondylitis (AS) disease. Genetic materials including information on HLA-B27 status (positive/negative) and 12 polymorphisms of the ERAP-1 gene were collected on 401 patients and 316 healthy controls. The data were analyzed both with the logistic regression method and random forests technique and the results were compared. Results: Based on a stepwise logistic regression, HLA-B27 and rs28096 polymorphism were significantly associated with the disease. However, using the random forests technique, we found that HLA-B27 and rs1065407 were the main factors associated with diseases and in fact rs28096 polymorphism becomes the third in importance ranking. Conclusion: The results from our study indicate some discrepancies between logistic regression and random forest analyses of high-dimensional data such as the genetic data that we are dealing here. Although logistic regression is quite popular, easy to employ, and is a predominant statistical method among researchers, but it has some serious limitations. On the other hand, more modern statistical such random forest enjoy a more methodological sophistication and yield more accurate and reliable results. Therefore, researchers should be aware of such alternatives and should use these alternatives accordingly and as situation arise in screening tests especially in genetic data analyses.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
سحر نوری | s noori
کرامت نوری جلیانی | k nourijelyani
کاظم محمد | k mohammad
محمد حسین نیکنام | mh niknam
مهدی محمودی | m mahmoudi
لاریس آندونیان | l andonian
آرش اکابری | a akaberi
نشانی اینترنتی
http://journal.nkums.ac.ir/browse.php?a_code=A-10-25-232&slc_lang=fa&sid=fa
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/192/article-192-320428.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
علوم پایه
نوع مقاله منتشر شده
مقاله پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات