این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پژوهش های تولیدات دامی، جلد ۷، شماره ۱۳، صفحات ۱۸۵-۱۷۸

عنوان فارسی تنظیم و کاربرد الگوریتم جنگل تصادفی در ارزیابی ژنومی
چکیده فارسی مقاله یکی از مباحث مهم در انتخاب ژنومی، استفاده از روشی مناسب برای برآورد اثر نشانگرها و ارزیابی ژنومی است. اخیراً روش­های یادگیری ماشین1 که جزو روش­های ناپارامتری غیرخطی هستند وارد ارزیابی ژنومی شده­اند. یکی از این روش­ها الگوریتم جنگل تصادفی2 است که این تحقیق روی نحوه تنظیم این روش متمرکز شده است. پارامترهای مهم در الگوریتم جنگل تصادفی به ترتیب اهمیت، تعداد متغیر انتخاب شده در هر گره درخت3، تعداد درخت4 و حداقل اندازه گره­های پایانی5 می­باشند که بهتر است برای آنها مقدار مناسبی تعیین شود و در اصطلاح مدل برای این پارامترها تنظیم6 شود. ژنومی 5 کروموزومی متشکل از 10000 نشانگر تک نوکلئوتیدی دوآللی7 هریک به طول یک مورگان شبیه­سازی شد و در ادامه، کارایی ترکیبات مختلف از تعداد متغیر انتخاب شده در هر گره درخت، تعداد درخت و حداقل اندازه گره­های پایانی در قالب جمعیت شبیه­سازی شده مورد آزمون قرار گرفته و بهترین ترکیب بر اساس پارامتر خطای خارج از کیسه8 انتخاب و برای تجزیه و تحلیل اطلاعات مورد استفاده قرار گرفت. برای داده­های شبیه­سازی شده در این مطالعه، کمترین مقدار خطای خارج از کیسه و هم­چنین حداکثر صحت پیش­بینی ارزش­های اصلاحی ژنومی مربوط به مدلی با تعداد متغیر انتخاب در هر گره درخت برابر 6000، تعداد درخت برابر 1000 و حداقل اندازه گره­های پایانی برابر 5 بود. بقیه ترکیبات از این سه پارامتر نه تنها منجر به افزایش صحت پیش­بینی نشدند بلکه در آن­هایی که از تعداد بیشتری درخت استفاده شده بود، مدت زمان لازم برای انجام محاسبات نیز افزایش یافت. با توجه به این­که صحت پیش­بینی الگوریتم جنگل تصادفی تابعی از تعداد متغیر انتخاب شده در هر گره درخت، تعداد درخت و حداقل اندازه گره­های پایانی است، لازم است ترکیبات مختلفی از این پارامترها مورد استفاده قرار گیرد و ترکیب بهینه با حداکثر عملکرد پیش­بینی انتخاب شده و برای ارزیابی ژنومی استفاده شود. 
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Tuning and Application of Random Forest Algorithm in Genomic Evaluation
چکیده انگلیسی مقاله One of the most important issues in genomic selection is using a decent method for estimating marker effects and genomic evaluation. Recently, machine learning algorithms which are members of non-parametric and non-linear methods have been extended to genomic evaluation. One of these methods is Random Forest (RF) on which this research was focused. Important parameters in RF algorithm are the number of SNPs selected randomly at each tree node (mtry), the number of trees to grow` (ntree) and the minimum size of terminal nodes of trees (node size) which need to be pre-defined before analyses and for them the model should be tuned. A genome comprised of five chromosomes, one Morgan each, on which 10000 bi-allelic SNP were arrayed was simulated and the efficiency of different combinations of mtry, ntree and node size was tested and the best combination was selected based on comparison of accuracy of predicted genomic value as well as OOB error estimates. For the simulated data in the current study the least OOB error as well as the maximum prediction accuracy was related to a model with 6000 mtry, 1000 ntree and 5 node size. Other combinations did not increase the accuracy of prediction while led to an increase in time of analyses for those which used more trees. Since the accuracy of prediction is a function of mtry, ntree and node size, in genomic evaluation, different combinations of these parameters should be used and the combination which caused the maximum prediction accuracy should be used for genomic evaluation.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله فرهاد غفوری کسبی | ghafouri kesbi


قدرت رحیمی میانجی | rahimi mianji


محمود هنرور |


اردشیر نجاتی جوارمی | nejati javaremi



نشانی اینترنتی http://rap.sanru.ac.ir/browse.php?a_code=A-10-1-153&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1370/article-1370-238911.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده تخصصی
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات