سامانه اطلاعات پژوهشی ایران

این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند

یکشنبه 30 آذر 1404


پژوهش های تولیدات دامی، جلد ۷، شماره ۱۳، صفحات ۱۸۵-۱۷۸


عنوان فارسی	تنظیم و کاربرد الگوریتم جنگل تصادفی در ارزیابی ژنومی

چکیده فارسی مقاله	یکی از مباحث مهم در انتخاب ژنومی، استفاده از روشی مناسب برای برآورد اثر نشانگرها و ارزیابی ژنومی است. اخیراً روشهای یادگیری ماشین1 که جزو روشهای ناپارامتری غیرخطی هستند وارد ارزیابی ژنومی شدهاند. یکی از این روشها الگوریتم جنگل تصادفی2 است که این تحقیق روی نحوه تنظیم این روش متمرکز شده است. پارامترهای مهم در الگوریتم جنگل تصادفی به ترتیب اهمیت، تعداد متغیر انتخاب شده در هر گره درخت3، تعداد درخت4 و حداقل اندازه گرههای پایانی5 میباشند که بهتر است برای آنها مقدار مناسبی تعیین شود و در اصطلاح مدل برای این پارامترها تنظیم6 شود. ژنومی 5 کروموزومی متشکل از 10000 نشانگر تک نوکلئوتیدی دوآللی7 هریک به طول یک مورگان شبیهسازی شد و در ادامه، کارایی ترکیبات مختلف از تعداد متغیر انتخاب شده در هر گره درخت، تعداد درخت و حداقل اندازه گرههای پایانی در قالب جمعیت شبیهسازی شده مورد آزمون قرار گرفته و بهترین ترکیب بر اساس پارامتر خطای خارج از کیسه8 انتخاب و برای تجزیه و تحلیل اطلاعات مورد استفاده قرار گرفت. برای دادههای شبیهسازی شده در این مطالعه، کمترین مقدار خطای خارج از کیسه و همچنین حداکثر صحت پیشبینی ارزشهای اصلاحی ژنومی مربوط به مدلی با تعداد متغیر انتخاب در هر گره درخت برابر 6000، تعداد درخت برابر 1000 و حداقل اندازه گرههای پایانی برابر 5 بود. بقیه ترکیبات از این سه پارامتر نه تنها منجر به افزایش صحت پیشبینی نشدند بلکه در آنهایی که از تعداد بیشتری درخت استفاده شده بود، مدت زمان لازم برای انجام محاسبات نیز افزایش یافت. با توجه به اینکه صحت پیشبینی الگوریتم جنگل تصادفی تابعی از تعداد متغیر انتخاب شده در هر گره درخت، تعداد درخت و حداقل اندازه گرههای پایانی است، لازم است ترکیبات مختلفی از این پارامترها مورد استفاده قرار گیرد و ترکیب بهینه با حداکثر عملکرد پیشبینی انتخاب شده و برای ارزیابی ژنومی استفاده شود.

کلیدواژه‌های فارسی مقاله

عنوان انگلیسی	Tuning and Application of Random Forest Algorithm in Genomic Evaluation

چکیده انگلیسی مقاله	One of the most important issues in genomic selection is using a decent method for estimating marker effects and genomic evaluation. Recently, machine learning algorithms which are members of non-parametric and non-linear methods have been extended to genomic evaluation. One of these methods is Random Forest (RF) on which this research was focused. Important parameters in RF algorithm are the number of SNPs selected randomly at each tree node (mtry), the number of trees to grow` (ntree) and the minimum size of terminal nodes of trees (node size) which need to be pre-defined before analyses and for them the model should be tuned. A genome comprised of five chromosomes, one Morgan each, on which 10000 bi-allelic SNP were arrayed was simulated and the efficiency of different combinations of mtry, ntree and node size was tested and the best combination was selected based on comparison of accuracy of predicted genomic value as well as OOB error estimates. For the simulated data in the current study the least OOB error as well as the maximum prediction accuracy was related to a model with 6000 mtry, 1000 ntree and 5 node size. Other combinations did not increase the accuracy of prediction while led to an increase in time of analyses for those which used more trees. Since the accuracy of prediction is a function of mtry, ntree and node size, in genomic evaluation, different combinations of these parameters should be used and the combination which caused the maximum prediction accuracy should be used for genomic evaluation.

کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله	فرهاد غفوری کسبی \| ghafouri kesbi قدرت رحیمی میانجی \| rahimi mianji محمود هنرور \| اردشیر نجاتی جوارمی \| nejati javaremi

نشانی اینترنتی	http://rap.sanru.ac.ir/browse.php?a_code=A-10-1-153&slc_lang=fa&sid=fa
فایل مقاله	اشکال در دسترسی به فایل - ./files/site1/rds_journals/1370/article-1370-238911.pdf
کد مقاله (doi)
زبان مقاله منتشر شده	fa
موضوعات مقاله منتشر شده	تخصصی
نوع مقاله منتشر شده	پژوهشی

برگشت به: صفحه اول پایگاه \| نسخه مرتبط \| نشریه مرتبط \| فهرست نشریات

ارسال پیام برخط

در صورت مشاهده هر نوع اشکال در داده های پایگاه و یا برای ارسال نظرات و پیشنهاد های خود می توانید با پر کردن فرم تماس ما را در جریان قرار دهید.
برای پر کردن فرم تماس اینجا را کلیک کنید.

آمار پایگاه

نمایه شده در ISI 135

نمایه شده در PubMed 109

نمایه شده در Scopus 192

کاربران برخط 876

بازدید امروز 12578

بازدید کل 39503159

اطلاعات تماس

آدرس : تهران، سعادت آباد، بلوار پاکنژاد شمالی، بالاتر از میدان سرو، نبش کوچه ندا، پلاک ۶۸، ساختمان جاوید، واحد ۱۶

پست الکترونیک: yektaweb-AT-gmail.com

توجه

کلیه حقوق این وب سایت و مطالب آن متعلق به شرکت یکتاوب بوده و استفاده از مطالب آن با ذکر منبع بلامانع است
طراحی و برنامه نویسی: یکتاوب افزار شرق