این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
Journal of Artificial Intelligence and Data Mining، جلد ۱۳، شماره ۲، صفحات ۱۴۵-۱۵۷

عنوان فارسی
چکیده فارسی مقاله
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Employing Chaos Theory for Exploration-Exploitation Balance in Reinforcement Learning
چکیده انگلیسی مقاله The exploration-exploitation trade-off poses a significant challenge in reinforcement learning. For this reason, action selection methods such as ε-greedy and Soft-Max approaches are used instead of the greedy method. These methods use random numbers to select an action that balances exploration and exploitation. Chaos is commonly utilized across various scientific disciplines because of its features, including non-periodicity, unpredictability, ergodicity and pseudorandom behavior. In this paper, we employ numbers generated by different chaotic systems to select action and identify better maps in diverse states and quantities of actions. Based on our experiments on various environments such as the Multi-Armed Bandit (MAB), taxi-domain, and cliff-walking, we found that many of the chaotic methods increase the speed of learning and achieve higher rewards.
کلیدواژه‌های انگلیسی مقاله Action Selection,chaos theory,Exploration and Exploitation,Reinforcement learning

نویسندگان مقاله Habib Khodadadi |
Department of Computer Engineering, Minab Branch, Islamic Azad University, Minab, Iran.

Vali Derhami |
Computer Engineering Department, Yazd University, Yazd, Iran.


نشانی اینترنتی https://jad.shahroodut.ac.ir/article_3413_1e240e48207a15b72bf78ebb458f40a7.pdf
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده en
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات