تعداد نشریات | 44 |
تعداد شمارهها | 1,298 |
تعداد مقالات | 15,884 |
تعداد مشاهده مقاله | 52,118,208 |
تعداد دریافت فایل اصل مقاله | 14,888,763 |
بهبود عملکرد حمله در تیم رباتهای فوتبالیست با استفاده از یادگیری تقویتی | ||
مجله مهندسی برق دانشگاه تبریز | ||
مقاله 11، دوره 48، شماره 2 - شماره پیاپی 84، شهریور 1397، صفحه 585-594 اصل مقاله (929.52 K) | ||
نویسندگان | ||
مینا خاکسار؛ ولی درهمی* ؛ مهدی رضائیان | ||
دانشگاه یزد - پردیس فنی و مهندسی - گروه مهندسی کامپیوتر | ||
چکیده | ||
بهدلیل عدم امکان پیشبینی همه وضعیتهای ممکن برای عاملها در یک سیستم چندعاملهی پویا و گسترده، روشهای یادگیری ماشین، ابزار مناسبی برای کنترل رفتار عاملها میباشد. فوتبال شبیهسازی شده رباتها یک مسئله شناختهشده برای ارزیابی الگوریتمهای یادگیری ماشین روی سیستمهای چندعامله است. در این مقاله الگوریتم یادگیری کیو ـ وی (یکی از الگوریتمهای معروف یادگیری تقویتی) جهت بهبود عملکرد حمله در تیم رباتهای فوتبالیست دو بعدی بکار گرفته شدهاست. سیگنال تقویتی براساس اینکه بازیکنانی که در حمله دخالت دارند، توپ را جلوی دروازه میرسانند، یا اینکه توپ را از دست میدهند، تعریف شدهاست و بهترتیب عاملها با توجه به وضعیت ذکرشده، جایزه و جریمه دریافت میکنند. جهت بهبود عملکرد از ایده تقسیم سیگنال تقویتی متناسب با مقدار خبرگی عاملها در یک سیستم چندعامله استفاده شدهاست. در اینجا میزان خبرگی متناسب با تفاوت ارزش عملِ با بالاترین ارزش با ارزشِ عملِ با کمترین مقدار ارزش در هر حالت تعریف میشود. نتایج شبیهسازی نشان میدهد، بهرهگیری از ایده تقسیم سیگنال تقویتی براساس خبرگی در آموزش باعث افزایش سرعت در آموزش و بهبود عملکرد عاملها شدهاست. | ||
کلیدواژهها | ||
فوتبال شبیهسازیشده رباتها؛ یادگیری تقویتی؛ یادگیری کیو ـ وی؛ سیستمهای چندعامله؛ حمله | ||
مراجع | ||
[1] F. Almeida, N. Lau, and L. P. Reis, ”A Survey on Coordination Methodologies for Simulated Robotic Soccer Teams,” RoboCup Symposium,2010. [2] M. Alavi, M. F. Tarazkouhi, A. Azaran, A. Nouri, S. Zolfaghari, and H. R. S. Boroujeni, ”Robocup 2012- Soccer Simulation League 2D Soccer Simulation Riton,” Robot Soccer World Cup, Springer Berlin Heidelberg, 2013. [3] M. Chen et. al., (2003) RoboCup Soccer Server for Soccer Server Tersion cefc and later, [Online], Available: http://wwfc.cs.virginia.edu/documentation/manual.pdf [jol. 11, 2015] [4] J. R. F. Neri, M. R. Zatelli, C. H. F. dos Santos, and J. A. Fabro, ”A Proposal of QLearning to Control the Attack of a 2D Robot Soccer Simulation Team,” Robotics Symposium and Latin American Robotics Symposium (SBR-LARS), pp. 174–178, 2012. [5] M. Ghazanfari, S. O. Shirkhorshidi, and F. Samsamipour, ”Axiom 2013 Team Description Paper,” Robot Soccer World Cup, Springer Berlin Heidelberg, vol. 8371, 2014. [6] S. Kalyanakrishnan, Y. Liu, and P. Stone, ”Half field offense in RoboCup soccer: A multiagent reinforcement learning case study,” Robot Soccer World Cup, Springer Berlin Heidelberg, vol. 4434, pp. 72–85, 2008. [7] H. Akiyama, T. Nakashima, and K. Yamashita, ”Helios2013 team description paper,” Robot Soccer World Cup, Springer Berlin Heidelberg, vol. 8371, 2014. [8] T. Sirinivasan, K. Aarthi, S. A. Meenakshi, and M. Kausalya, ”Cbrrobosoc: An efficient planning strategy for robotic soccer using case based reasoning,” International Conference on Computational Intelligence for Modeling Control and Automation, and International Conference on Intelligent Agents, Web Technologies and Internet Commerce, pp. 113–119, 2006. [9] A. Bai, H. Zhang, G. Lu, M. Jiang, and X. Chen, ”WrightEagle 2D Soccer Simulation Team Description,” Robot Soccer World Cup, Springer Berlin Heidelberg, vol. 7500, 2013. [10] S. Marian, D. Luca, B. Sarac, and O. Cotarlea, ”OXSY 2014 Team Description,” Robot Soccer World Cup, Springer Berlin Heidelberg, 2015. [11] H. Akiyama, T. Nakashima, and K. Yamashita, ”HELIOS2014 Team Description Paper,” Robot Soccer World Cup, Springer Berlin Heidelberg, 2015. [12] M. Yoon, Developing basic soccer skills using reinforcement learning for the RoboCup Small Size League, Master Thesis, Stellenbosch University, pp.11, March 2015. [13] مینا خاکسار، ولی درهمی و مهدی رضائیان، «بهبود عملکرد حمله در تیم رباتهای شبیهساز فوتبال با استفاده از یادگیری تقویتی»، دومین کنفرانس محاسبات تکاملی و هوش جمعی، دانشگاه شهید باهنر، کرمان، اسفند 95. [14] R. S. Sutton and A. G. Barto, Reinforcement learning: An introduction, MIT press Cambridge, 1998. [15] عادل اکبری مجد، حسین شایقی، حمید محمدنژاد، عبداله یونسی، «کنترل کننده مقاوم تطبیقی بار فرکانس مبتنی بر یادگیری تقویتی برای یک سیستم قدرت بههم پیوسته شامل SMES» مجله مهندسی برق دانشگاه تبریز، جلد 47، شماره 2، صفحات 381-390، تابستان 1396. [16] مریم رمضانیان لنگرودی، سیدمازیار میرحسینی مقدم، بهنام علیزاده، «استفاده از روش یادگیری رقابتی برای قیمتدهی استراتژیک شرکتهای تولید براساس LMP در بازار برق»، مجله مهندسی برق دانشگاه تبریز، جلد 47، شماره 2، صفحات 537-549، تابستان 1396. | ||
آمار تعداد مشاهده مقاله: 518 تعداد دریافت فایل اصل مقاله: 577 |