大阳城官网(中国)集团有限公司

当前位置: 网站首页 >> 通知公告 >> 正文

集团论坛第14期——多智能体马尔可夫博弈及纳什均衡求解

报告题目:多智能体马尔可夫博弈及纳什均衡求解

报告人:朱圆恒 中国科学院自动化研究所副研究员

主持人:郭磊 副教授

报告时间:2022年6月27号(周一)19:00-20:00

腾讯会议:126-692-159


报告摘要:

多智能体/多玩家博弈是重要且具有挑战性的决策问题。近些年随着AlphaGo, AlphaStar等集团系统在棋类和视频游戏上战胜人类顶尖选手,集团决策技术尤其是深度强化学习方法成为解决多智能体博弈的重要技术手段。本次报告我们围绕近年来越来越多关注的马尔可夫博弈问题,分析和探讨求解马尔可夫博弈及其纳什均衡的主要方法,梳理现有方法的不足。然后我们提出一种基于强化学习的学习方法,适合于任意数量玩家参与的马尔可夫博弈以及对应的纳什均衡求解。最后通过理论分析和典型的示例,表明方法的有效性。


专家简介:

朱圆恒,工学博士,中国科学院自动化研究所副研究员,硕士生导师。主要研究领域包括深度强化学习、多智能体强化学习,以及在博弈对抗、智能决策、游戏对抗等领域的应用。目前已经发表论文50余篇,SCI期刊论文20余篇。主持或参与国家自然科学基金、科技部科技创新2030重大项目、中国科学院战略性先导科技专项,JW科技委创新特区等多个国家级项目。带领学生参加IEEE COG格斗游戏比赛、IEEE ICRA Robomaster AI ChallengeSSCAIT星际争霸天梯赛等获第一名。入选中国科学院青年创新促进会会员,现任中国自动化学会数据驱动控制学习与优化专业委员会、自适应动态规划与强化学习专业委员会、青年工作委员会委员,IEEE计算智能学会内容创作附属委员会主席,2022 IEEE Conference on Games 程序主席, IEEE TNNLS副主编。