協作多智能體深度強化學習研究綜述
打開文本圖片集
摘 要:多智能體系統(tǒng)是由多個智能體與環(huán)境交互組成的分布式決策系統(tǒng),是分布式人工智能的一個重要研究方向,在復雜未知的現實社會具有廣闊的應用前景,如工業(yè)、農業(yè)、軍事和航空航天等群體機器人系統(tǒng),以及交通控制、資源管理、商業(yè)金融和游戲AI等。多智能體強化學習(Multi-Agent Reinforcement Learning, MARL)依托強化學習在未知環(huán)境中的序貫決策能力,融合了運籌學、博弈論和群體心理學等眾多學科,能夠更好地發(fā)揮多個智能體的協同優(yōu)勢,進而低成本、高效率地完成復雜任務。(剩余27603字)