本綜述挑選並彙總了擁有理論支撐的 MARL 演算法,主要是以下兩種理論框架:Markov / stochastic games 馬爾可夫/隨機博弈extensive-form games 形式廣泛的遊戲並關注以下三種類型的任務:fully ...