基于深度强化学习的对手建模方法研究综述 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
徐浩添, 秦龙, 曾俊杰, 胡越, 张琪 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Research Progress of Opponent Modeling Based on Deep Reinforcement Learning |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Haotian Xu, Long Qin, Junjie Zeng, Yue Hu, Qi Zhang | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
表5 常见实验场景、博弈模型、文献来源与问题特性 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Table 5 Common experimental scenarios, game models, literature sources and problem characteristics |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||