Cradle框架
Cradle框架旨在使基础模型能够通过与人类相同的通用接口(屏幕作为输入,键盘和鼠标操作作为输出)执行复杂的计算机任务。该框架在Red Dead Redemption II游戏中进行了案例研究,展示了其在复杂环境中的泛化和适应能力。
POKÉLLMON是首个在战术战斗游戏中实现人类水平性能的LLM体现代理。它融合了三种关键策略:1)基于上下文的强化学习,即时利用从战斗中提取的文本描述反馈,迭代地优化其生成策略;2)知识增强生成,利用外部知识对抗幻觉,使代理能够及时和正确地行动;3)具有自一致性的动作生成,以减轻当代理面对强大对手并希望避免战斗时的惊慌切换现象。与人类玩家在线对战展示了POKÉLLMON的人类级别战斗性能和策略,在梯队比赛中取得49%的胜率,在邀请赛中取得56%的胜率。此外,我们揭示了其对人类玩家的消耗战略和欺骗技巧的脆弱性。