Deepmind Sparrow AISparrow是一款信息查询对话代理,通过强化学习和人类反馈训练模型,提供更加有帮助、正确和无害的对话服务。它通过分解对话要求为自然语言规则,并提供支持事实性声明的来源证据,使得代理行为更加可靠和可信。
CoachReinforcement Learning Coach是一款强大的Python框架,可以模拟智能体与环境之间的交互,并通过组合不同的构建模块来建模智能体。支持多环境训练,提供多种强化学习算法,收集统计数据并支持高级可视化技术。