Steiner-32b-preview
Steiner 是由 Yichao 'Peak' Ji 开发的推理模型系列,专注于通过强化学习在合成数据上训练,能够在推理时探索多种路径并自主验证或回溯。该模型的目标是复现 OpenAI o1 的推理能力,并验证推理时的扩展曲线。Steiner-preview 是一个正在进行中的项目,其开源目的是为了分享知识并获取更多真实用户的反馈。尽管该模型在某些基准测试中表现出色,但尚未完全实现 OpenAI o1 的推理扩展能力,因此仍处于开发阶段。
WIT(基于维基百科的图像文本)数据集是一个大型的多模态多语言数据集,包含超过3700万个图像文本集合,支持100多种语言,为多模态机器学习模型的训练和评估提供丰富的数据。