Skywork-o1-Open-PRM-Qwen-2.5-7B

12个月前发布 24 00

Skywork-o1-Open-PRM-Qwen-2.5-7B是由昆仑科技Skywork团队开发的一系列模型,这些模型结合了o1风格的慢思考和推理能力。这个模型系列不仅在输出中展现出天生的思考、规划和反思能力,而且在标准基准测试中显示出推理技能的显著提升。它代表了AI能力的战略进步,将一个原本较弱的基础模型推向了推理任务的最新技术(SOT...

收录时间:
2025-05-30
Skywork-o1-Open-PRM-Qwen-2.5-7BSkywork-o1-Open-PRM-Qwen-2.5-7B

Skywork-o1-Open-PRM-Qwen-2.5-7B是由昆仑科技Skywork团队开发的一系列模型,这些模型结合了o1风格的慢思考和推理能力。这个模型系列不仅在输出中展现出天生的思考、规划和反思能力,而且在标准基准测试中显示出推理技能的显著提升。它代表了AI能力的战略进步,将一个原本较弱的基础模型推向了推理任务的最新技术(SOTA)。

数据统计

相关导航

Skywork-o1-Open-PRM-Qwen-2.5-1.5B

Skywork-o1-Open-PRM-Qwen-2.5-1.5B

Skywork-o1-Open-PRM-Qwen-2.5-1.5B是Skywork团队开发的一系列模型,这些模型结合了o1风格的慢思考和推理能力。该模型专门设计用于通过增量过程奖励增强推理能力,适合解决小规模的复杂问题。与简单的OpenAI o1模型复现不同,Skywork o1 Open系列模型不仅在输出中展现出固有的思考、规划和反思能力,而且在标准基准测试中的推理技能有显著提升。这一系列代表了AI能力的一次战略性进步,将原本较弱的基础模型推向了推理任务的最新技术(SOTA)。
Manicode

Manicode

Manicode是一个基于人工智能的编程辅助工具,它能够理解整个代码库,并提供上下文感知的建议和编辑。用户可以使用简单的英语指令来编写代码,Manicode将其翻译成高效、清晰的代码。此外,它还支持AI驱动的重构,自动提升代码质量、修复错误和优化性能。Manicode的出现代表了编程领域的一次革命,它通过自然语言处理和人工智能技术,极大地提高了开发者的工作效率,降低了编程的门槛。
GLM-Zero-Preview

GLM-Zero-Preview

GLM-Zero-Preview是智谱首个基于扩展强化学习技术训练的推理模型,专注于增强AI推理能力,擅长处理数理逻辑、代码和需要深度推理的复杂问题。与基座模型相比,在不显著降低通用任务能力的情况下,专家任务能力大幅提升。在AIME 2024、MATH500和LiveCodeBench评测中,效果与OpenAI o1-preview相当。产品背景信息显示,智谱华章科技有限公司致力于通过强化学习技术,提升模型的深度推理能力,未来将推出正式版GLM-Zero,扩展深度思考的能力到更多技术领域。
Agentless

Agentless

Agentless是一种无需代理的自动解决软件开发问题的方法。它通过定位、修复和补丁验证三个阶段来解决每个问题。Agentless利用分层过程定位故障到特定文件、相关类或函数,以及细粒度的编辑位置。然后,Agentless根据编辑位置采样多个候选补丁,并选择回归测试来运行,生成额外的复现测试以复现原始错误,并使用测试结果重新排名所有剩余补丁,以选择一个提交。Agentless是目前在SWE-bench lite上表现最佳的开源方法,具有82个修复(27.3%的解决率),平均每问题成本0.34美元。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...