热门

Qwen2.5-Coder Technical Report

1年前发布 25 00

Qwen2.5-Coder系列是基于Qwen2.5架构的代码特定模型，包括Qwen2.5-Coder-1.5B和Qwen2.5-Coder-7B两个模型。这些模型在超过5.5万亿个token的大规模语料库上继续预训练，并通过精细的数据清洗、可扩展的合成数据生成和平衡的数据混合，展现出令人印象深刻的代码生成能力，同时保持了通用性。Qwen2...

收录时间：

2025-05-30

打开网站手机查看

代码辅助 # 代码修复 # 代码推理 # 代码智能 # 代码生成 # 代码补全 # 预训练模型

Qwen2.5-Coder Technical Report

Qwen2.5-Coder Technical Report

Qwen2.5-Coder系列是基于Qwen2.5架构的代码特定模型，包括Qwen2.5-Coder-1.5B和Qwen2.5-Coder-7B两个模型。这些模型在超过5.5万亿个token的大规模语料库上继续预训练，并通过精细的数据清洗、可扩展的合成数据生成和平衡的数据混合，展现出令人印象深刻的代码生成能力，同时保持了通用性。Qwen2.5-Coder在包括代码生成、补全、推理和修复在内的多种代码相关任务上取得了超过10个基准测试的最新性能，并且一致性地超越了同等大小的更大模型。该系列的发布不仅推动了代码智能研究的边界，而且通过其许可授权，鼓励开发者在现实世界的应用中更广泛地采用。

数据统计

相关导航

Windsurf AI Directory

Windsurf AI Directory 提供了一个精选的资源、教程和指南集合，旨在为Windsurf AI Editor这一下一代AI驱动开发环境赋能。Windsurf AI Editor通过集成AI Flow到编码工作流程中，促进了开发者与AI的协作，提高了开发效率和质量。它通过提供AI编程伙伴Cascade、生产力特性、高级开发技术等，助力开发者构建交互式游戏、复杂的商业应用和革新的Web开发。

OpenAI Codex CLI

OpenAI Codex 是一个基于人工智能的编码助手，旨在提升开发者的工作效率。它能够理解自然语言指令并自动生成代码，适合需要高效编程和快速迭代的开发者。Codex 提供了交互式命令行界面，允许用户直接在终端中与其进行对话。该产品是免费使用的，定位于简化开发流程和提高代码质量。

o1-engineer

o1-engineer 是一个命令行工具，旨在帮助开发者通过 OpenAI 的 API 高效地管理和交互项目。它提供了代码生成、文件编辑、项目规划等功能，以简化开发工作流程。

SWE-RL

SWE-RL 是由 Facebook Research 提出的一种基于强化学习的大型语言模型推理技术，旨在利用开源软件演变数据提升模型在软件工程任务中的表现。该技术通过规则驱动的奖励机制，优化模型的推理能力，使其能够更好地理解和生成高质量的代码。SWE-RL 的主要优点在于其创新性的强化学习方法和对开源数据的有效利用，为软件工程领域带来了新的可能性。该技术目前处于研究阶段，尚未明确商业化定价，但其在提升开发效率和代码质量方面具有显著潜力。

GoCodeo

GoCodeo 是一款专为 Visual Studio Code 设计的 AI 编程插件，旨在通过最新的 AI 技术提升开发效率。它支持多种语言和框架，提供代码生成、测试、部署等功能，帮助开发者快速构建项目并确保代码质量。GoCodeo 的主要优点包括高效生成生产级代码、自动化测试和一键部署，极大地节省了开发时间和精力。该产品免费提供基础功能，适合希望提升开发效率的开发者。

Huginn-0125

Huginn-0125是一个由马里兰大学帕克分校Tom Goldstein实验室开发的潜变量循环深度模型。该模型拥有35亿参数，经过8000亿个token的训练，在推理和代码生成方面表现出色。其核心特点是通过循环深度结构在测试时动态调整计算量，能够根据任务需求灵活增加或减少计算步骤，从而在保持性能的同时优化资源利用。该模型基于开源的Hugging Face平台发布，支持社区共享和协作，用户可以自由下载、使用和进一步开发。其开源性和灵活的架构使其成为研究和开发中的重要工具，尤其是在资源受限或需要高性能推理的场景中。

Qwen2.5-Coder-1.5B-Instruct-AWQ

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专为代码生成、推理和修复而设计。基于强大的Qwen2.5，该模型在训练时包含了5.5万亿的源代码、文本代码基础、合成数据等，使其在代码能力上达到了开源代码LLM的最新水平。它不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

Qwen2.5-Coder-1.5B-Instruct-GGUF

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专为代码生成、代码推理和代码修复而设计。基于强大的Qwen2.5，通过增加训练令牌至5.5万亿，包括源代码、文本代码基础、合成数据等，Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，其编码能力与GPT-4o相匹配。此模型是1.5B参数的指令调优版本，采用GGUF格式，具有因果语言模型、预训练和后训练阶段、transformers架构等特点。

暂无评论

您必须登录才能参与评论！

none

暂无评论...