热门

Qwen2.5-Coder-1.5B-Instruct-GGUF

11个月前发布 25 00

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专为代码生成、代码推理和代码修复而设计。基于强大的Qwen2.5，通过增加训练令牌至5.5万亿，包括源代码、文本代码基础、合成数据等，Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，其编码能力与GPT-4o相匹配。此模型是1.5B参数的指令调优版本，采用...

收录时间：

2025-06-02

打开网站手机查看

代码辅助 # 代码修复 # 代码推理 # 代码生成 # 大型语言模型 # 开源 # 编程辅助

Qwen2.5-Coder-1.5B-Instruct-GGUF

Qwen2.5-Coder-1.5B-Instruct-GGUF

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专为代码生成、代码推理和代码修复而设计。基于强大的Qwen2.5，通过增加训练令牌至5.5万亿，包括源代码、文本代码基础、合成数据等，Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，其编码能力与GPT-4o相匹配。此模型是1.5B参数的指令调优版本，采用GGUF格式，具有因果语言模型、预训练和后训练阶段、transformers架构等特点。

数据统计

相关导航

Qwen2.5-Coder-1.5B-Instruct-GPTQ-Int8

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该模型在训练中使用了5.5万亿的源代码、文本代码关联、合成数据等，使其成为当前开源代码语言模型中的佼佼者。该模型不仅在编程能力上有所增强，还保持了在数学和通用能力方面的优势。

Qwen2.5-Coder-14B-Instruct

Qwen2.5-Coder-14B-Instruct是Qwen2.5-Coder系列中的一个大型语言模型，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该模型通过扩展训练令牌到5.5万亿，包括源代码、文本代码接地、合成数据等，成为当前开源代码LLM的最新技术。它不仅增强了编码能力，还保持了在数学和通用能力方面的优势，并支持长达128K令牌的长上下文。

NovaSky

NovaSky 是一个专注于提升代码生成和推理模型性能的人工智能技术平台。它通过创新的测试时扩展技术（如 S*）、强化学习蒸馏推理等技术，显著提升了非推理模型的性能，使其在代码生成领域表现出色。该平台致力于为开发者提供高效、低成本的模型训练和优化解决方案，帮助他们在编程任务中实现更高的效率和准确性。NovaSky 的技术背景源于 Sky Computing Lab @ Berkeley，具有强大的学术支持和前沿的技术研究基础。目前，NovaSky 提供多种模型优化方法，包括但不限于推理成本优化和模型蒸馏技术，满足不同开发者的需求。

DeepCoder

DeepCoder-14B-Preview 是一个基于强化学习的代码推理大型语言模型，能够处理长上下文，具有 60.6% 的通过率，适用于编程任务和自动化代码生成。该模型的优势在于其训练方法的创新，提供了比其他模型更优的性能，且完全开源，支持广泛的社区应用和研究。

Qwen2.5-Coder-14B-Instruct-AWQ

Qwen2.5-Coder是一系列特定于代码的大型语言模型，覆盖了从0.5亿到32亿参数的不同模型大小，以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升，基于强大的Qwen2.5，训练令牌扩展到5.5万亿，包括源代码、文本代码基础、合成数据等。Qwen2.5-Coder-32B是目前最先进的开源代码生成大型语言模型，其编码能力与GPT-4o相匹配。此外，该模型还支持长达128K令牌的长上下文，并采用AWQ 4-bit量化技术，以提高模型的效率和性能。

Qwen2.5-Coder-0.5B

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该系列模型通过增加训练令牌至5.5万亿，包括源代码、文本代码基础、合成数据等，显著提升了编码能力。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，编码能力与GPT-4o相当。此外，Qwen2.5-Coder还为实际应用如代码代理提供了更全面的基础，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

Bakery

Bakery是一个专注于开源AI模型的微调与变现的在线平台，为AI初创企业、机器学习工程师和研究人员提供了一个便捷的工具，使他们能够轻松地对AI模型进行微调，并在市场中进行变现。该平台的主要优点在于其简单易用的界面和强大的功能，用户可以快速创建或上传数据集，微调模型设置，并在市场中进行变现。Bakery的背景信息表明，它旨在推动开源AI技术的发展，并为开发者提供更多的商业机会。虽然具体的定价信息未在页面中明确展示，但其定位是为AI领域的专业人士提供一个高效的工具。

Qwen2.5-Coder Technical Report

Qwen2.5-Coder系列是基于Qwen2.5架构的代码特定模型，包括Qwen2.5-Coder-1.5B和Qwen2.5-Coder-7B两个模型。这些模型在超过5.5万亿个token的大规模语料库上继续预训练，并通过精细的数据清洗、可扩展的合成数据生成和平衡的数据混合，展现出令人印象深刻的代码生成能力，同时保持了通用性。Qwen2.5-Coder在包括代码生成、补全、推理和修复在内的多种代码相关任务上取得了超过10个基准测试的最新性能，并且一致性地超越了同等大小的更大模型。该系列的发布不仅推动了代码智能研究的边界，而且通过其许可授权，鼓励开发者在现实世界的应用中更广泛地采用。

暂无评论

您必须登录才能参与评论！

none

暂无评论...