热门

Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4

11个月前发布 17 00

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该模型在训练中涵盖了5.5万亿的源代码、文本代码基础、合成数据等，成为当前开源代码语言模型的最新技术。该模型不仅在编程能力上与GPT-4o相匹配，还在数学和一般能力上保持了优势。Qwen2.5-Coder-0.5B-I...

收录时间：

2025-05-30

打开网站手机查看

代码辅助 # GPTQ量化 # Transformers # 代码修复 # 代码推理 # 代码生成 # 因果语言模型

Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该模型在训练中涵盖了5.5万亿的源代码、文本代码基础、合成数据等，成为当前开源代码语言模型的最新技术。该模型不仅在编程能力上与GPT-4o相匹配，还在数学和一般能力上保持了优势。Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4模型是经过GPTQ量化的4位指令调整模型，具有因果语言模型、预训练和后训练、transformers架构等特点。

数据统计

相关导航

Qwen2.5-Coder-32B-Instruct-GGUF

Qwen2.5-Coder 是针对代码生成的模型，在代码生成等方面显著提升，参数规模多样，支持量化。免费，面向开发者提高效率和质量。

AIOnPulse

Gemini 2.5 Pro是一款基于最先进的AI技术的编程插件，能够提高编程效率，帮助用户快速生成高质量的代码。其背景信息包括由Google开发，定位于提升编程体验和加速开发流程。

Qwen2.5-Coder-0.5B-Instruct-AWQ

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于Qwen2.5的强大能力，通过扩展训练令牌至5.5万亿，包括源代码、文本代码基础、合成数据等，Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM，其编码能力与GPT-4o相匹配。此模型为AWQ量化的4位指令调整0.5B参数版本，具有因果语言模型、预训练和后训练、transformers架构等特点。

GoCodeo

GoCodeo 是一款专为 Visual Studio Code 设计的 AI 编程插件，旨在通过最新的 AI 技术提升开发效率。它支持多种语言和框架，提供代码生成、测试、部署等功能，帮助开发者快速构建项目并确保代码质量。GoCodeo 的主要优点包括高效生成生产级代码、自动化测试和一键部署，极大地节省了开发时间和精力。该产品免费提供基础功能，适合希望提升开发效率的开发者。

Qwen2.5-Coder-14B-Instruct

Qwen2.5-Coder-14B-Instruct是Qwen2.5-Coder系列中的一个大型语言模型，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该模型通过扩展训练令牌到5.5万亿，包括源代码、文本代码接地、合成数据等，成为当前开源代码LLM的最新技术。它不仅增强了编码能力，还保持了在数学和通用能力方面的优势，并支持长达128K令牌的长上下文。

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Llama-8B 是 DeepSeek 团队开发的高性能语言模型，基于 Llama 架构并经过强化学习和蒸馏优化。该模型在推理、代码生成和多语言任务中表现出色，是开源社区中首个通过纯强化学习提升推理能力的模型。它支持商业使用，允许修改和衍生作品，适合学术研究和企业应用。

Qwen2.5-Coder-3B

Qwen2.5-Coder-3B是Qwen2.5-Coder系列中的一个大型语言模型，专注于代码生成、推理和修复。基于强大的Qwen2.5，该模型通过增加训练令牌至5.5万亿，包括源代码、文本代码基础、合成数据等，实现了在代码生成、推理和修复方面的显著改进。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，其编码能力与GPT-4o相匹配。此外，Qwen2.5-Coder-3B还为现实世界的应用提供了更全面的基础，如代码代理，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

SWE-RL

SWE-RL 是由 Facebook Research 提出的一种基于强化学习的大型语言模型推理技术，旨在利用开源软件演变数据提升模型在软件工程任务中的表现。该技术通过规则驱动的奖励机制，优化模型的推理能力，使其能够更好地理解和生成高质量的代码。SWE-RL 的主要优点在于其创新性的强化学习方法和对开源数据的有效利用，为软件工程领域带来了新的可能性。该技术目前处于研究阶段，尚未明确商业化定价，但其在提升开发效率和代码质量方面具有显著潜力。

暂无评论

您必须登录才能参与评论！

none

暂无评论...