Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4

8个月前发布 9 00

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该模型在训练中涵盖了5.5万亿的源代码、文本代码基础、合成数据等,成为当前开源代码语言模型的最新技术。该模型不仅在编程能力上与GPT-4o相匹配,还在数学和一般能力上保持了优势。Qwen2.5-Coder-0.5B-I...

收录时间:
2025-05-30
Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成代码推理代码修复。基于强大的Qwen2.5,该模型在训练中涵盖了5.5万亿的源代码、文本代码基础、合成数据等,成为当前开源代码语言模型的最新技术。该模型不仅在编程能力上与GPT-4o相匹配,还在数学和一般能力上保持了优势。Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4模型是经过GPTQ量化的4位指令调整模型,具有因果语言模型、预训练和后训练、transformers架构等特点。

数据统计

相关导航

Qwen2.5-Coder-14B-Instruct-AWQ

Qwen2.5-Coder-14B-Instruct-AWQ

Qwen2.5-Coder是一系列特定于代码的大型语言模型,覆盖了从0.5亿到32亿参数的不同模型大小,以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升,基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码基础、合成数据等。Qwen2.5-Coder-32B是目前最先进的开源代码生成大型语言模型,其编码能力与GPT-4o相匹配。此外,该模型还支持长达128K令牌的长上下文,并采用AWQ 4-bit量化技术,以提高模型的效率和性能。
Huginn-0125

Huginn-0125

Huginn-0125是一个由马里兰大学帕克分校Tom Goldstein实验室开发的潜变量循环深度模型。该模型拥有35亿参数,经过8000亿个token的训练,在推理和代码生成方面表现出色。其核心特点是通过循环深度结构在测试时动态调整计算量,能够根据任务需求灵活增加或减少计算步骤,从而在保持性能的同时优化资源利用。该模型基于开源的Hugging Face平台发布,支持社区共享和协作,用户可以自由下载、使用和进一步开发。其开源性和灵活的架构使其成为研究和开发中的重要工具,尤其是在资源受限或需要高性能推理的场景中。
Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int8

Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int8

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该系列模型通过增加训练令牌至5.5万亿,包括源代码、文本代码接地、合成数据等,显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,编码能力与GPT-4o相匹配。此外,Qwen2.5-Coder还为真实世界应用提供了更全面的基础,如代码代理,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。
Qwen2.5-Coder-3B-Instruct

Qwen2.5-Coder-3B-Instruct

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该系列模型通过增加训练令牌至5.5万亿,包括源代码、文本代码接地、合成数据等,显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-3B是该系列中的一个模型,拥有3.09B参数,36层,16个注意力头(Q)和2个注意力头(KV),全32,768令牌上下文长度。该模型是目前开源代码LLM中的佼佼者,编码能力与GPT-4o相匹配,为开发者提供了一个强大的代码辅助工具。
Windsurf Wave 3

Windsurf Wave 3

Windsurf Wave 3 是由 Codeium 团队开发的 AI 编辑器的重大更新版本,旨在通过一系列新功能和改进,为开发者提供更高效、更智能的编程体验。该产品支持多种 AI 模型和工具集成,能够显著提升代码生成、编辑和调试的效率。其主要优点包括强大的 AI 驱动功能、高度的可定制性以及对多种编程场景的支持。产品定位为高端开发工具,主要面向专业开发者和企业用户,价格策略可能涉及付费订阅或企业定制。
Qwen2.5-Coder-1.5B-Instruct-GGUF

Qwen2.5-Coder-1.5B-Instruct-GGUF

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专为代码生成、代码推理和代码修复而设计。基于强大的Qwen2.5,通过增加训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,其编码能力与GPT-4o相匹配。此模型是1.5B参数的指令调优版本,采用GGUF格式,具有因果语言模型、预训练和后训练阶段、transformers架构等特点。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...