热门

Qwen2.5-Coder-3B-Instruct

11个月前发布 34 00

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该系列模型通过增加训练令牌至5.5万亿，包括源代码、文本代码接地、合成数据等，显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-3B是该系列中的一个模型，拥有3.09B参数，36层，16个注意力头（Q）和...

收录时间：

2025-05-29

打开网站手机查看

代码辅助 # transformers架构 # 代码修复 # 代码推理 # 代码生成 # 开源模型 # 编程辅助

Qwen2.5-Coder-3B-Instruct

Qwen2.5-Coder-3B-Instruct

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该系列模型通过增加训练令牌至5.5万亿，包括源代码、文本代码接地、合成数据等，显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-3B是该系列中的一个模型，拥有3.09B参数，36层，16个注意力头（Q）和2个注意力头（KV），全32,768令牌上下文长度。该模型是目前开源代码LLM中的佼佼者，编码能力与GPT-4o相匹配，为开发者提供了一个强大的代码辅助工具。

数据统计

相关导航

AIOnPulse

Gemini 2.5 Pro是一款基于最先进的AI技术的编程插件，能够提高编程效率，帮助用户快速生成高质量的代码。其背景信息包括由Google开发，定位于提升编程体验和加速开发流程。

Qwen2.5-Coder-3B-Instruct-GPTQ-Int8

Qwen2.5-Coder-3B-Instruct-GPTQ-Int8是Qwen2.5-Coder系列中的一种大型语言模型，专门针对代码生成、代码推理和代码修复进行了优化。该模型基于Qwen2.5，训练数据包括源代码、文本代码关联、合成数据等，达到5.5万亿个训练令牌。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，其编码能力与GPT-4o相匹配。该模型还为现实世界中的应用提供了更全面的基础，如代码代理，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

Qwen2.5-Coder Technical Report

Qwen2.5-Coder系列是基于Qwen2.5架构的代码特定模型，包括Qwen2.5-Coder-1.5B和Qwen2.5-Coder-7B两个模型。这些模型在超过5.5万亿个token的大规模语料库上继续预训练，并通过精细的数据清洗、可扩展的合成数据生成和平衡的数据混合，展现出令人印象深刻的代码生成能力，同时保持了通用性。Qwen2.5-Coder在包括代码生成、补全、推理和修复在内的多种代码相关任务上取得了超过10个基准测试的最新性能，并且一致性地超越了同等大小的更大模型。该系列的发布不仅推动了代码智能研究的边界，而且通过其许可授权，鼓励开发者在现实世界的应用中更广泛地采用。

Integuru

Integuru是一个AI代理，能够通过逆向工程技术生成第三方平台的集成代码。它通过分析浏览器的网络请求和用户的操作，自动生成能够触发特定动作的Python代码。这项技术的重要性在于，它可以帮助开发者无需深入了解第三方平台的内部API，即可快速构建集成解决方案，提高开发效率并降低技术门槛。Integuru由Integuru.ai开发，是一个开源项目，支持自定义请求和额外功能的开发。

Vibe Coder

Vibe Coder 是由 Deepgram 开发的一款开源 VS Code 扩展，旨在探索语音驱动编程的可能性。它利用语音识别技术，让用户通过语音指令与 AI 编程助手进行交互，快速将想法转化为代码原型。这种创新的编程方式被称为‘vibe coding’，旨在提高编程效率并改变未来软件开发的方式。Vibe Coder 目前处于实验阶段，Deepgram 希望通过社区反馈不断完善该工具。

github-assistant

GitHub Assistant 是一款创新的编程辅助工具，它利用自然语言处理技术，使用户能够通过简单的语言问题来探索和理解GitHub上的各种代码仓库。该工具的主要优点在于其易用性和高效性，用户无需具备复杂的编程知识即可快速获取所需信息。产品由 assistant-ui 和 relta 共同开发，旨在为开发者提供一个更加便捷和直观的代码探索方式。GitHub Assistant 的定位是为编程人员提供一个强大的辅助工具，帮助他们更好地理解和利用开源代码资源。

Lune AI

Lune AI是一个社区驱动的专家级大型语言模型（LLMs）市场，由开发者在技术主题上创建，以超越单独的AI模型。它通过集成各种技术知识源，如GitHub仓库、文档等，减少技术查询的幻觉，并提供准确的参考。Lune AI的API与OpenAI兼容，可以轻松集成到各种支持OpenAI兼容模型的工具中，如Cursor、Continue等。此外，Lune AI还提供了一个付费计划，用户可以通过贡献和创建Lunes来获得报酬。

Huginn-0125

Huginn-0125是一个由马里兰大学帕克分校Tom Goldstein实验室开发的潜变量循环深度模型。该模型拥有35亿参数，经过8000亿个token的训练，在推理和代码生成方面表现出色。其核心特点是通过循环深度结构在测试时动态调整计算量，能够根据任务需求灵活增加或减少计算步骤，从而在保持性能的同时优化资源利用。该模型基于开源的Hugging Face平台发布，支持社区共享和协作，用户可以自由下载、使用和进一步开发。其开源性和灵活的架构使其成为研究和开发中的重要工具，尤其是在资源受限或需要高性能推理的场景中。

暂无评论

您必须登录才能参与评论！

none

暂无评论...