Qwen2.5-Coder-3B-Instruct

Qwen2.5-Coder-3B-Instruct

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该系列模型通过增加训练令牌至5.5万亿,包括源代码、文本代码接地、合成数据等,显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-3B是该系列中的一个模型,拥有3.09B参数,36层,16个注意力头(Q)和2个注意力头(KV),全32,768令牌上下文长度。该模型是目前开源代码LLM中的佼佼者,编码能力与GPT-4o相匹配,为开发者提供了一个强大的代码辅助工具。
0270
Dria-Agent-a-7B

Dria-Agent-a-7B

Dria-Agent-a-7B是一个基于Qwen2.5-Coder系列训练的大型语言模型,专注于代理应用。它采用Pythonic函数调用方式,与传统JSON函数调用方法相比,具有单次并行多函数调用、自由形式推理和动作以及即时复杂解决方案生成等优势。该模型在多个基准测试中表现出色,包括Berkeley Function Calling Leaderboard (BFCL)、MMLU-Pro和Dria-Pythonic-Agent-Benchmark (DPAB)。模型大小为76.2亿参数,采用BF16张量类型,支持文本生成任务。其主要优点包括强大的编程辅助能力、高效的函数调用方式以及在特定领域的高准确率。该模型适用于需要复杂逻辑处理和多步骤任务执行的应用场景,如自动化编程、智能代理等。目前,该模型在Hugging Face平台上提供,供用户免费使用。
0210
Qwen2.5-Coder-3B-Instruct-GGUF

Qwen2.5-Coder-3B-Instruct-GGUF

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,其编码能力与GPT-4o相匹配。该模型在实际应用中提供了更全面的基础,如代码代理,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。
0200
DeepSeek Japanese

DeepSeek Japanese

DeepSeek 是由 High-Flyer 基金支持的中国 AI 实验室开发的先进语言模型,专注于开源模型和创新训练方法。其 R1 系列模型在逻辑推理和问题解决方面表现出色,采用强化学习和混合专家框架优化性能,以低成本实现高效训练。DeepSeek 的开源策略推动了社区创新,同时引发了关于 AI 竞争和开源模型影响力的行业讨论。其免费且无需注册的使用方式进一步降低了用户门槛,适合广泛的应用场景。
0200
Qwen2.5-Coder-1.5B-Instruct-GGUF

Qwen2.5-Coder-1.5B-Instruct-GGUF

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专为代码生成、代码推理和代码修复而设计。基于强大的Qwen2.5,通过增加训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,其编码能力与GPT-4o相匹配。此模型是1.5B参数的指令调优版本,采用GGUF格式,具有因果语言模型、预训练和后训练阶段、transformers架构等特点。
0190
Qwen2.5-Coder-1.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder-1.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该模型在训练中包含了5.5万亿的源代码、文本代码关联、合成数据等,是目前开源代码语言模型中的佼佼者,其编码能力可与GPT-4相媲美。此外,Qwen2.5-Coder还具备更全面的现实世界应用基础,如代码代理等,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。
0180
Qwen2.5-Coder-32B-Instruct-GPTQ-Int8

Qwen2.5-Coder-32B-Instruct-GPTQ-Int8

Qwen2.5-Coder-32B-Instruct-GPTQ-Int8是Qwen系列中针对代码生成优化的大型语言模型,拥有32亿参数,支持长文本处理,是当前开源代码生成领域最先进的模型之一。该模型基于Qwen2.5进行了进一步的训练和优化,不仅在代码生成、推理和修复方面有显著提升,而且在数学和通用能力上也保持了优势。模型采用GPTQ 8-bit量化技术,以减少模型大小并提高运行效率。
0160
Qwen2.5 Coder Artifacts

Qwen2.5 Coder Artifacts

Qwen2.5 Coder Artifacts是一个托管在Hugging Face平台上的编程工具集合,代表了人工智能在编程领域的应用。这个产品集合利用最新的机器学习技术,帮助开发者提高编码效率,优化代码质量。产品背景信息显示,它是由Qwen创建并维护的,旨在为开发者提供一个强大的编程辅助工具。产品是免费的,定位于提高开发者的生产力。
0150
Qwen2.5-Coder-0.5B-Instruct

Qwen2.5-Coder-0.5B-Instruct

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,通过扩展训练令牌到5.5万亿,包括源代码、文本代码基础、合成数据等,Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM,其编码能力与GPT-4o相匹配。该模型不仅增强了编码能力,还保持了在数学和通用能力方面的优势,为实际应用如代码代理提供了更全面的基础。
0150
Scira

Scira

Scira 是一个基于 AI 技术的搜索引擎,旨在通过强大的语言模型和搜索能力,为用户提供更高效、更精准的信息检索体验。它支持多种语言模型,如 Grok 2.0 和 Claude 3.5 Sonnet,并集成了 Tavily 等搜索工具,能够提供网页搜索、编程代码运行、天气查询等多种功能。Scira 的主要优点在于其简洁的界面和强大的功能集成,适合对传统搜索引擎不满意、希望借助 AI 提升搜索效率的用户。该项目开源免费,用户可以根据自己的需求进行本地部署或使用其提供的在线服务。
0140
Qwen2.5-Coder-32B

Qwen2.5-Coder-32B

Qwen2.5-Coder-32B是基于Qwen2.5的代码生成模型,拥有32亿参数,是目前开源代码语言模型中参数最多的模型之一。它在代码生成、代码推理和代码修复方面有显著提升,能够处理长达128K tokens的长文本,适用于代码代理等实际应用场景。该模型在数学和通用能力上也保持了优势,支持长文本处理,是开发者在进行代码开发时的强大助手。
0130
Qwen2.5-Coder-1.5B-Instruct

Qwen2.5-Coder-1.5B-Instruct

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于Qwen2.5的强大能力,该模型在训练时使用了5.5万亿的源代码、文本代码基础、合成数据等,是目前开源代码生成语言模型中的佼佼者,编码能力与GPT-4o相媲美。它不仅增强了编码能力,还保持了在数学和通用能力方面的优势,为实际应用如代码代理提供了更全面的基础。
0130
WaveCoder

WaveCoder

WaveCoder是由微软亚洲研究院开发的代码大语言模型,通过指令微调增强代码大语言模型的广泛性和多功能性。它在代码摘要、生成、翻译、修复等多个编程任务上展现出卓越的性能。WaveCoder的创新之处在于其使用的数据合成框架和两阶段指令数据生成策略,确保了数据的高质量和多样性。该模型的开源,为开发者提供了一个强大的编程辅助工具,有助于提高开发效率和代码质量。
0130
GitHub Issue Helper Chrome Extension

GitHub Issue Helper Chrome Extension

GitHub Issue Helper Chrome Extension是一个Chrome浏览器插件,利用大型语言模型(LLM)来总结GitHub上的问题,并根据问题内容提出可能的解决方案。这个插件的主要优点在于它能够自动总结GitHub问题,并提供自定义选项,允许用户通过LLM API密钥进一步定制功能。它对于开发者和项目维护者来说是一个强大的工具,因为它可以节省时间并提高处理问题效率。该插件在GitHub上开源,遵循MIT许可证。
0130
Qwen2.5-Coder-7B-Instruct

Qwen2.5-Coder-7B-Instruct

Qwen2.5-Coder-7B-Instruct是Qwen2.5-Coder系列中的一款代码特定大型语言模型,覆盖了0.5、1.5、3、7、14、32亿参数的六种主流模型尺寸,以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升,基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码基础、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM,其编码能力与GPT-4o相匹配。此外,该模型还支持长达128K令牌的长上下文,并为实际应用如代码代理提供了更全面的基础。
0120
QwQ-32B-Preview-gptqmodel-4bit-vortex-v3

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3

该产品是一个基于Qwen2.5-32B的4位量化语言模型,通过GPTQ技术实现高效推理和低资源消耗。它在保持较高性能的同时,显著降低了模型的存储和计算需求,适合在资源受限的环境中使用。该模型主要面向需要高性能语言生成的应用场景,如智能客服、编程辅助、内容创作等。其开源许可和灵活的部署方式使其在商业和研究领域具有广泛的应用前景。
0120
Kimi k1.5

Kimi k1.5

Kimi k1.5 是由 MoonshotAI 开发的多模态语言模型,通过强化学习和长上下文扩展技术,显著提升了模型在复杂推理任务中的表现。该模型在多个基准测试中达到了行业领先水平,例如在 AIME 和 MATH-500 等数学推理任务中超越了 GPT-4o 和 Claude Sonnet 3.5。其主要优点包括高效的训练框架、强大的多模态推理能力以及对长上下文的支持。Kimi k1.5 主要面向需要复杂推理和逻辑分析的应用场景,如编程辅助、数学解题和代码生成等。
0110
Qwen2.5-Coder-14B

Qwen2.5-Coder-14B

Qwen2.5-Coder-14B是Qwen系列中专注于代码的大型语言模型,覆盖了0.5到32亿参数的不同模型尺寸,以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升,基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM,其编码能力与GPT-4o相匹配。此外,它还为现实世界应用如代码代理提供了更全面的基础,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。支持长达128K令牌的长上下文。
0100
Qwen2.5-Coder-1.5B

Qwen2.5-Coder-1.5B

Qwen2.5-Coder-1.5B是Qwen2.5-Coder系列中的一款大型语言模型,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该模型通过扩展训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,成为当前开源代码LLM中的佼佼者,编码能力媲美GPT-4o。此外,Qwen2.5-Coder-1.5B还强化了数学和通用能力,为实际应用如代码代理提供了更全面的基础。
0100
Geekits

Geekits

Geekits是一个由YGeeker出品的开源和免费的平台,提供了一系列实用工具,包括人工智能、生活常用、图片视频处理、编程开发等多个领域。它不仅为普通用户提供了便捷的服务,也为开发者提供了编程相关的辅助工具。Geekits的主要优点在于其功能的多样性和实用性,用户可以在这里找到从日常小工具到专业开发辅助的各类工具,极大地提高了工作和生活的效率。
090
Precog by Ubik

Precog by Ubik

Precog by Ubik是一个智能AI助手,它能够根据用户的任务需求,挑选出最合适的模型来使用。这种技术的重要性在于它能够优化模型选择过程,提高开发效率,减少资源浪费。Precog by Ubik背后的技术可能涉及机器学习和自然语言处理,旨在为用户提供一个更加智能化和个性化的编程辅助工具。目前,该产品的具体价格和定位信息未在页面中提供。
090
Code2.AI

Code2.AI

Code2.AI是一个创新的在线平台,它通过人工智能技术帮助开发者将想法快速转化为代码。该平台通过压缩代码库,使AI能够理解并与开发者一同编程。Code2.AI的主要优点包括加速开发进程、无限制的编码能力以及与现有项目的无缝集成。它支持任何编程语言,无论是Web还是移动开发,都能提供完整的函数代码,而不仅仅是代码片段。此外,Code2.AI还提供了详细的使用指南,帮助用户更有效地利用AI进行编程。
090
Qwen2.5-Max

Qwen2.5-Max

Qwen2.5-Max是一个大规模的Mixture-of-Expert (MoE)模型,经过超过20万亿tokens的预训练和监督微调与人类反馈强化学习的后训练。它在多个基准测试中表现优异,展示了强大的知识和编码能力。该模型通过阿里巴巴云提供API接口,支持开发者在各种应用场景中使用。其主要优点包括强大的性能、灵活的部署方式和高效的训练技术,旨在为人工智能领域提供更智能的解决方案。
090
GLM-Zero-Preview

GLM-Zero-Preview

GLM-Zero-Preview是智谱首个基于扩展强化学习技术训练的推理模型,专注于增强AI推理能力,擅长处理数理逻辑、代码和需要深度推理的复杂问题。与基座模型相比,在不显著降低通用任务能力的情况下,专家任务能力大幅提升。在AIME 2024、MATH500和LiveCodeBench评测中,效果与OpenAI o1-preview相当。产品背景信息显示,智谱华章科技有限公司致力于通过强化学习技术,提升模型的深度推理能力,未来将推出正式版GLM-Zero,扩展深度思考的能力到更多技术领域。
080
github-assistant

github-assistant

GitHub Assistant 是一款创新的编程辅助工具,它利用自然语言处理技术,使用户能够通过简单的语言问题来探索和理解GitHub上的各种代码仓库。该工具的主要优点在于其易用性和高效性,用户无需具备复杂的编程知识即可快速获取所需信息。产品由 assistant-ui 和 relta 共同开发,旨在为开发者提供一个更加便捷和直观的代码探索方式。GitHub Assistant 的定位是为编程人员提供一个强大的辅助工具,帮助他们更好地理解和利用开源代码资源。
080