Llama-3.1-Tulu-3-8B

3个月前发布 1 00

Llama-3.1-Tulu-3-8B是Tülu3指令遵循模型家族的一部分,专为多样化任务设计,包括聊天、数学问题解答、GSM8K和IFEval等。这个模型家族以其卓越的性能和完全开源的数据、代码以及现代后训练技术的全面指南而著称。模型主要使用英文,并且是基于allenai/Llama-3.1-Tulu-3-8B-DPO模型微调而来。

收录时间:
2025-05-29
Llama-3.1-Tulu-3-8BLlama-3.1-Tulu-3-8B

Llama-3.1-Tulu-3-8B是Tülu3指令遵循模型家族的一部分,专为多样化任务设计,包括聊天、数学问题解答、GSM8K和IFEval等。这个模型家族以其卓越的性能和完全开源的数据、代码以及现代后训练技术的全面指南而著称。模型主要使用英文,并且是基于allenai/Llama-3.1-Tulu-3-8B-DPO模型微调而来。

数据统计

相关导航

SmolVLM-256M-Instruct

SmolVLM-256M-Instruct

SmolVLM-256M 是由 Hugging Face 开发的多模态模型,基于 Idefics3 架构,专为高效处理图像和文本输入而设计。它能够回答关于图像的问题、描述视觉内容或转录文本,且仅需不到 1GB 的 GPU 内存即可运行推理。该模型在多模态任务上表现出色,同时保持轻量化架构,适合在设备端应用。其训练数据来自 The Cauldron 和 Docmatix 数据集,涵盖文档理解、图像描述等多领域内容,使其具备广泛的应用潜力。目前该模型在 Hugging Face 平台上免费提供,旨在为开发者和研究人员提供强大的多模态处理能力。
EXAONE-3.5-2.4B-Instruct

EXAONE-3.5-2.4B-Instruct

EXAONE-3.5-2.4B-Instruct是LG AI Research开发的一系列双语(英语和韩语)指令调优的生成模型,参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理,并在真实世界用例和长上下文理解方面展现出最先进的性能,同时在与最近发布的类似大小模型相比的通用领域中保持竞争力。该模型特别适合需要处理长文本和多语言需求的场景,如自动翻译、文本摘要、对话系统等。
EXAONE-3.5-32B-Instruct-AWQ

EXAONE-3.5-32B-Instruct-AWQ

EXAONE-3.5-32B-Instruct-AWQ是LG AI Research开发的一系列指令调优的双语(英语和韩语)生成模型,参数从2.4B到32B不等。这些模型支持长达32K令牌的长上下文处理,在真实世界用例和长上下文理解方面展现出最先进的性能,同时在与最近发布的类似大小模型相比,在通用领域保持竞争力。该模型通过AWQ量化技术,实现了4位组级别的权重量化,优化了模型的部署效率。
DeepScaleR-1.5B-Preview

DeepScaleR-1.5B-Preview

DeepScaleR-1.5B-Preview 是一个经过强化学习优化的大型语言模型,专注于提升数学问题解决能力。该模型通过分布式强化学习算法,显著提高了在长文本推理场景下的准确率。其主要优点包括高效的训练策略、显著的性能提升以及开源的灵活性。该模型由加州大学伯克利分校的 Sky Computing Lab 和 Berkeley AI Research 团队开发,旨在推动人工智能在教育领域的应用,尤其是在数学教育和竞赛数学领域。模型采用 MIT 开源许可,完全免费供研究人员和开发者使用。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...