OLMo-2-1124-13B-Instruct

11个月前发布 23 00

OLMo-2-1124-13B-Instruct是由Allen AI研究所开发的一款大型语言模型,专注于文本生成和对话任务。该模型在多个任务上表现出色,包括数学问题解答、科学问题解答等。它是基于13B参数的版本,经过在特定数据集上的监督微调和强化学习训练,以提高其性能和安全性。作为一个开源模型,它允许研究人员和开发者探索和改进语言模型的科...

收录时间:
2025-06-02
OLMo-2-1124-13B-InstructOLMo-2-1124-13B-Instruct

OLMo-2-1124-13B-Instruct是由Allen AI研究所开发的一款大型语言模型,专注于文本生成和对话任务。该模型在多个任务上表现出色,包括数学问题解答、科学问题解答等。它是基于13B参数的版本,经过在特定数据集上的监督微调和强化学习训练,以提高其性能和安全性。作为一个开源模型,它允许研究人员和开发者探索和改进语言模型的科学。

数据统计

相关导航

TwinMind

TwinMind

TwinMind是一个个人AI侧边栏,可以理解会议和网站内容,为您提供实时答案,并根据上下文为您撰写任何内容。它允许您访问最新的AI模型,提出关于浏览器标签页、PDF、YouTube视频等的任何问题,提供会议和面试中的下一步建议,以及在侧边栏上搜索网络并即时获得答案。TwinMind注重隐私保护,不在任何地方存储您的音频,而是直接在设备上处理音频数据,确保音频不会被回放或稍后访问。
DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-32B 是由 DeepSeek 团队开发的高性能语言模型,基于 Qwen-2.5 系列进行蒸馏优化。该模型在多项基准测试中表现出色,尤其是在数学、代码和推理任务上。其主要优点包括高效的推理能力、强大的多语言支持以及开源特性,便于研究人员和开发者进行二次开发和应用。该模型适用于需要高性能文本生成的场景,如智能客服、内容创作和代码辅助等,具有广泛的应用前景。
Aya Expanse 32B

Aya Expanse 32B

Aya Expanse 32B是由Cohere For AI开发的多语言大型语言模型,拥有32亿参数,专注于提供高性能的多语言支持。它结合了先进的数据仲裁、多语言偏好训练、安全调整和模型合并技术,以支持23种语言,包括阿拉伯语、中文(简体和繁体)、捷克语、荷兰语、英语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、韩语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、土耳其语、乌克兰语和越南语。该模型的发布旨在使社区基础的研究工作更加易于获取,通过发布高性能的多语言模型权重,供全球研究人员使用。
InternVL2_5-38B-MPO

InternVL2_5-38B-MPO

InternVL2.5-MPO是一个先进的多模态大型语言模型系列,基于InternVL2.5和混合偏好优化(MPO)构建。该系列模型在多模态任务中表现出色,能够处理图像、文本和视频数据,并生成高质量的文本响应。模型采用'ViT-MLP-LLM'范式,通过像素unshuffle操作和动态分辨率策略优化视觉处理能力。此外,模型还引入了多图像和视频数据的支持,进一步扩展了其应用场景。InternVL2.5-MPO在多模态能力评估中超越了多个基准模型,证明了其在多模态领域的领先地位。
EXAONE-3.5-2.4B-Instruct-GGUF

EXAONE-3.5-2.4B-Instruct-GGUF

EXAONE-3.5-2.4B-Instruct-GGUF是由LG AI Research开发的一系列双语(英语和韩语)指令调优的生成型模型,参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理,并在真实世界用例和长上下文理解方面展现出最先进的性能,同时在与近期发布的类似大小模型相比,在通用领域保持竞争力。该模型的重要性在于其优化了在小型或资源受限设备上的部署,同时提供了强大的性能。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...