EXAONE-3.5-32B-Instruct

11个月前发布 16 00

EXAONE-3.5-32B-Instruct是由LG AI Research开发的一系列指令调优的双语(英语和韩语)生成模型,包含从2.4B到32B参数的不同模型。这些模型支持长达32K令牌的长上下文处理,并在真实世界用例和长上下文理解方面展现出了最先进的性能,同时在与近期发布的类似大小模型相比时,在通用领域也保持了竞争力。

收录时间:
2025-05-30
EXAONE-3.5-32B-InstructEXAONE-3.5-32B-Instruct

EXAONE-3.5-32B-Instruct是由LG AI Research开发的一系列指令调优的双语(英语和韩语)生成模型,包含从2.4B到32B参数的不同模型。这些模型支持长达32K令牌的长上下文处理,并在真实世界用例和长上下文理解方面展现出了最先进的性能,同时在与近期发布的类似大小模型相比时,在通用领域也保持了竞争力。

数据统计

相关导航

INTELLECT-1-Instruct

INTELLECT-1-Instruct

INTELLECT-1-Instruct是一个由Prime Intellect训练的10亿参数语言模型,从零开始在1万亿个英文文本和代码token上进行训练。该模型支持文本生成,并且具有分布式训练的能力,能够在不可靠的、全球分布的工作者上进行高性能训练。它使用了DiLoCo算法进行训练,并利用自定义的int8 all-reduce内核来减少通信负载,显著降低了通信开销。这个模型的背景信息显示,它是由30个独立的社区贡献者提供计算支持,并在3个大洲的14个并发节点上进行训练。
llmstxt-generator

llmstxt-generator

llmstxt-generator 是一个用于生成LLM(大型语言模型)训练和推理所需的网站内容整合文本文件的工具。它通过爬取网站内容,将其合并成一个文本文件,支持生成标准的llms.txt和完整的llms-full.txt版本。该工具由firecrawl_dev提供支持进行网页爬取,并使用GPT-4-mini进行文本处理。其主要优点包括无需API密钥即可使用基本功能,同时提供Web界面和API访问,方便用户快速生成所需的文本文件。
ultravox-v0_4_1-llama-3_1-70b

ultravox-v0_4_1-llama-3_1-70b

fixie-ai/ultravox-v0_4_1-llama-3_1-70b是一个基于预训练的Llama3.1-70B-Instruct和whisper-large-v3-turbo的大型语言模型,能够处理语音和文本输入,生成文本输出。该模型通过特殊伪标记<|audio|>将输入音频转换为嵌入,并与文本提示合并后生成输出文本。Ultravox的开发旨在扩展语音识别和文本生成的应用场景,如语音代理、语音到语音翻译和口语音频分析等。该模型遵循MIT许可,由Fixie.ai开发。
EXAONE-3.5-7.8B-Instruct-GGUF

EXAONE-3.5-7.8B-Instruct-GGUF

EXAONE 3.5是LG AI Research开发的一系列双语(英语和韩语)指令调优的生成模型,参数从2.4B到32B不等。这些模型支持长达32K令牌的长上下文处理,在真实世界用例和长上下文理解方面展现出了最先进的性能,同时在与近期发布的类似大小模型相比,在通用领域保持竞争力。EXAONE 3.5模型包括:1) 2.4B模型,优化用于部署在小型或资源受限的设备上;2) 7.8B模型,与前代模型大小匹配但提供改进的性能;3) 32B模型,提供强大的性能。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...