热门

Llama-lynx-70b-4bitAWQ

11个月前发布 25 00

Llama-lynx-70b-4bitAWQ是一个由Hugging Face托管的70亿参数的文本生成模型，使用了4-bit精度和AWQ技术。该模型在自然语言处理领域具有重要性，特别是在需要处理大量数据和复杂任务时。它的优势在于能够生成高质量的文本，同时保持较低的计算成本。产品背景信息显示，该模型与'transformers'和'safe...

收录时间：

2025-05-30

打开网站手机查看

文案写作 # 4-bit精度 # awq # Hugging Face # Transformers # 文本生成 # 机器学习 # 自然语言处理

Llama-lynx-70b-4bitAWQ

Llama-lynx-70b-4bitAWQ

Llama-lynx-70b-4bitAWQ是一个由Hugging Face托管的70亿参数的文本生成模型，使用了4-bit精度和AWQ技术。该模型在自然语言处理领域具有重要性，特别是在需要处理大量数据和复杂任务时。它的优势在于能够生成高质量的文本，同时保持较低的计算成本。产品背景信息显示，该模型与’transformers’和’safetensors’库兼容，适用于文本生成任务。

数据统计

相关导航

Gemini Embedding 文本嵌入模型

Gemini Embedding 是 Google 推出的一种实验性文本嵌入模型，通过 Gemini API 提供服务。该模型在多语言文本嵌入基准测试（MTEB）中表现卓越，超越了之前的顶尖模型。它能够将文本转换为高维数值向量，捕捉语义和上下文信息，广泛应用于检索、分类、相似性检测等场景。Gemini Embedding 支持超过 100 种语言，具备 8K 输入标记长度和 3K 输出维度，同时引入了嵌套表示学习（MRL）技术，可灵活调整维度以满足存储需求。该模型目前处于实验阶段，未来将推出稳定版本。

EXAONE-3.5-7.8B-Instruct-AWQ

EXAONE 3.5是LG AI Research开发的一系列指令调优的双语（英语和韩语）生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与最近发布的类似大小模型相比的一般领域中保持竞争力。EXAONE 3.5模型包括：1) 2.4B模型，优化用于小型或资源受限设备的部署；2) 7.8B模型，与前代模型大小相匹配，但提供改进的性能；3) 32B模型，提供强大的性能。

Llama-3.1-Tulu-3-70B-SFT

Llama-3.1-Tulu-3-70B-SFT是Tülu3模型家族的一部分，专为现代后训练技术提供全面指南而设计。该模型不仅在聊天任务上表现出色，还在MATH、GSM8K和IFEval等多种任务上实现了最先进的性能。它是基于公开可用的、合成的和人类创建的数据集训练的，主要使用英语，并遵循Llama 3.1社区许可协议。

EXAONE-3.5-2.4B-Instruct-AWQ

EXAONE-3.5-2.4B-Instruct-AWQ是由LG AI Research开发的一系列双语（英语和韩语）指令调优生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并且在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与近期发布的类似大小模型相比，在通用领域保持竞争力。该模型在部署到小型或资源受限设备上进行了优化，并且采用了AWQ量化技术，实现了4位群组权重量化（W4A16g128）。

c4ai-command-r7b-12-2024

CohereForAI/c4ai-command-r7b-12-2024是一个7B参数的多语言模型，专注于推理、总结、问答和代码生成等高级任务。该模型支持检索增强生成（RAG）和工具使用，能够使用和组合多个工具来完成更复杂的任务。它在企业相关的代码用例上表现优异，支持23种语言。

GLM-4-32B

GLM-4-32B 是一个高性能的生成语言模型，旨在处理多种自然语言任务。它通过深度学习技术训练而成，能够生成连贯的文本和回答复杂问题。该模型适用于学术研究、商业应用和开发者，价格合理，定位精准，是自然语言处理领域的领先产品。

Llama-3.1-70B-Instruct-AWQ-INT4

Llama-3.1-70B-Instruct-AWQ-INT4是一个由Hugging Face托管的大型语言模型，专注于文本生成任务。该模型拥有70B个参数，能够理解和生成自然语言文本，适用于多种文本相关的应用场景，如内容创作、自动回复等。它基于深度学习技术，通过大量的数据训练，能够捕捉语言的复杂性和多样性。模型的主要优点包括高参数量带来的强大表达能力，以及针对特定任务的优化，使其在文本生成领域具有较高的效率和准确性。

Llama-3-Patronus-Lynx-8B-Instruct-v1.1

Patronus-Lynx-8B-Instruct-v1.1是基于meta-llama/Meta-Llama-3.1-8B-Instruct模型的微调版本，主要用于检测RAG设置中的幻觉。该模型经过CovidQA、PubmedQA、DROP、RAGTruth等多个数据集的训练，包含人工标注和合成数据。它能够评估给定文档、问题和答案是否忠实于文档内容，不提供超出文档范围的新信息，也不与文档信息相矛盾。

暂无评论

您必须登录才能参与评论！

none

暂无评论...