YAYI2

2个月前发布 5 00

YAYI2(雅意2)是中科闻歌推出的新一代开源大语言模型,支持中文、英语等 10 多种语言。基于 Transformer 架构,参数规模达到 30B。YAYI2 采用 2 万亿 Tokens 的高质量语料进行预训练,并结合人类反馈强化学习,确保模型与人类价值观对齐。其多模态交互功能支持图文互生成、PDF 解析等。YAYI2 广泛应用于媒体...

收录时间:
2025-02-18

YAYI2(雅意2)是中科闻歌推出的新一代开源大语言模型,支持中文、英语等 10 多种语言。基于 Transformer 架构,参数规模达到 30B。YAYI2 采用 2 万亿 Tokens 的高质量语料进行预训练,并结合人类反馈强化学习,确保模型与人类价值观对齐。其多模态交互功能支持图文互生成、PDF 解析等。YAYI2 广泛应用于媒体宣传、舆情分析、政务治理、金融分析等领域,为企业提供 AI 辅助工具和知识库问答系统。

主要功能特点

  • 多语言支持: YAYI2 支持超过 10 种语言,包括中文和英语,确保在全球范围内的高效应用。其中文 Token 压缩率在国内领先,使中文处理更加高效。
  • 高质量语料训练: 采用超过 2 万亿 Tokens 的高质量、多语言语料进行预训练,确保模型的高准确性和广泛适用性。
  • 人类反馈强化学习: 通过百万级指令微调和人类反馈强化学习,使模型与人类价值观对齐,增强模型的实用性和可靠性。
  • 多模态交互: 支持图文互生成、PDF 解析、网页实时理解等功能,扩展了模型的使用场景。
  • 强大的中文知识问答能力: 在 AGIEval 和 CMMLU 评测中名列前茅,在 MMLU 中也表现出色,具备强大的中文知识问答能力。
  • 信息抽取: 在零样本中文实体抽取中达到 SOTA(State of the Art),并且英文抽取性能可对标 ChatGPT。
  • 角色扮演: 支持上万种自定义角色,并能够进行超长对话关联,满足多样化的用户需求。

行业应用

  • 媒体宣传: 自动生成多语种新闻、视频理解、虚拟主播生成等应用,提升媒体工作效率。
  • 舆情分析: 实时监测和分析舆情,生成舆情专报,为政企决策提供支持。
  • 政务治理: 应用于法律智能审批、安全信息抽取等领域,助力政务数字化转型。
  • 金融分析: 提供财报解析、投资合规管理、宏观政策解读等解决方案,支持金融行业发展。
  • 教育和学习: 为学习者提供多语言翻译和问答系统,辅助教育领域的教学和研究。
  • 其他专业应用: 包括中医智能问诊、企业知识库问答、编程语言支持等,满足不同行业的需求。

相较于Llama 2开源模型,YAYI 2在中文场景表现更好,且通过插件就可以实现计算器、天气查询等工具的调用。其安全架构强化价值观对齐,输出内容经过实时审核,适合政企敏感场景。YAYI目前已在国家部委、金融机构等落地,与华为云、北京银行等建立生态合作。

YAYI 2 提供了 Base 和 Chat 两个版本,开源的是 Base 版本,支持开发者在 GitHub 上获取代码、模型和训练数据。此外,该模型遵循 Apache-2.0 协议,允许商用和二次开发。

GitHub 仓库:https://github.com/wenge-research/YAYI2

HuggingFace:https://huggingface.co/wenge-research/yayi2-30b

数据统计

相关导航

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...