
EMO
EMO (Emote Portrait Alive) 是阿里巴巴集团智能计算研究院的研究团队开发的一个音频驱动型肖像视频生成框架。具体来说,EMO系统基于音频信号驱动来生成肖像视频。用户只需要提供一张参考图片和一段音频文件(例如说话、唱歌的声音),EMO就能够根据音频内容生成一个生动的视频,视频中的人物会展现出丰富的面部表情和多变的头部动作,仿佛照片中的人物正在唱你所制定的语言或歌曲。
光语大模型是无限光年公司推出的一款结合大语言模型与符号推理的 AI 大模型,融合视觉与语言处理技术,拥有 10 亿视觉模型参数和 130 亿语言模型参数。该模型在金融、医疗等垂直领域表现出色,通过灰盒可信技术确保输出的稳定性和可靠性,有效解决幻觉问题,提升推理精度和可信度。光语大模型特别优化了金融服务和医疗诊断场景,提供精准搜索、高效信息总结和智能交互体验,已服务于多家一流金融机构和医院,为企业降低服务成本,实现 AI 技术的生产力转化。
光语大模型:结合大语言模型与符号推理的AI大模型
核心特点:
应用场景:
优势:
公司背景:
无限光年 是一家大模型技术和应用的创新公司,致力于研发垂直领域的可信大模型,打造深入行业需求的 AI 原生产品与解决方案。公司团队由来自知名科技公司的技术及行业专家组成,成员均毕业于 MIT、Cornell、Berkeley、UCSD、UMICH、UCL、NUS、清华、北大、复旦、交大、浙大等国内外知名高校,硕博占比超过 70%。