
aminer智慧手语是一项基于高质量多类型手语语料库、全链路高精度手语翻译算法及跨模态拟人生成技术的创新。它旨在打造高逼真的手语播报数字人生成模型,让听障人群能够无障碍地共享世界。
aminer智慧手语的创立背景
手语是听力障碍人士的主要的交际工具,是用手势比量动作的视觉语言,表形度高、词性结构不发达、拥有自身独特的表达逻辑和特点。
我国听障人群数量达2700万,无障碍设施和专业场景的手语服务资源匮乏,听障人士难以全方位地接收资讯信息。Al技术的快速发展,使高质量语料匮乏、手语语序复杂、高逼真数字人生成难的问题得以解决。Al手语数字人实现了文字内容的语义理解,将其翻译合成手语,并通过虚拟数字人华同学进行播报。
aminer智慧手语的主要功能
1、AI手语播报:为视频增加手语播报
AI手语播报,是视频 / 音频的手语合成,要求实时性,对于语言精炼度要求高。采用基于语言预训练大模型的语义蒸馏算法、Al手语翻译算法、跨模态拟人生成技术,将文本进行精简、翻译,合成数字人手语动作,并与原音视频逐句对齐播出。可用于新闻、电影、电视剧等录播场景的视频手语合成,也可支持电视新闻播报、体育赛事播报、电商直播等实时直播场景。
2、AI手语翻译:连接健听人士和听障人士的翻译官
Al手语翻译,是将文本/语音翻译为数字人手语,生成的手语保留完整中文语义并符合手语表达特点。手语翻译算法以预训练模型为基础,针对中文文本与手语语序差异大、手语语序规则不统一等问题而研发。手语翻译转写速度达到毫秒级,识别准确率达到98.7%。支持移动端、桌面端、后台端全平台,适用于公共服务引导、日常会话、展览展示、智能问答等多种场景。
3、AI手语词典:手语学习的工具书
AI手语词典以《国家通用手语词典》为基础,包含手语词目、拼音、手势说明、相关词等信息,以观看者的角度呈现AI手语数字人手语视频。小程序提供多种检索方式,并依据不同场景分类手语词,便于学习使用。适用人群:听障人士、需要学习手语的人士等、以及手语爱 好者等。
数据统计
相关导航

闪剪是一款数字人视频生成平台, 可以 1:1 复刻你的形象和声音,只需输入文字即可生成口播视频。闪剪具备形象、声音克隆、链接成片以及直播切片等功能。手机端和网页端通用。

i-Avatar数字人平台
i-Avatar数字人平台是全响AI推出的一个利用人工智能技术创建虚拟人物或数字化人格的平台。这些数字人可以模拟人类的行为、思维和外观,被广泛应用于教育、娱乐、客户服务等领域。例如,它们可以作为虚拟助手协助教学、答疑,或在模拟实验中帮助学生理解知识。

厘里AI数字人
厘里是阿里大文娱技术团队自研的超写实数字人。厘里通过深度训练AI模型,能够精准模拟人类面部表情、肌肉运动等细节,并根据不同场景和角色进行造型和服装的变换。她的无美颜的真人肤质系统呈现更加细腻和自然,使观众在享受节目乐趣的同时,也能感受到数字人技术的魅力。

AigcPanel
AigcPanel是一款免费开源、简单易用的一站式AI数字人系统。支持视频合成、声音合成、声音克隆,简化本地模型管理用户可以一键导入和使用AI模型。最大的优势在于通过一个安装包即可完成所有环境配置,实现"开箱即用",使用户可以轻松地在Windows和Mac环境下操作。无论是生成高质量的视频,还是个性化的语音克隆,AigcPanel 都能满足您的需求。

DreamAvatar
DreamAvatar是一个革命性的AI数字人生成工具,利用前沿技术,用户只需使用一部手机,就能轻松创建自己的数字人分身。通过导入拍摄好的视频素材,并指定视频中的人物,DreamAvatar的AI算法将进行人体检测、跟踪、擦除、替换,以及背景修复。这一系列创新的步骤将自动将真人转换为逼真的数字人形象。

Synthesia
Synthesia是一个基于人工智能的视频生成平台,它允许用户通过输入文本来创建逼真的虚拟人物视频。这个平台使用深度学习算法合成人脸表情和口型,使得虚拟人物能够根据用户提供的文字说话。

Hi Echo
Hi Echo - 全球首个虚拟人口语私教。通过 AI 技术提供随时随地的一对一口语练习,覆盖考试、职场、美食、旅行等多个对话场景和话题。Hi Echo 比真人口语教练更专业地道,提供对话分数及完整对话报告,帮助用户快速提升口语能力。

MetaHuman
MetaHuman是虚幻引擎推出的数字人类制作工具,提供了高度逼真的数字人类角色创建、动画制作和使用。基于真实人类的预先扫描数据,提供海量的面部特征、肤色、头发、眼睛和衣着选项,支持创作多样化角色。
暂无评论...