VividTalk

VividTalk

VividTalk是一种一次性音频驱动的头像生成技术,基于3D混合先验。它能够生成具有表情丰富、自然头部姿态和唇同步的逼真说唱视频。该技术采用了两阶段通用框架,支持生成具有上述所有特性的高视觉质量的说唱视频。具体来说,在第一阶段,通过学习两种运动(非刚性表情运动和刚性头部运动),将音频映射到网格。对于表情运动,采用混合形状和顶点作为中间表示,以最大化模型的表征能力。对于自然头部运动,提出了一种新颖的可学习头部姿势码本,并采用两阶段训练机制。在第二阶段,提出了一个双分支运动VAE和一个生成器,将网格转换为密集运动,并逐帧合成高质量视频。大量实验证明,VividTalk能够生成具有唇同步和逼真增强的高视觉质量说唱视频,且在客观和主观比较中优于以往的最先进作品。该技术的代码将在发表后公开发布。
0230
字幕说-在线语音合成、字幕及视频生成工具

字幕说-在线语音合成、字幕及视频生成工具

字幕说是一款自媒体人必备的在线语音合成、字幕及视频生成工具,免费在线合成如同真人一般的配音,语音及字幕视频,自媒体人还可免费在线配音获取同步字幕,制作视频无需出镜。字幕说还提供音文对齐、在线视频编辑、在线语音修复等强大功能,帮助你提高创作效率和质量。
0170
AIGCPanel开源AI数字人系统

AIGCPanel开源AI数字人系统

AIGCPanel是一个简单易用的一站式AI数字人系统,小白也可使用。支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。产品背景信息显示,AIGCPanel旨在通过集成多种AI功能,提升数字人素材管理的效率,降低技术门槛,使非专业人士也能轻松管理和使用AI数字人。产品基于AGPL-3.0开源,完全免费,可以直接使用。
0130