VideoTetrisVideoTetris是一个新颖的框架,它实现了文本到视频的生成,特别适用于处理包含多个对象或对象数量动态变化的复杂视频生成场景。该框架通过空间时间组合扩散技术,精确地遵循复杂的文本语义,并通过操作和组合去噪网络的空间和时间注意力图来实现。此外,它还引入了一种新的参考帧注意力机制,以提高自回归视频生成的一致性。VideoTetris在组合文本到视频生成方面取得了令人印象深刻的定性和定量结果。
FIFO-DiffusionFIFO-Diffusion是一种基于预训练扩散模型的新颖推理技术,用于文本条件视频生成。它能够无需训练生成无限长的视频,通过迭代执行对角去噪,同时处理队列中一系列连续帧的逐渐增加的噪声水平;该方法在头部出队一个完全去噪的帧,同时在尾部入队一个新的随机噪声帧。此外,引入了潜在分割来减少训练推理差距,并通过前瞻去噪来利用前向引用的好处。
通义视频通义视频是阿里云旗下通义万相平台推出的AI视频生成工具,于2024年9月19日的云栖大会上正式发布。通义AI生视频支持“文生视频”和“图生视频”两种创作模式,用户可以通过输入文本或图片上传,快速生成高质量的影视级视频内容。通义视频依托阿里自研的AI视频生成大模型,具备强大的风格泛化和动态生成能力,擅长概念理解与组合生成,可以根据用户需求生成不同风格的视频画面。通义万相AI视频还特别注重中式元素的表现,在制作中国风视频时表现出色。
造梦阁AI造梦阁AI是一款AI推文创作工具,可以帮助用户自动将小说文字转化为短视频。造梦阁AI以「一键成片」为核心功能,助力用户快速生成高质量视频内容,覆盖从文案创作到视频导出的全流程,3分钟生成抖音/快手/B站爆款推文视频。造梦阁AI支持智能匹配小说场景素材库,AI自动生成配音字幕,零基础创作百万播放量视频。每日更新热门小说推文模板,助力自媒体创作者高效变现!
Boba.videoBoba.Video是由Boba Labs开发的AI动漫视频生成平台,可以帮助用户创建高质量的动漫风格视频。Boba.video通过多模态AI技术,支持多种动漫风格的创作,用户可以通过输入创意、设置参数、添加声音和对话等方式生成动画。Boba.Video支持声音同步、风格化渲染等功能,可以大幅降低动画创作门槛。
UniAnimateUniAnimate是一个用于人物图像动画的统一视频扩散模型框架。它通过将参考图像、姿势指导和噪声视频映射到一个共同的特征空间,以减少优化难度并确保时间上的连贯性。UniAnimate能够处理长序列,支持随机噪声输入和首帧条件输入,显著提高了生成长期视频的能力。此外,它还探索了基于状态空间模型的替代时间建模架构,以替代原始的计算密集型时间Transformer。UniAnimate在定量和定性评估中都取得了优于现有最先进技术的合成结果,并且能够通过迭代使用首帧条件策略生成高度一致的一分钟视频。
Audiolabs将您的播客转换为适合TikTok、YouTube Shorts和Reels的短视频。吸引新的播客听众,实现商业目标。在短视频平台上发布视频剪辑,可作为“钩子”吸引听众发现您的内容库,并收听完整的剪辑或其他营销目标。
Follow-Your-PoseFollow-Your-Pose是一个文本到视频生成的模型,它利用姿势信息和文本描述来生成可编辑、可控制姿势的角色视频。这项技术在数字人物创作领域具有重要应用价值,解决了缺乏综合数据集和视频生成先验模型的限制。通过两阶段训练方案,结合预训练的文本到图像模型,实现了姿势可控的视频生成。