WorldDreamerWorldDreamer是一个创新的视频生成模型,它通过预测遮蔽的视觉令牌来理解并模拟世界动态。它在图像到视频合成、文本到视频生成、视频修复、视频风格化以及动作到视频生成等多个方面表现出色。该模型借鉴了大型语言模型的成功经验,将世界建模视为一个无监督的视觉序列建模挑战,通过将视觉输入映射到离散的令牌并预测被遮蔽的令牌来实现。
Keeva AIKeeva AI是一个多功能的AI数字人视频创作工具,专为海外中小企业和个人创作者提供视频创作解决方案。Keeva AI利用人工智能技术,能够智能生成和翻译视频脚本,并结合高质量的公共人像和模板,可以实现一键生成数字人营销视频的服务。用户只需输入视频主题,Keeva AI即可自动生成脚本并制作完整视频,同时支持上传自有脚本,选择数字人形象和语音生成视频。
通义视频通义视频是阿里云旗下通义万相平台推出的AI视频生成工具,于2024年9月19日的云栖大会上正式发布。通义AI生视频支持“文生视频”和“图生视频”两种创作模式,用户可以通过输入文本或图片上传,快速生成高质量的影视级视频内容。通义视频依托阿里自研的AI视频生成大模型,具备强大的风格泛化和动态生成能力,擅长概念理解与组合生成,可以根据用户需求生成不同风格的视频画面。通义万相AI视频还特别注重中式元素的表现,在制作中国风视频时表现出色。
DeepFuzeDeepFuze是与ComfyUI无缝集成的先进深度学习工具,用于革新面部转换、lipsyncing、视频生成、声音克隆和lipsync翻译。利用先进的算法,DeepFuze使用户能够以无与伦比的真实性结合音频和视频,确保完美的面部动作同步。这一创新解决方案非常适合内容创作者、动画师、开发者以及任何希望以先进的AI驱动功能提升其视频编辑项目的人士。
VideoTetrisVideoTetris是一个新颖的框架,它实现了文本到视频的生成,特别适用于处理包含多个对象或对象数量动态变化的复杂视频生成场景。该框架通过空间时间组合扩散技术,精确地遵循复杂的文本语义,并通过操作和组合去噪网络的空间和时间注意力图来实现。此外,它还引入了一种新的参考帧注意力机制,以提高自回归视频生成的一致性。VideoTetris在组合文本到视频生成方面取得了令人印象深刻的定性和定量结果。
造点AI造点AI是夸克(Quark)推出的AI图像创作生成平台,集成AI生图与AI生视频两大核心能力,于2025年9月24日正式发布。造点AI依托通义万相Wan2.5模型,是首个支持音画同步视频生成的平台,可以生成和画面匹配的人声、音效和背景音乐。造点AI视频支持10S时长的视频生成,单次生成即可实现完整的剧情故事,画质能够满足电影级场景的需求。造点AI生图全面支持 Midjourney V7的多项核心能力,包括多图参考、风格代码、精细化参数控制等,可以满足专业创作者在构图、风格与细节上的高阶需求。
潮际好麦AI视频潮际好麦AI视频是一款虚拟试穿AI视频生成工具,支持用户在视频中展示服装或商品,无需进行实际拍摄。使用潮际好麦AI视频,商家可以一键生成多种类型的营销素材,实现虚拟拍摄模特试衣视频,降低运营成本并提高营销效率。潮际好麦AI视频提供多种视频模板和背景,可以可以帮助商家实现低成本、高效率的视频内容创作,适用于电商平台、抖音、小红书等多种场景的视频内容需求。