热门

WorldDreamer

11个月前发布 20 00

WorldDreamer是一个创新的视频生成模型，它通过预测遮蔽的视觉令牌来理解并模拟世界动态。它在图像到视频合成、文本到视频生成、视频修复、视频风格化以及动作到视频生成等多个方面表现出色。该模型借鉴了大型语言模型的成功经验，将世界建模视为一个无监督的视觉序列建模挑战，通过将视觉输入映射到离散的令牌并预测被遮蔽的令牌来实现。

收录时间：

2025-05-30

打开网站手机查看

视频生成 # AI # 图像处理 # 视频生成

WorldDreamer

WorldDreamer

WorldDreamer是一个创新的视频生成模型，它通过预测遮蔽的视觉令牌来理解并模拟世界动态。它在图像到视频合成、文本到视频生成、视频修复、视频风格化以及动作到视频生成等多个方面表现出色。该模型借鉴了大型语言模型的成功经验，将世界建模视为一个无监督的视觉序列建模挑战，通过将视觉输入映射到离散的令牌并预测被遮蔽的令牌来实现。

数据统计

相关导航

Shipable AI

Shipable是一款旨在帮助用户轻松构建、推出和扩展AI代理和应用的平台。它无需编码，适用于团队、创作者和初创公司，能够创建智能工具，与Slack和Notion等应用程序连接，并快速部署。

Runway API

Runway API是一个强大的视频模型平台，提供先进的生成视频模型，允许用户在安全、可靠的环境中嵌入Gen-3 Alpha Turbo到他们的产品中。它支持广泛的应用场景，包括创意广告、音乐视频、电影制作等，是全球顶尖创意人士的首选。

千面数字人

千面数字人是一款AI数字人视频生成工具，千面数字人Avatar系列的两款产品均依托先进 AI 技术，为用户带来创意内容生成新体验。音频转换产品能将静态图片与音频融合，让图片中的人物随声音动起来唱歌、说话，实现从静到动的趣味转化；模仿动作产品则可将 5 秒内的真人动作视频与动漫人物图片结合，使动漫角色精准复刻真人动作，赋予虚拟形象真实动态。两者操作简便，能满足二次元创作、游戏互动、社交娱乐等多元场景需求，助力用户轻松释放创意。

ComfyUI-LumaAI-API

ComfyUI-LumaAI-API是一个为ComfyUI设计的插件，它允许用户直接在ComfyUI中使用Luma AI API。Luma AI API基于Dream Machine视频生成模型，由Luma开发。该插件通过提供多种节点，如文本到视频、图像到视频、视频预览等，极大地丰富了视频生成的可能性，为视频创作者和开发者提供了便捷的工具。

Vchitect 2.0

Vchitect 2.0（筑梦2.0）是一款由上海人工智能实验室开发的高级视频生成模型，旨在赋予视频创作新的动力。它支持20秒视频生成，灵活的宽高比，生成空间时间增强，以及长视频评估。Vchitect 2.0通过其先进的技术，能够将静态图像转换为5-10秒的视频，使用户能够轻松地将照片或设计转换为引人入胜的视觉体验。此外，Vchitect 2.0还支持长视频生成模型的评估，通过VBench平台，提供全面且持续更新的评估排行榜，支持多种长视频模型，如Gen-3、Kling、OpenSora等。

Vue.ai

Vue.ai是一款专注于业务成果与AI转型的企业AI引擎，通过可靠的AI编排平台，加速企业上线并实现快速回报。其独特的数据清理、产品标记、内容审核、客户细分、自动化、优化等功能，帮助企业提高效率、降低成本，提升竞争力。

造点AI

造点AI是夸克（Quark）推出的AI图像创作生成平台，集成AI生图与AI生视频两大核心能力，于2025年9月24日正式发布。造点AI依托通义万相Wan2.5模型，是首个支持音画同步视频生成的平台，可以生成和画面匹配的人声、音效和背景音乐。造点AI视频支持10S时长的视频生成，单次生成即可实现完整的剧情故事，画质能够满足电影级场景的需求。造点AI生图全面支持 Midjourney V7的多项核心能力，包括多图参考、风格代码、精细化参数控制等，可以满足专业创作者在构图、风格与细节上的高阶需求。

Patsnap Eureka

Eureka AI Agent是一款基于AI技术的创新工具，能够帮助用户解锁深度洞察，加速创新，提升研发战略。其主要优点包括高效、准确的信息检索与分析能力，以及智能化的技术方案探索功能。Eureka AI Agent背景信息来源于Patsnap公司，定位于提供高级AI解决方案。

暂无评论

您必须登录才能参与评论！

none

暂无评论...