热门

FIFO-Diffusion

11个月前发布 18 00

FIFO-Diffusion是一种基于预训练扩散模型的新颖推理技术，用于文本条件视频生成。它能够无需训练生成无限长的视频，通过迭代执行对角去噪，同时处理队列中一系列连续帧的逐渐增加的噪声水平；该方法在头部出队一个完全去噪的帧，同时在尾部入队一个新的随机噪声帧。此外，引入了潜在分割来减少训练推理差距，并通过前瞻去噪来利用前向引用的好处。

收录时间：

2025-05-29

打开网站手机查看

视频生成 # AI技术 # 无需训练 # 视频生成 # 高分辨率

FIFO-Diffusion

FIFO-Diffusion

FIFO-Diffusion是一种基于预训练扩散模型的新颖推理技术，用于文本条件视频生成。它能够无需训练生成无限长的视频，通过迭代执行对角去噪，同时处理队列中一系列连续帧的逐渐增加的噪声水平；该方法在头部出队一个完全去噪的帧，同时在尾部入队一个新的随机噪声帧。此外，引入了潜在分割来减少训练推理差距，并通过前瞻去噪来利用前向引用的好处。

数据统计

相关导航

CogVideoX-5B

CogVideoX是一个开源的视频生成模型，由清华大学团队开发，支持从文本描述生成视频。它提供了多种视频生成模型，包括入门级和大型模型，以满足不同质量和成本需求。模型支持多种精度，包括FP16和BF16，推荐使用与模型训练时相同的精度进行推理。CogVideoX-5B模型特别适用于需要生成高质量视频内容的场景，如电影制作、游戏开发和广告创意。

Dream Machine API

Dream Machine API是一个创意智能平台，它提供了一系列先进的视频生成模型，通过直观的API和开源SDKs，用户可以构建和扩展创意AI产品。该平台拥有文本到视频、图像到视频、关键帧控制、扩展、循环和相机控制等功能，旨在通过创意智能与人类合作，帮助他们创造更好的内容。Dream Machine API的推出，旨在推动视觉探索和创造的丰富性，让更多的想法得以尝试，构建更好的叙事，并让那些以前无法做到的人讲述多样化的故事。

PCM

Phased Consistency Model（PCM）是一种新型的生成模型，旨在解决Latent Consistency Model（LCM）在文本条件高分辨率生成中的局限性。PCM通过创新的策略在训练和推理阶段提高了生成质量，并通过广泛的实验验证了其在不同步骤（1步、2步、4步、8步、16步）下与Stable Diffusion和Stable Diffusion XL基础模型的结合效果。

MyPersonas

MyPersonas创建逼真的AI克隆，使您公司的每个专家都可以全天候提供知识，支持任何语言，任何时间，任何地点。

YOYA优雅

YOYA优雅是由中科闻歌发布的一个多模态AI创作平台，专注于AI音视频内容创作。YOYA优雅AI平台依托雅意大模型、优雅多模态大模型，提供文生视频、智能剪辑、AI音乐创作、视频翻译等多种AI生成能力，可以帮助用户能够生成高质量的视频内容。YOYA优雅适用于媒体、企业、出版、文旅、影视等泛媒体客户，可以有效提升视频创作效率和质量。

潮际好麦AI视频

潮际好麦AI视频是一款虚拟试穿AI视频生成工具，支持用户在视频中展示服装或商品，无需进行实际拍摄。使用潮际好麦AI视频，商家可以一键生成多种类型的营销素材，实现虚拟拍摄模特试衣视频，降低运营成本并提高营销效率。潮际好麦AI视频提供多种视频模板和背景，可以可以帮助商家实现低成本、高效率的视频内容创作，适用于电商平台、抖音、小红书等多种场景的视频内容需求。

AppMall应用商店

AppMall是一个创新的网页端AI应用商店，致力于为用户打造一个高效、灵活的AI应用生态系统。AppMall提供多种AI应用供用户安装和使用，通过直观的界面以及便捷的操作，用户可以轻松管理AI应用、下载模型。无论是数据处理、模型训练，还是部署智能应用，AppMall AI应用中心都可以为您提供便捷的解决方案。

CogVideoX-2B

CogVideoX-2B是一个开源的视频生成模型，由清华大学团队开发。它支持使用英语提示语言生成视频，具有36GB的推理GPU内存需求，并且可以生成6秒长、每秒8帧、分辨率为720*480的视频。该模型使用正弦位置嵌入，目前不支持量化推理和多卡推理。它基于Hugging Face的diffusers库进行部署，能够根据文本提示生成视频，具有高度的创造性和应用潜力。

暂无评论

您必须登录才能参与评论！

none

暂无评论...