PCM

3个月前发布 1 00

Phased Consistency Model(PCM)是一种新型的生成模型,旨在解决Latent Consistency Model(LCM)在文本条件高分辨率生成中的局限性。PCM通过创新的策略在训练和推理阶段提高了生成质量,并通过广泛的实验验证了其在不同步骤(1步、2步、4步、8步、16步)下与Stable Diffusion和S...

收录时间:
2025-05-30

Phased Consistency Model(PCM)是一种新型的生成模型,旨在解决Latent Consistency Model(LCM)在文本条件高分辨率生成中的局限性。PCM通过创新的策略在训练和推理阶段提高了生成质量,并通过广泛的实验验证了其在不同步骤(1步、2步、4步、8步、16步)下与Stable Diffusion和Stable Diffusion XL基础模型的结合效果。

数据统计

相关导航

雾象

雾象

雾象(Fogsight)是由WaytoAGI团队推出的一款AI动画生成引擎,能够根据用户输入的抽象概念或词语,自动生成生动的叙事动画。雾象通过自然语言处理技术,可以将抽象概念拆解为镜头脚本和旁白,并映射成视觉元素、转场和音效,从而实现动画的自动生成。雾象的核心优势在于其全流程的自动化能力,从剧本创作、分镜设计到最终的动画渲染,均可一键完成。雾象也支持多种多媒体形式的内容生成,不仅限于二维动画,还包括可能的三维效果,可以适用于多种场景和领域。
Vchitect 2.0

Vchitect 2.0

Vchitect 2.0(筑梦2.0)是一款由上海人工智能实验室开发的高级视频生成模型,旨在赋予视频创作新的动力。它支持20秒视频生成,灵活的宽高比,生成空间时间增强,以及长视频评估。Vchitect 2.0通过其先进的技术,能够将静态图像转换为5-10秒的视频,使用户能够轻松地将照片或设计转换为引人入胜的视觉体验。此外,Vchitect 2.0还支持长视频生成模型的评估,通过VBench平台,提供全面且持续更新的评估排行榜,支持多种长视频模型,如Gen-3、Kling、OpenSora等。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...