CogVideoX-2B

11个月前发布 24 00

CogVideoX-2B是一个开源的视频生成模型,由清华大学团队开发。它支持使用英语提示语言生成视频,具有36GB的推理GPU内存需求,并且可以生成6秒长、每秒8帧、分辨率为720*480的视频。该模型使用正弦位置嵌入,目前不支持量化推理和多卡推理。它基于Hugging Face的diffusers库进行部署,能够根据文本提示生成视频,具...

收录时间:
2025-05-29
CogVideoX-2BCogVideoX-2B

CogVideoX-2B是一个开源的视频生成模型,由清华大学团队开发。它支持使用英语提示语言生成视频,具有36GB的推理GPU内存需求,并且可以生成6秒长、每秒8帧、分辨率为720*480的视频。该模型使用正弦位置嵌入,目前不支持量化推理和多卡推理。它基于Hugging Face的diffusers库进行部署,能够根据文本提示生成视频,具有高度的创造性和应用潜力。

数据统计

相关导航

Open-Sora-Plan-v1.1.0

Open-Sora-Plan-v1.1.0

Open-Sora-Plan是一个由北京大学元组团队开发的文本到视频生成模型。它在2024年4月首次推出v1.0.0版本,以其简单高效的设计和显著的性能在文本到视频生成领域获得了广泛认可。v1.1.0版本在视频生成质量和持续时间上进行了显著改进,包括更优的压缩视觉表示、更高的生成质量和更长的视频生成能力。该模型采用了优化的CausalVideoVAE架构,具有更强的性能和更高的推理效率。此外,它还保持了v1.0.0版本的极简设计和数据效率,并且与Sora基础模型的性能相似,表明其版本演进与Sora展示的扩展法则一致。
造点AI

造点AI

造点AI是夸克(Quark)推出的AI图像创作生成平台,集成AI生图与AI生视频两大核心能力,于2025年9月24日正式发布。造点AI依托通义万相Wan2.5模型,是首个支持音画同步视频生成的平台,可以生成和画面匹配的人声、音效和背景音乐。造点AI视频支持10S时长的视频生成,单次生成即可实现完整的剧情故事,画质能够满足电影级场景的需求。造点AI生图全面支持 Midjourney V7的多项核心能力,包括多图参考、风格代码、精细化参数控制等,可以满足专业创作者在构图、风格与细节上的高阶需求。
通义视频

通义视频

通义视频是阿里云旗下通义万相平台推出的AI视频生成工具,于2024年9月19日的云栖大会上正式发布。通义AI生视频支持“文生视频”和“图生视频”两种创作模式,用户可以通过输入文本或图片上传,快速生成高质量的影视级视频内容。通义视频依托阿里自研的AI视频生成大模型,具备强大的风格泛化和动态生成能力,擅长概念理解与组合生成,可以根据用户需求生成不同风格的视频画面。通义万相AI视频还特别注重中式元素的表现,在制作中国风视频时表现出色。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...