热门

genmoai

1年前发布 24 00

genmoai/models 是一个开源的视频生成模型，代表了视频生成技术的最新进展。该模型名为 Mochi 1，是一个基于 Asymmetric Diffusion Transformer (AsymmDiT) 架构的10亿参数扩散模型，从零开始训练，是迄今为止公开发布的最大的视频生成模型。它具有高保真运动和强提示遵循性，显著缩小了封闭...

收录时间：

2025-05-29

打开网站手机查看

视频创作 # 人工智能 # 开源 # 扩散模型 # 机器学习 # 视频生成

genmoai

genmoai

genmoai/models 是一个开源的视频生成模型，代表了视频生成技术的最新进展。该模型名为 Mochi 1，是一个基于 Asymmetric Diffusion Transformer (AsymmDiT) 架构的10亿参数扩散模型，从零开始训练，是迄今为止公开发布的最大的视频生成模型。它具有高保真运动和强提示遵循性，显著缩小了封闭和开放视频生成系统之间的差距。该模型在 Apache 2.0 许可下发布，用户可以在 Genmo 的 playground 上免费试用此模型。

数据统计

相关导航

AI数字人分身系统

小狐狸AI数字人分身系统是一款结合了人工智能技术的数字人口型同步产品，支持无限多开和贴牌OEM，适用于需要虚拟形象进行口型同步互动的场景。该产品背景基于人工智能技术的发展，特别是在虚拟主播和在线教育领域的应用需求日益增长。产品价格为3580元，定位于中高端市场，主要优点包括完全开源、支持自主二次开发和定制二次开发，以及免费搭建服务。

SoraVids

SoraVids是一个基于Hugging Face平台的视频生成模型Sora的存档库。它包含了87个视频和83个对应的提示，这些视频和提示在OpenAI撤销API密钥前被公开展示。这些视频均为MIME类型video/mp4，帧率为30 FPS。SoraVids的背景是OpenAI的视频生成技术，它允许用户通过文本提示生成视频内容。这个存档库的重要性在于它保存了在API密钥被撤销前生成的视频，为研究和教育提供了宝贵的资源。

DreamASMR

DreamASMR利用Veo3 ASMR技术创造令人放松的视频内容，提供先进的AI视频生成、双耳声音和巨细靡遗的视觉体验，是终极ASMR体验。

VideoSeal

VideoSeal 是一个开源的视频水印项目，由 Facebook Research 提供。该项目包括预训练模型、训练代码、推理代码和评估工具，全部在 MIT 许可证下发布。VideoSeal 能够将信息嵌入视频内容中，用于版权保护、内容验证等目的。它支持视频和图像水印，并提供了与现有最先进图像水印技术的对比基准。VideoSeal 的主要优点包括开放性、高效性以及对视频和图像水印的双重支持。

Mochi in ComfyUI

Mochi是Genmo最新推出的开源视频生成模型，它在ComfyUI中经过优化，即使使用消费级GPU也能实现。Mochi以其高保真度动作和卓越的提示遵循性而著称，为ComfyUI社区带来了最先进的视频生成能力。Mochi模型在Apache 2.0许可下发布，这意味着开发者和创作者可以自由使用、修改和集成Mochi，而不受限制性许可的阻碍。Mochi能够在消费级GPU上运行，如4090，且在ComfyUI中支持多种注意力后端，使其能够适应小于24GB的VRAM。

AI 视频图文创作助手

AI 视频图文创作助手是一个开源工具，旨在将视频和音频内容转化为多种格式的文档，帮助用户进行二次阅读和思考。该产品的主要优势在于其完全开源、无需注册，用户可以在本地处理音视频文件，降低了使用成本。它非常适合需要将视听内容转化为文本的学生、研究人员和内容创作者。

Runway Aleph AI

Aleph AI是建立在Runway Aleph上的AI视频编辑平台，通过直观的自然语言命令，实现对象编辑、场景角度变化和风格及灯光调整，为用户提供前所未有的创意控制力。价格方面，允许商业使用并提供即时处理，消除了创意愿景与最终输出之间的障碍。

GAIA-2

GAIA-2 是 Wayve 开发的先进视频生成模型，旨在为自动驾驶系统提供多样化和复杂的驾驶场景，以提高安全性和可靠性。该模型通过生成合成数据来解决依赖现实世界数据收集的限制，能够创建各种驾驶情境，包括常规和边缘案例。GAIA-2 支持多种地理和环境条件的模拟，帮助开发者在没有高昂成本的情况下快速测试和验证自动驾驶算法。

暂无评论

您必须登录才能参与评论！

none

暂无评论...