热门

OmniHuman-1

12个月前发布 30 00

OmniHuman-1 是一个端到端的多模态条件人类视频生成框架，能够基于单张人像和运动信号（如音频、视频或其组合）生成人类视频。该技术通过混合训练策略克服了高质量数据稀缺的问题，支持任意宽高比的图像输入，生成逼真的人类视频。它在弱信号输入（尤其是音频）方面表现出色，适用于多种场景，如虚拟主播、视频制作等。

收录时间：

2025-05-30

打开网站手机查看

视频创作 # 人工智能 # 内容创作 # 多模态 # 虚拟人物 # 视频生成

OmniHuman-1

OmniHuman-1

OmniHuman-1 是一个端到端的多模态条件人类视频生成框架，能够基于单张人像和运动信号（如音频、视频或其组合）生成人类视频。该技术通过混合训练策略克服了高质量数据稀缺的问题，支持任意宽高比的图像输入，生成逼真的人类视频。它在弱信号输入（尤其是音频）方面表现出色，适用于多种场景，如虚拟主播、视频制作等。

数据统计

相关导航

Aleph AI – AI Video Editor & Video Generator

Aleph AI 是一款基于先进人工智能技术的视频编辑和生成工具，允许用户通过简单的文本提示来快速修改和生成视频。它能够以高效率和准确性进行复杂的视频编辑，适合各类创作者，无论是专业人士还是初学者，能够轻松实现他们的创意想法。Aleph AI 提供每次生成 10 个积分，并且在处理视频时支持商用许可，极大地降低了视频创作的门槛。

SkyReels-V1-Hunyuan-I2V

SkyReels V1 是一个基于 HunyuanVideo 微调的人类中心视频生成模型。它通过高质量影视片段训练，能够生成具有电影级质感的视频内容。该模型在开源领域达到了行业领先水平，尤其在面部表情捕捉和场景理解方面表现出色。其主要优点包括开源领先性、先进的面部动画技术和电影级光影美学。该模型适用于需要高质量视频生成的场景，如影视制作、广告创作等，具有广泛的应用前景。

Veo3 JSON Prompt

Veo3 JSON Prompt是一款专业的AI视频生成工具，通过JSON提示库和智能提示生成器，可生成令人惊叹的视频。该产品具有高品质视频生成、多样化风格、精准控制等特点，广泛应用于视频创作领域。

ComfyUI-MochiWrapper

ComfyUI-MochiWrapper是一个用于Mochi视频生成器的包装节点，它允许用户通过ComfyUI界面与Mochi模型进行交互。这个项目主要优点是能够利用Mochi模型生成视频内容，并且通过ComfyUI简化了操作流程。它是基于Python开发的，并且完全开源，允许开发者自由地使用和修改。目前该项目还处于积极开发中，已经有一些基本功能，但还没有正式发布版本。

Symvol

Symvol 是一款专注于将文本内容快速转化为视频的工具，旨在通过 AI 和视觉叙事技术，帮助用户更高效地理解和传播信息。该产品通过浏览器插件的形式，让用户能够直接在网页上将文本内容转化为视频，无需复杂的视频编辑知识。其技术的核心在于提升信息的可理解性和可访问性，尤其适合学习者、内容创作者和企业用户。Symvol 提供免费版本，同时也有付费升级选项，以满足不同用户的需求。

ASMR.so

ASMR.so是基于先进的 VEO3 AI 技术的平台，用户可以快速生成专业的 ASMR 视频。该产品支持多种 ASMR 类型，包括耳语、敲击、自然声音等，旨在为用户提供放松和享受的体验。其主要优势在于视频生成速度快（通常在 2 分钟内完成），高清质量以及用户友好的操作流程。适合视频创作者、ASMR 爱好者以及需要放松内容的用户。该平台还提供灵活的信用系统，用户可根据需求选择套餐。产品价格方面，有免费试用和付费套餐可供选择。

长上下文调优（LCT）

长上下文调优（LCT）旨在解决当前单次生成能力与现实叙事视频制作之间的差距。该技术通过数据驱动的方法直接学习场景级一致性，支持交互式多镜头开发和合成生成，适用于视频制作的各个方面。

SynCamMaster

SynCamMaster是一种先进的视频生成技术，它能够从多样化的视角同步生成多摄像机视频。这项技术通过预训练的文本到视频模型，增强了视频内容在不同视角下的动态一致性，对于虚拟拍摄等应用场景具有重要意义。该技术的主要优点包括能够处理开放世界视频的任意视角生成，整合6自由度摄像机姿态，并设计了一种渐进式训练方案，利用多摄像机图像和单目视频作为补充，显著提升了模型性能。

暂无评论

您必须登录才能参与评论！

none

暂无评论...