热门

hunyuan-video-keyframe-control-lora

12个月前发布 19 00

HunyuanVideo Keyframe Control Lora 是一个针对HunyuanVideo T2V模型的适配器，专注于关键帧视频生成。它通过修改输入嵌入层以有效整合关键帧信息，并应用低秩适配（LoRA）技术优化线性层和卷积输入层，从而实现高效微调。该模型允许用户通过定义关键帧精确控制生成视频的起始和结束帧，确保生成内容与指定...

收录时间：

2025-05-30

打开网站手机查看

视频创作 # AI模型 # diffusion # 低秩适配 # 关键帧控制 # 视频生成

hunyuan-video-keyframe-control-lora

hunyuan-video-keyframe-control-lora

HunyuanVideo Keyframe Control Lora 是一个针对HunyuanVideo T2V模型的适配器，专注于关键帧视频生成。它通过修改输入嵌入层以有效整合关键帧信息，并应用低秩适配（LoRA）技术优化线性层和卷积输入层，从而实现高效微调。该模型允许用户通过定义关键帧精确控制生成视频的起始和结束帧，确保生成内容与指定关键帧无缝衔接，增强视频连贯性和叙事性。它在视频生成领域具有重要应用价值，尤其在需要精确控制视频内容的场景中表现出色。

数据统计

相关导航

AccVideo

AccVideo 是一种新颖的高效蒸馏方法，通过合成数据集加速视频扩散模型的推理速度。该模型能够在生成视频时实现 8.5 倍的速度提升，同时保持相似的性能。它使用预训练的视频扩散模型生成多条有效去噪轨迹，从而优化了数据的使用和生成过程。AccVideo 特别适用于需要高效视频生成的场景，如电影制作、游戏开发等，适合研究人员和开发者使用。

On-device Sora

On-device Sora 是一个开源项目，旨在通过线性比例跳跃（LPL）、时间维度标记合并（TDTM）和动态加载并发推理（CI-DL）等技术，实现在移动设备（如 iPhone 15 Pro）上高效的视频生成。该项目基于 Open-Sora 模型开发，能够根据文本输入生成高质量视频。其主要优点包括高效性、低功耗和对移动设备的优化。该技术适用于需要在移动设备上快速生成视频内容的场景，如短视频创作、广告制作等。项目目前开源，用户可以免费使用。

Luma Ray3AI

Ray3是全球首个具有推理能力的视频模型，由Luma Ray3提供支持。它能够思考、规划并创作专业级内容，具备原生HDR生成和智能草稿模式实现快速迭代。主要优点包括：拥有推理智能，能深入理解提示、规划复杂场景并自我审视；提供原生10、12和16位HDR视频，适用于专业工作室工作流程；草稿模式生成速度快20倍，便于快速完善概念。价格方面，有免费版、29美元的专业版和99美元的工作室版。定位为满足不同用户群体从探索到专业商业应用的视频创作需求。

Diffusion as Shader

Diffusion as Shader (DaS) 是一种创新的视频生成控制模型，旨在通过3D感知的扩散过程实现对视频生成的多样化控制。该模型利用3D跟踪视频作为控制输入，能够在统一的架构下支持多种视频控制任务，如网格到视频生成、相机控制、运动迁移和对象操作等。DaS的主要优势在于其3D感知能力，能够有效提升生成视频的时间一致性，并在短时间内通过少量数据微调即可展现出强大的控制能力。该模型由香港科技大学等多所高校的研究团队共同开发，旨在推动视频生成技术的发展，为影视制作、虚拟现实等领域提供更为灵活和高效的解决方案。

FramePack

FramePack 是一个创新的视频生成模型，旨在通过压缩输入帧的上下文来提高视频生成的质量和效率。其主要优点在于解决了视频生成中的漂移问题，通过双向采样方法保持视频质量，适合需要生成长视频的用户。该技术背景来源于对现有模型的深入研究和实验，以改进视频生成的稳定性和连贯性。

mochi-1-preview

这是一个先进的视频生成模型，采用 AsymmDiT 架构，可免费试用。它能生成高保真视频，缩小了开源与闭源视频生成系统的差距。模型需要至少 4 个 H100 GPU 运行。

长上下文调优（LCT）

长上下文调优（LCT）旨在解决当前单次生成能力与现实叙事视频制作之间的差距。该技术通过数据驱动的方法直接学习场景级一致性，支持交互式多镜头开发和合成生成，适用于视频制作的各个方面。

FasterCache

FasterCache是一种创新的无需训练的策略，旨在加速视频扩散模型的推理过程，并生成高质量的视频内容。这一技术的重要性在于它能够显著提高视频生成的效率，同时保持或提升内容的质量，这对于需要快速生成视频内容的行业来说是非常有价值的。FasterCache由来自香港大学、南洋理工大学和上海人工智能实验室的研究人员共同开发，项目页面提供了更多的视觉结果和详细信息。产品目前免费提供，主要面向视频内容生成、AI研究和开发等领域。

暂无评论

您必须登录才能参与评论！

none

暂无评论...