热门

musicgen-songstarter-v0.2

11个月前发布 15 00

musicgen-songstarter-v0.2是一个针对音乐制作人设计的音频生成模型，专门用于生成有用的旋律循环。该模型在Splice样本库中的旋律循环数据集上进行了微调，能够生成立体声音频，音频频率为32kHz。与v0.1版本相比，v0.2版本使用了三倍的独特样本，并且模型大小从中等提升到了大型。

收录时间：

2025-05-30

打开网站手机查看

音乐创作 # 音乐制作辅助 # 音乐生成 # 音频创作

musicgen-songstarter-v0.2

musicgen-songstarter-v0.2

musicgen-songstarter-v0.2是一个针对音乐制作人设计的音频生成模型，专门用于生成有用的旋律循环。该模型在Splice样本库中的旋律循环数据集上进行了微调，能够生成立体声音频，音频频率为32kHz。与v0.1版本相比，v0.2版本使用了三倍的独特样本，并且模型大小从中等提升到了大型。

数据统计

相关导航

YuE-s1-7B-anneal-en-cot

YuE是一个开创性的开源基础模型系列，专为音乐生成设计，能够将歌词转化为完整的歌曲。它能够生成包含吸引人的主唱和配套伴奏的完整歌曲，支持多种音乐风格。该模型基于深度学习技术，具有强大的生成能力和灵活性，能够为音乐创作者提供强大的工具支持。其开源特性也使得研究人员和开发者可以在此基础上进行进一步的研究和开发。

AI Jukebox

AI Jukebox是一个基于人工智能技术的音乐生成平台，通过Hugging Face提供服务。它允许用户输入提示词来生成特定风格的音乐，无需专业音乐背景即可创作音乐，鼓励人机合作，探索新的音乐创作方式，并为音乐爱好者提供灵感和创作工具。AI Jukebox易于访问和使用，降低了音乐创作的门槛，为用户提供广阔的音乐创作可能性。

SoundStorm

SoundStorm是由Google Research开发的一种音频生成技术，它通过并行生成音频令牌来大幅减少音频合成的时间。这项技术能够生成高质量、与语音和声学条件一致性高的音频，并且可以与文本到语义模型结合，控制说话内容、说话者声音和说话轮次，实现长文本的语音合成和自然对话的生成。SoundStorm的重要性在于它解决了传统自回归音频生成模型在处理长序列时推理速度慢的问题，提高了音频生成的效率和质量。

Music Eleven AI

Music Eleven AI是一款AI音乐生成器，使用先进的机器学习模型，能够从文本描述中生成完整的音乐作品，包括旋律、和声、节奏和人声。产品具有商业授权，支持30多种音乐风格，适用于创作者、音乐人和企业。价格分为Starter、Creator和Professional三个计划。

Suno-API

SunoAPI 是一个基于 Python 和 FastAPI 的非官方 Suno API。它支持生成歌曲、歌词等功能，并带有内置的令牌维护和保持活跃功能，让您无需担心令牌过期。SunoAPI 采用全异步设计，运行速度快，适合后续扩展。用户可以轻松使用 API 生成各种音乐内容。

Lyria2

Lyria 2 是最新的音乐生成模型，能够创作多种风格的高保真音乐，适用于复杂的音乐作品。该模型不仅为音乐创作者提供了强大的工具，还推动了音乐生成技术的发展，提升了创作效率。Lyria 2 的目标是让音乐创作变得更加简单和可及，为专业音乐人和爱好者提供灵活的创作支持。

Stable Audio ControlNet

Stable Audio ControlNet 是一个基于 Stable Audio Open 的音乐生成模型，通过 DiT ControlNet 进行微调，能够在具有 16GB VRAM 的 GPU 上使用，支持音频控制。此模型仍在开发中，但已经能够实现音乐的生成和控制，具有重要的技术意义和应用前景。

JASCO

JASCO是一个结合了符号和基于音频的条件的文本到音乐生成模型，它能够根据全局文本描述和细粒度的局部控制生成高质量的音乐样本。JASCO基于流匹配建模范式和一种新颖的条件方法，允许音乐生成同时受到局部（例如和弦）和全局（文本描述）的控制。通过信息瓶颈层和时间模糊来提取与特定控制相关的信息，允许在同一个文本到音乐模型中结合符号和基于音频的条件。

暂无评论

您必须登录才能参与评论！

none

暂无评论...