Stable Audio Open 1.0

7个月前发布 8 00

Stable Audio Open 1.0是一个利用自编码器、基于T5的文本嵌入和基于变压器的扩散模型来生成长达47秒的立体声音频的AI模型。它通过文本提示生成音乐和音频,支持研究和实验,以探索生成性AI模型的当前能力。该模型在Freesound和Free Music Archive (FMA)的数据集上进行训练,确保了数据的多样性和版权...

收录时间:
2025-05-30
Stable Audio Open 1.0Stable Audio Open 1.0

Stable Audio Open 1.0是一个利用自编码器、基于T5的文本嵌入和基于变压器的扩散模型来生成长达47秒的立体声音频的AI模型。它通过文本提示生成音乐和音频,支持研究和实验,以探索生成性AI模型的当前能力。该模型在Freesound和Free Music Archive (FMA)的数据集上进行训练,确保了数据的多样性和版权合法性。

数据统计

相关导航

AMT-APC

AMT-APC

AMT-APC是一种通过微调自动音乐转录(AMT)模型来训练自动钢琴封面生成模型的方法。该模型使用Sony的hFT-Transformer作为基础AMT模型,并在从YouTube收集的钢琴封面数据集上进行训练。这种技术的重要性在于它能够自动生成钢琴封面,为音乐创作者和爱好者提供了一个强大的工具,使他们能够快速地将音乐作品转化为钢琴演奏版本。AMT-APC的背景信息包括其在GitHub上的代码库和相关的研究论文,这表明了其在学术和技术社区中的定位。目前,该模型是免费提供给用户的。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...