声音克隆

共 9 篇网址

排序

发布更新浏览点赞

VoiSpark

VoiSpark是一个AI语音生成平台，能生成逼真的文本转语音，克隆声音，并为视频、播客等定制独特AI声音。该平台具有100%免费试用。

0240

语音处理 # AI # 声音克隆 # 多语言支持

WeClone

WeClone 是一个基于微信聊天记录微调大语言模型的项目，主要用于实现高质量的声音克隆和数字分身。它结合了微信语音消息和 0.5B 大模型，允许用户通过聊天机器人与自己的数字分身互动。该技术在数字永生和声音克隆领域具有重要的应用价值，可以让用户在不在场的情况下继续与他人交流。此项目正在快速迭代中，适合对 AI 和语言模型感兴趣的用户，且目前处于免费的开发阶段。

0140

智能聊天机器人 # AI # 声音克隆 # 大语言模型

coqui ai

在几秒钟内克隆您的声音或从我们可用的 AI 声音中进行选择，每个版本都会添加更多.人们常说，声音是灵魂的镜子。现在，Coqui AI让您的声音更具价值，让您的声音得以永存。

0140

AI语音合成 AI语音生成-文转音 # AIGC语音平台 # ai语音合成 # AI语音生成-文转音

OuteTTS-0.2-500M

OuteTTS-0.2-500M是基于Qwen-2.5-0.5B构建的文本到语音合成模型，它在更大的数据集上进行了训练，实现了在准确性、自然度、词汇量、声音克隆能力以及多语言支持方面的显著提升。该模型特别感谢Hugging Face提供的GPU资助，支持了模型的训练。

0130

文案写作 # 声音克隆 # 多语言支持 # 文本到语音

Dia AI

Dia 是一个由 Nari Labs 开发的文本到语音（TTS）模型，具有 1.6 亿参数，能够直接从文本生成高度逼真的对话。该模型支持情感和语调控制，并能够生成非言语交流，如笑声和咳嗽。它的预训练模型权重托管在 Hugging Face 上，适用于英语生成。此产品对于研究和教育用途至关重要，能够推动对话生成技术的发展。

0100

文案写作 # AI # 声音克隆 # 对话生成

OuteTTS-0.1-350M

OuteTTS-0.1-350M是一款基于纯语言模型的文本到语音合成技术，它不需要外部适配器或复杂架构，通过精心设计的提示和音频标记实现高质量的语音合成。该模型基于LLaMa架构，使用350M参数，展示了直接使用语言模型进行语音合成的潜力。它通过三个步骤处理音频：使用WavTokenizer进行音频标记化、CTC强制对齐创建精确的单词到音频标记映射、以及遵循特定格式的结构化提示创建。OuteTTS的主要优点包括纯语言建模方法、声音克隆能力、与llama.cpp和GGUF格式的兼容性。

090

文案写作 # 声音克隆 # 文本到语音 # 语言模型

声音克隆So-VITS-SVC 4.0

AI孙燕姿 / AI歌手 / 声音克隆，歌声转换So-VITS-SVC 4.0源代码

080

AI声音克隆 # AI孙燕姿 # AI歌手 # So-VITS-SVC

DeepFuze

DeepFuze是与ComfyUI无缝集成的先进深度学习工具，用于革新面部转换、lipsyncing、视频生成、声音克隆和lipsync翻译。利用先进的算法，DeepFuze使用户能够以无与伦比的真实性结合音频和视频，确保完美的面部动作同步。这一创新解决方案非常适合内容创作者、动画师、开发者以及任何希望以先进的AI驱动功能提升其视频编辑项目的人士。

080

视频生成 # lipsyncing # 声音克隆 # 深度学习

All Voice Lab

AI语音创作平台，集成文本转语音、视频翻译、声音克隆等多元能力，支持多语种多音色互换。

070

AI声音克隆 AI语音工具 # AI语音 # AI配音 # 变声器