Whisper(OpenAI)Whisper是一个开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练,这些数据是从网络上收集的。0140AIGC办公平台AI智能翻译# AI开源程序# AI背景降噪# AI语言翻译
TTS-Voice-WizardTTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。0120AIGC语音平台AI语音生成-文转音# AI文转音# AI语音生成# AI语音识别
配音阁讯飞配音是科大讯飞旗下明星配音产品品牌,提供合成配音,真人配音、广告宣传片、短视频配音、AI虚拟主播等一站式配音服务。0120AI视频剪辑AI视频工具# AI视频剪辑# AI视频工具# ai视频生成
Audioread官网把你的阅读变成播客: 听任何文章,PDF,电子邮件,等等。虽然PyDub可以轻松加载和解析各种音频文件格式,但它的速度却不理想,而且在处理一些特殊文件时,可能会出现一些奇怪的兼容性问题。这些问题一直是PyDub中比较令人困扰的地方。080AI语音识别-音转文AI音频生成# AI工作助手# AI工具# AI语音生成
RelayedRelayed是一款人工智能驱动的视频会议工具,旨在帮助团队克服远程工作、繁忙的日程安排和会议疲劳。它具有灵活的视频会议,异步对话,自动摘要,通过秘密链接和限制访问轻松共享,以及统一通信,并能够在以后重新访问和共享对话。040AIGC办公平台AI办公工具# Relayed