HandRefiner解决AI图像生成中手部畸形的问题 目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。000Ai工具箱AI开源项目# Hand# HandRefiner
LiberSonora一个基于AI的、开源有声书工具集,LiberSonora提供智能字幕提取、AI标题生成、多语言翻译等功能,并且支持 GPU 加速、批量离线处理。000Ai工具箱AI开源项目# LiberSonora
Grounded-SAMGrounded-SAM:将 Grounded DINO 与 Segment Anything、 Stable Diffusion和Recognize Anything 相结合 - 自动检测、分割和生成任何东西000AI开源项目AI教程学习# Grounded-SAM# 未来百科
FUZZ由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。000Ai工具箱AI开源项目# FUZZ# 音乐生成
ChatTTS-Forge一个围绕 TTS生成模型开发的项目,ChatTTS-Forge为用户提供灵活的TTS生成能力,支持多种音色、风格控制、长文本推理等功能。000Ai工具箱AI开源项目# chattts# ChatTTS-Forge# tts
Open WebUI一个可扩展、功能丰富且用户友好的自托管 WebUI,适用于各种 LLM 运行器,支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。000Ai工具箱AI开源项目# Open WebUI# WebUI
Atomic Agents一个适用于构建模块化、可扩展的AI代理开源框架,它将复杂的AI系统分解为最小的、不可分割的组件,并通过这些组件的灵活组合来构建强大的 AI 应用。000Ai工具箱AI开源项目# AI Agent框架# Atomic Agents
Coze on WeChat一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互,支持文本、语音等多种交互方式。000Ai工具箱AI开源项目# Coze# wechat
Emote Portrait Alive阿里巴巴发布的EMO,一种音频驱动的AI肖像视频生成框架。通过输入单一的参考图像和语音音频,Emote Portrait Alive可以生成动态的、表情丰富的肖像视频。000Ai工具箱AI开源项目# Emote Portrait Alive# portrait
书生·物华2.0(3DTopia 2.0)采用创新的原语(primitive-based)三维表示方法PrimX,能够高效编码和生成具有物理基础渲染(PBR)特性的高质量三维资产。000AIGC开发平台AI开源项目# AIGC工具导航# AI开源项目# 书生·物华2.0(3DTopia 2.0)