V-JEPA创新的自监督学习模型,它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容,还能在图像任务上表现出色,具有广泛的应用潜力。0160AIGC开发平台AI开源项目# AI开源项目# Transformer模型# V-JEPA
BrowserOS一款基于 Chromium 内核带 AI 代理功能的浏览器,能自动完成在线购物、信息收集等多种网页操作。它支持本地 Ollama 模型,保护用户隐私。0120Ai工具箱AI开源项目# AI浏览器# browser# BrowserOS
XHS-Downloader小红书链接提取/作品采集工具:提取账号发布、收藏、点赞作品链接;提取搜索结果作品链接、用户链接;采集小红书作品信息;提取小红书作品下载地址;下载小红书无水印作品文件!0110Ai工具箱AI开源项目# XHS-Downloader# 小红书
MotionAgent一站式视频生成工具MotionAgent 集成了大语言模型、文本生成图片模型、视频生成模型和音乐生成模型。0100Ai工具箱AI开源项目# AI开源# AI系统# MotionAgent
Lemon AI一个开源的全栈通用AI Agent,能从需求到成果交付全流程自动化。它在虚拟环境中可灵活调用各类工具,如编写并执行代码、智能浏览网页、操作网页应用、命令执行等。0100Ai工具箱AI开源项目# AI Agent# Lemon AI
SwiftChat一款基于React Native开发的快速、安全、跨平台聊天应用,支持实时流式聊天功能和Markdown语法,还可以生成AI图像,兼容DeepSeek、Amazon Bedrock、Ollama和OpenAI等模型。0100AI对话聊天工具AI开源项目# chat# swift# SwiftChat
NativeMind一款开源的本地化AI助手浏览器插件,支持Ollama和WebLLM两种本地模型,全部数据处理都在本地完成,有效保护用户隐私。090Ai工具箱AI开源项目# Mind# NativeMind
HiggsfieldHiggsfield是一款基于人工智能的视频模型,帮助用户轻松创建高质量的定制化视频内容,提供完全控制和独特视觉效果,适用于广告营销和品牌推广。090ai头像生成AI开源项目# GitHub# 不和谐社区# 免费
Open WebUI一个可扩展、功能丰富且用户友好的自托管 WebUI,适用于各种 LLM 运行器,支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。090Ai工具箱AI开源项目# Open WebUI# WebUI
ChatGPT+Midjourney一键免费部署私人 ChatGPT+Midjourney 网页应用 支持原ChatGPT-Next-Web所有功能 还额外支持AI绘图、图片放大、识图、 混图、垫图等等功能080AI开源项目AI编程# AI
ChatNio一个集合了各种流行的模型和服务的一站式平台,提供包括 OpenAI、Midjourney、Claude、讯飞星火、Stable Diffusion、DALL·E 等一站式的解决方案080Ai工具箱AI开源项目# chat# ChatNio
PydanticAI一个Pydantic 团队开发的Python代理框架,可以通过生成式AI轻松构建生产级应用程序。080Ai工具箱AI开源项目# AI Agent框架# AI代理# PydanticAI
AIdeaAIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等,支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。080Ai工具箱AI开源项目# AIdea# AI工具集
StableAvatar复旦大学、微软亚洲研究院和西安交通大学等机构的研究人员开发的一个能通过音频直接生成唱歌或说话视频的工具,而且视频时长不受限制,画面质量也很高。070Ai工具箱AI开源项目# avatar# Stable# StableAvatar
Eigent AI全球首个桌面端多智能体生产力平台,采用多智能体协作架构,通过拆分任务、并行处理来提高复杂任务的执行效率,支持本地部署和云端运行,还有人类参与机制,能保证结果准确可靠。070Ai工具箱AI开源项目# Eigent AI# 多智能体
Notebook Copilot有了 Notebook CoPilot,开发笔记本的过程变得更加容易。这个简单的工具可以毫不费力地根据您的输入生成代码和 Markdown 单元格,从而显着简化您的工作流程。070Ai工具箱AI开源项目# copilot# Notebook Copilot
长臂猿AIGC系统长臂猿AIGC系统内置智能聊天对话机器人、AI绘图、AI模型训练、营销内容创作、企业虚拟AI员工等数十项AI功能,可以训练自己的AI机器人,不限制用户数量,支持源码私有化部署。070Ai工具箱AI开源项目# AIGC系统# 剪
ChatGPT-Plus基于AI大语言模型 API 实现的 AI 助手全套开源解决方案,自带运营管理后台,开箱即用。集成了 OpenAI, Azure, ChatGLM,讯飞星火,文心一言等多个平台的大语言模型。集成了 MidJourney 和 Stable Diffusion AI绘画功能。070Ai工具箱AI开源项目# ChatGPT# ChatGPT-Plus
Pezzo AIPezzo是一款开源的AI平台,帮助您以10倍的速度交付具有影响力的AI功能,无需牺牲质量。通过Pezzo,您可以轻松构建、测试、监控和迭代AI功能,同时不断优化成本和性能。070AI开源项目AI教程学习# GitHub# 不和谐社区# 免费
FunASR 基础语音识别工具包FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调070AI开源项目AI编程# AI导航网# FunASR 基础语音识别工具包
MessAutoMessAuto 是一款 macOS 平台 自动提取 短信验证码并 粘贴回车 的软件,百分百由Rust开发,适用于任何APP,是 2FHey 的免费替代品。070AI开源项目AI编程# AI
LCM(Latent Consistency Models)由清华大学交叉信息科学研究院研发的一款生成模型。它的特点是可以通过少量步骤推理合成高分辨率图像,使图像生成速度提升 2-5 倍,需要的算力也更少。070AI开源项目AI编程# AI
Whisper语音识别模型Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。070Ai工具箱AI开源项目# AI开源# Whisper语音识别模型
HandRefiner解决AI图像生成中手部畸形的问题 目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。070Ai工具箱AI开源项目# Hand# HandRefiner
ExplorerTabUtility一款 Windows 11 资源管理器多标签扩展工具,它能把新窗口都改成标签页,还带快捷键操作,文件资源管理器用起来就像浏览器一样方便,标签页也能搜、能批量管。060Ai工具箱AI开源项目# Explorer# ExplorerTabUtility# tab
FaceChainFaceChain是一个可以用来打造个人数字形象的深度学习模型工具。用户仅需要提供最低一张照片即可获得独属于自己的个人形象数字替身。060Ai工具箱AI开源项目# AI写真# AI开源# FaceChain
Pull Request HelpAutomated Github Reviews是一款智能的自动化代码审查工具,帮助开发者提高代码质量和开发效率。060AI开源项目AI教程学习# 代码审查# 免费# 自动化工具
IP-Adapter-FaceID该模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceID结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。060Ai工具箱AI开源项目# face# IP Adapter FaceID
BotSharp一个基于.NET开发的开源AI多智能体应用开发框架,它可以快速将大型语言模型(LLMs)快速集成到现有业务系统中。060Ai工具箱AI开源项目# AI Agent框架# BotSharp
ChatGLM2-Voice-Cloning声音克隆和对话交互。它允许用户与喜欢的角色进行沉浸式对话,通过使用ChatGLM2模型和SadTalker模型来生成对话内容,并结合声音克隆技术实现角色的真实声音060AI开源项目AI编程# AI
DiffusionGPT字节跳动开发的由LLM驱动文本生成图像多合一系统,专门设计用于为不同的输入提示生成高质量的图像。060Ai工具箱AI开源项目# diffusion# DiffusionGPT# GPT
EmotiVoice易魔声EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。060AI工具集AI开源项目# EmotiVoice# EmotiVoice易魔声# 易魔声
Video-subtitle-remover基于AI的图片/视频硬字幕去除、文本水印去除,无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API,本地实现060AI开源项目AI编程# AI
VideoSrtVideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。060Ai工具箱AI开源项目# VIDEO# VideoSrt
EmotiVoiceEmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。060AI开源项目AI编程# AI导航网# EmotiVoice
FUZZ由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。060Ai工具箱AI开源项目# FUZZ# 音乐生成
ToonComposer腾讯推出的AI自动上色和生成动画工具,它能将动画制作里“补帧”和“上色”这两个步骤合并成“生成后原画”阶段,让动画制作流程变得更简单。050Ai工具箱AI开源项目# Toon# ToonComposer
PapermarkPapermark AI是一款与文档进行交互的AI助手,可以帮助您改进和优化演示文稿和销售文档,实现安全的文档共享,并提供实时分析和洞察力。050AI开源项目AI教程学习# 人工智能# 免费增值。# 文档交互助手
GenAI Agents一个专注于生成式AI Agents技术的开源项目,GenAI_Agents提供从基础到高级的教程与实现代码,帮助开发者学习并构建智能、交互式的AI系统。050Ai学习资源Ai工具箱# AI Agent# GenAI_Agents
8spAi系统8spAi系统集成了全模型AI问答、创作、绘画、文生图、思维导图一站搞定!GPT4对话识图、知识库训练、文档提问总结、DALLE-3绘图、Midjourney绘画动态全功能与思维导图自动生成等功能,为用户提供了智能化的服务和体验。050Ai工具箱AI开源项目# 8spAi系统# AIGC系统
Pixels2Flutterpixels2flutter是一款强大的截图转换工具,可以将UI截图快速转换为实际可用的Flutter代码,提高开发效率和用户体验。050AI开源项目AI教程学习# flutter# UI设计# 付费
Agent TARS一个字节跳动开源的多模态 AI 代理工具,Agent TARS能够通过视觉方式解释网页内容,从而实现流畅的浏览器操作。050Ai工具箱AI开源项目# Agent TARS# AI Agent框架
GeminiGemini是Google DeepMind推出的全新AI模型,集成了多模态推理功能,超越了以往模型的性能,适用于科学文献洞察、竞争性编程等多种应用场景。050Ai工具箱AI开源项目# Gemini# mini
I2VGen-XL:阿里推出的图生视频模型一个强大的图像到视频的生成模型,它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频,生成的视频不仅清晰度高,而且时序连贯,细节丰富,具有很高的真实感和艺术性。050AIGC开发平台AI开源项目# AI开源项目# I2VGen-XL:阿里推出的图生视频模型# 图像到视频生成
码多多ChatWork知识库系统码多多ChatWork智能知识库,可以进行AI对话、AI应用,拥有强大的第三方对接能力。适用企业智能客服、企业智能文档、专家顾问助理等多种企业级商业场景,具有较大的商业使用价值。050Ai工具箱AI开源项目# AIGC系统# 码多多# 码多多ChatWork知识库系统
Emote Portrait Alive阿里巴巴发布的EMO,一种音频驱动的AI肖像视频生成框架。通过输入单一的参考图像和语音音频,Emote Portrait Alive可以生成动态的、表情丰富的肖像视频。050Ai工具箱AI开源项目# Emote Portrait Alive# portrait
Aice PS网页版AI照片编辑器,利用Google aistudio的的先进能力,支持 AI 生成图片、智能修图、创意滤镜等功能,适用于创意设计、照片编辑等场景。040Ai工具箱AI开源项目# Aice PS# Photoshop
public-apis一个收集免费API的共享列表,包含各种各样的免费API,供开发者使用。这些API可以用于开发各种应用程序、网站和软件,为开发者提供了丰富的功能和数据源。040AI开源项目AI编程# AI
LucidDreamerLucidDreamer,可以从单个图像的单个文本提示中生成可导航的3D场景。 单击并拖动(导航)/移动和滚动(缩放)以感受3D。040Ai工具箱AI开源项目# Dream# Lucid# LucidDreamer
SparkAi系统SparkAi系统支持GPT4.0、Midjourney绘画、GPT3.5 API绘画、GPT联网功能、绘画广场功能、Prompt功能,后台自定义添加,用户也可自定义添加+实时语音识别输入、用户会员套餐、用户每日签到功能、支持手机电脑不同布局页面自适应。040Ai工具箱AI开源项目# AIGC系统# SparkAi系统
CosyVoice2.0先进的语音合成模型,通过其低延迟、高准确性和强稳定性的特点,为用户提供高质量的语音合成体验040AIGC开发平台AI开源项目# AIGC工具导航# AI开源项目# CosyVoice2.0
LinkedIn_AIHawk您的人工智能求职助手。自动化申请、LinkedIn_AIHawk让你获得个性化建议并更快地找到您梦想的工作。040Ai工具箱AI开源项目# AI求职# LinkedIn_AIHawk# 简历
赛博投简历一个AI自动投递简历的工具,结合chatgpt与rpa技术,实现一键自动寻找工作、根据自己的简历和工作描述生成求职信、发送给hr的全流程自动操作。040Ai工具箱AI开源项目# 简历# 赛博投简历
WhisperFusion一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。040Ai工具箱AI开源项目# Fusion# Whisper# WhisperFusion
eeChat简洁易用的大模型本地部署工具,支持开源模型 DeepSeek-R1, DLlama 3, Phi-4, Mistral, Gemma 3 等模型的本地化部署,专注于数据安全、隐私保护和高效的AI对话体验。040Ai工具箱AI开源项目# chat# eeChat
LiberSonora一个基于AI的、开源有声书工具集,LiberSonora提供智能字幕提取、AI标题生成、多语言翻译等功能,并且支持 GPU 加速、批量离线处理。040Ai工具箱AI开源项目# LiberSonora
Atomic Agents一个适用于构建模块化、可扩展的AI代理开源框架,它将复杂的AI系统分解为最小的、不可分割的组件,并通过这些组件的灵活组合来构建强大的 AI 应用。040Ai工具箱AI开源项目# AI Agent框架# Atomic Agents
Coze on WeChat一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互,支持文本、语音等多种交互方式。040Ai工具箱AI开源项目# Coze# wechat
书生·物华2.0(3DTopia 2.0)采用创新的原语(primitive-based)三维表示方法PrimX,能够高效编码和生成具有物理基础渲染(PBR)特性的高质量三维资产。040AIGC开发平台AI开源项目# AIGC工具导航# AI开源项目# 书生·物华2.0(3DTopia 2.0)
Dual AI Chat一个聊天应用,核心设计是让两个不同风格的人工智能通过辩论协作生成回答。默认接入 Google Gemini API,同时兼容其他 OpenAI 标准的 API 接口,也支持本地模型或其他托管服务。030Ai工具箱AI开源项目# chat# Dual AI Chat
WeKnoraWeKnora 是腾讯开源的文档理解与检索框架,基于大语言模型打造,专门适用于结构复杂、内容多样的文档场景。它采用模块化架构,整合了多模态预处理、语义向量索引、030Ai工具箱AI开源项目# WeKnora# 腾讯
Maxun.dev一个无代码网页数据提取平台,可以可靠、大规模地从网站提取和自动化数据,能将任何网站转为实时数据馈送,Maxun.dev使用简便,不用编码,几分钟就可以上手。030Ai工具箱AI开源项目# Maxun.dev
SuperClaudeSuperClaude 是一个为 Claude Code 量身打造的零门槛编程的上下文工程开源框架。它通过一系列专门设计的命令、认知角色和开发方法,可以大大增强Claude Code 的能力。030Ai工具箱AI开源项目# Claude# SuperClaude
Personalized Restoration一个面部图像精准恢复和个性编辑技术工具,不仅能复原受损图像细节,同时能精准捕捉和重现个人独特的面部特征。同时它还支持换脸。030Ai工具箱AI开源项目# Personalized Restoration
ChatGPT-Next-Web-LangChain一键免费部署你的跨平台私人 ChatGPT 应用, 支持 GPT3, GPT4 & Gemini Pro 模型。(基于 LangChain 实现插件功能)030AI开源项目AI编程# ChatGPT# ChatGPT-Next-Web
Deepfakes CreatorDeepfakes Creator,可以通过文本输入生成逼真的会说话的真人视频。用户只需要上传想要化身模仿的人的照片,并写一个剧本,工具就能创建出逼真的人物化身视频,模拟人物说话。030Ai工具箱AI开源项目# Deepfakes Creator
Seaweed APT一个具有突破性的AI工具,通过单步生成技术大幅提升了视频和图像生成的效率,同时保持了高质量的生成效果030AIGC开发平台AI开源项目# AIGC工具导航# AI开源项目# Seaweed APT
YDataYData Fabric是一款数据质量管理平台,通过自动化的数据质量分析和合成数据生成,帮助数据科学家提高工作效率,加快AI模型的交付速度,并提升数据质量。030AI开源项目AI教程学习# 免费# 合成数据# 数据质量
VideoDrafter一个高质量视频生成的开放式扩散模型,相比之前的生成视频模型,VideoDrafter最大的特点是能在主体不变的基础上,一次性生成多个场景的视频。030Ai工具箱AI开源项目# Drafter# VIDEO# VideoDrafter
PIAPIA是一款个性化图像动画生成器,可以生成具有高运动可控性和强文本和图像对齐性的视频,与条件图像对齐,通过文本实现动作控制,与各种个性化T2I模型兼容,无需特定调整。030Ai工具箱AI开源项目# PIA
Magic Resume一个现代化的在线简历编辑器,它基于 Next.js 和 Framer Motion 构建,可以让用户能够轻松创建专业的简历。030Ai工具箱AI开源项目# magic-resume# resume
VoiceStreamAI一个可以自己托管的 Whisper 解决方案,服务端是 Python,客户端是 JS,基于 WebSocket 实时通信,可以做到语音的实时传输和文本转换。030AI开源项目AI编程# AI
Platon.AI – 柏拉图智能Platon.AI柏拉图智能不仅仅是 AI 爬虫,也是 AI agents 的基础设施。 AI agents 要使用工具,就必须高速阅读理解在线网页,理解网页上的每一个元素——这就是 platon.AI 的技术。030Ai工具箱AI开源项目
Grounded-SAMGrounded-SAM:将 Grounded DINO 与 Segment Anything、 Stable Diffusion和Recognize Anything 相结合 - 自动检测、分割和生成任何东西030AI开源项目AI教程学习# Grounded-SAM# 未来百科
ChatTTS-Forge一个围绕 TTS生成模型开发的项目,ChatTTS-Forge为用户提供灵活的TTS生成能力,支持多种音色、风格控制、长文本推理等功能。030Ai工具箱AI开源项目# chattts# ChatTTS-Forge# tts
FastBuildAI一个面向AI开发者,创业者设计的开源AI应用框架,它几分钟就能部署好,通过可视化界面(不用写代码)就能快速做出带营销、计费和支付功能的 AI 应用,就算不是技术人员也能轻松上手。020Ai工具箱AI开源项目# FastBuildAI
Diffuse to Choose一种基于扩散的图像修复模型,主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节,适用于在线购物等虚拟试穿场景中的图像修复任务。020Ai工具箱AI开源项目# Diffuse to Choose
DemoFusion一个开源的 AI 图像重绘增强工具,通过使用最新的 BSR Gan技术,可以将低分辨率图像提升至高分辨率并修复和增强图像的细节。020Ai工具箱AI开源项目# demo# DemoFusion# Fusion
Make-A-Character文生3D数字人工具,借助 Make-A-Character,您可以毫不费力地从文本描述中生成可控、逼真、可动画的3D数字人角色。020Ai工具箱AI开源项目# Make-A-Character
SkyReels-V1中国首个面向AI短剧创作的视频生成模型,能够实现影视级人物微表情表演生成,支持33种细腻人物表情与400+种自然动作组合,高度还原真人情感表达。020Ai工具箱AI开源项目# AI短剧创作# SkyReels-V1
Wiseflow一款敏捷的信息挖掘开源免费工具,Wiseflow可以从网站、微信公众号、社交平台等各种信息源中按设定的关注点提炼讯息,自动做标签归类并上传数据库。020Ai工具箱AI开源项目# FLOW# Wise# Wiseflow
RTranslator一款开源、免费、离线的 Android 实时翻译应用程序。连接到拥有该应用程序的人,连接蓝牙耳机,将手机放入口袋中,然后您就可以像对方说您的语言一样进行对话。020Ai工具箱AI开源项目# RTranslator# translator
Animagine XL 3.1一个开源的文本生成图像动漫模型,通过整合新的数据集,Animagine XL 3.1扩展了对广泛动漫作品和风格的理解,从经典作品到最新发布的动漫,覆盖了从古老到现代的各种艺术风格。010Ai工具箱AI开源项目# Animagine XL 3.1
Media2Face一款革命性的语音面部动画生成工具,借助 Media2Face,现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。010Ai工具箱AI开源项目# Media2Face
Teable一个基于 Postgres 构建的超快速、实时、专业、开发人员友好的无代码数据库。Teable使用简单的、类似电子表格的界面来创建复杂的企业级数据库应用程序,无需编写代码。010Ai工具箱AI开源项目# able# Teable
Awesome-Ollama-Server一个用于实时监控和检测 Ollama 服务可用性和性能的系统。支持多语言,能够方便用户进行服务检测和性能监控。010Ai工具箱AI开源项目# Awesome-Ollama-Server