AI大模型 - 168导航 - 网址大全AI大模型官网，AI大模型导航为您提供服务，精心挑选，安全无毒，找AI大模型网址就来168导航 - 网址大全，这里收集全网最全的网站资源。 - 168导航

排序

YuE

YuE是由香港科技大学开发的开源音乐生成模型，专注于从给定的歌词生成完整的音乐音频。YuE 支持多种音乐风格和语言，能够生成高质量的声乐和伴奏部分，适用于各种音乐创作需求。通过 YuE，用户可以轻松生成长达 5 分钟的完整歌曲，实现创意音乐制作。

0420

LTX Video

LTX Video是由 Lightricks公司推出的首个REAL-TIME AI视频生成开源模型。它基于 DiT (Diverse Image Transformer) 架构，能够实时生成高质量的视频。LTX Video 能够以 24 FPS 和 768x512 分辨率生成视频，生成速度比观看速度还要快。

0320

AI大模型 # ai视频生成 # LTX Video # 开源视频工具

启真医学大模型

启真医学大模型概览发布时间2023年5月23日英文名称QiZhenGPT模型版本QiZhen-CaMA-13B-Checkpoint-12400更新时间2023年06月27日参数量级13B所属公司浙江大学行业类型医学大模型开源协议https://github.com/CMKRG/QiZhenGPT 启真医学大模型简介启真大模型是一个中文开源的医学大模型，利用启真医学知识库构建的中文医学指令数据

0280

AI大模型 # AI大模型 # 医学大模型 # 启真大模型

Aiuni AI

Aiuni AI 是一款基于 Unique3D 开源技术的在线 AI 图片转 3D 模型生成建模工具，它能够在 30 秒内将单张图片转换为高质量的 3D 模型。用户通过简单的图片上传和点击生成，用户即可获得 360 度无死角的 3D 模型，确保每个角度都具有一致性和高质量的细节。

0280

AI大模型 # 3D 建模工具 # 3D 模型生成 # Aiuni AI

Tora

Tora 是阿里团队推出的一个视频生成模型，能够根据轨迹、图像、文本或其组合，快速生成精确运动控制的视频。它支持多种输入方式，如轨迹、文本和图像，并能生成高分辨率、运动可控的视频。

0280

AI大模型 # AI视频生成工具 # 文本驱动视频生成 # 生成式AI视频工具

星火大模型

讯飞星火大模型是由科大讯飞推出的新一代认知智能大模型，拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务。可基于自然文本、语音的方式提供多场景文本生成、语言理解、知识问答、逻辑推理、数学解答、代码生成和多模态7大能力，快速生成文本、图片、代码等内容。

0280

AI大模型 # 国内大模型公司 # 星火大模型 # 科大讯飞大语言模型

Boximator

Boximator是字节跳动推出的一款利用深度学习技术进行视频合成的先进工具。它使用文本提示和额外的盒子约束来生成丰富且可控制的视频运动，从而为用户创造独特的视频场景提供了灵活的运动控制。具体来说，Boximator可以通过文本精准控制生成视频中人物或物体的动作，能生成包含多个角色以及特定类型运动的复杂场景，并能精确生成物体和背景的细节。

0270

AI大模型 # AI动画生成器 # AI视频生成工具 # AI视频编辑工具

光语金帆

光语金帆是由无限光年公司推出的金融大模型，结合了顶尖的人工智能技术和人才资源，旨在构建超越客户期望的人工智能生成内容（AIGC）产品组合，推动金融行业生产力和用户交互体验的全面提升，实现金融服务的智能化、公平化和普惠化。

0260

AI大模型 # AI财报点评 # 光语金帆 # 智能投研工具

MusiConGen

MusiConGen是一种基于Transformer的文本到音乐生成模型。它通过引入时间条件机制，显著提升了对音乐节奏和和弦的控制能力。该模型是在预训练的MusicGen-melody框架基础上进行微调的，主要用于生成各种风格的音乐片段。

0260

AI大模型 # AI音乐创作 # MusiConGen # MusiConGen AI音乐生成框架

CodeGemma

CodeGemma是一个由Google基于Gemma模型开发的开源代码模型系列。它专为代码生成和理解而设计，提供了强大的代码自动补全和生成功能。CodeGemma支持多种编程语言，适用于软件开发、编程教育和跨语言开发项目。它的主要功能包括智能代码补全、代码生成、代码理解、多语言支持、代码优化建议以及错误检测与修正，旨在提高开发者的编码效率和软件质量。

0260

AI大模型 # AI代码助手 # AI代码生成 # AI代码生成工具

悟道大模型

悟道大模型是由北京智源人工智能研究院发起的超大规模预训练模型研究项目，不仅具备强大的语言理解和生成能力，还能进行逻辑推理、代码分析、图像生成等多种任务，支持多种类型的文本内容生成，如小说、歌词、诗歌、对联等。

0260

AI大模型 # 人工智能大模型 # 基础模型研究中心 # 大模型

“阅文妙笔”网文大模型

阅文妙笔大模型是阅文集团发布的国内首个网文大模型。它是基于阅文集团的海量网文数据和专业知识，利用人工智能技术训练出来的一个能够理解和生成网文内容的模型。

0250

AI大模型 # AI大模型 # 作家助手妙笔版内测报名 # 阅文妙笔

BloombergGPT金融大模型

BloombergGPT是Bloomberg公司开发的一个大语言模型(LLM)，专门为金融领域设计，它有50亿个参数，是基于OpenAI的GPT技术训练的。

0250

AI大模型 # AI大模型 # Bloomberg # BloombergGPT

扁鹊生活空间健康大模型

扁鹊大模型是一个中文医疗对话模型，可以根据用户的问题和描述，提供医疗知识、建议和援助。经过千万规模中文健康对话数据指令微调，提高医疗聊天模型的“问”能力。

0250

AI大模型 # AI大模型 # 健康大模型 # 医学大模型

PixArt-Σ

PIXART-Σ是华为推出的图像生成模型，由华为诺亚方舟实验室、大连理工大学和香港大学的研究团队开发。采用Diffusion Transformer (DiT) 架构，专用于生成 4K 分辨率的 AI 图像。用户只需输入一段文字描述就能生成具有4K高分辨率的图像，相较于前身PixArt-α，它提供了更高的图像保真度和与文本提示更好的对齐。

0250

AI大模型 # 4K分辨率图像生成 # 4K图像生成 # Diffusion Transformer

PixelDance

PixelDance是由字节跳动开发的一款高动态视频生成模型，它能够根据用户提供的图片和文本描述来生成具有复杂场景和动态效果的视频。这项技术特别在于它结合了图像指令（针对视频片段的首尾帧）和文本指令，使得生成的视频不仅视觉上丰富，而且动作细节丰富，能够展现出高度的动态性。

0250

AI大模型 # AI视频生成模型 # PixelDance # PixelDance视频生成模型

AppMall应用商店

AppMall是一个创新的网页端AI应用商店，致力于为用户打造一个高效、灵活的AI应用生态系统。AppMall提供多种AI应用供用户安装和使用，通过直观的界面以及便捷的操作，用户可以轻松管理AI应用、下载模型。无论是数据处理、模型训练，还是部署智能应用，AppMall AI应用中心都可以为您提供便捷的解决方案。

0240

AI大模型 AI编程开发 # AI大模型 # AI应用市场 # AI应用聚合

Monica bots

Monica Bots是一款基于先进AI模型（如 GPT-4、Claude、Gemini 等）的多功能AI助手，能助力用户快速创建和部署智能助手（Bots）的平台，Monica Bots支持跨平台使用，包括浏览器插件（Chrome、Edge、Safari）、桌面端（Windows、macOS）和移动端（iOS、Android）。它集成了聊天、写作、翻译、数据分析、AI 绘图等多项功能，让即使没有技术背景的人也能轻松上手构建和管理自己的AI应用，满足各种场景需求。

0240

AI大模型 # AI大模型 # Monica Bots # 分类导航

琴乐大模型

琴乐大模型是由腾讯AI Lab与腾讯TME天琴实验室共同研发的人工智能音乐创作大模型。它可以通过输入中英文关键词、描述性语句或音频，能够直接生成立体声音频或多轨乐谱。

0240

AI大模型 # AI音乐创作大模型 # AI音乐创作工具 # 腾讯琴乐大模型

Moonvalley.ai

Moonvalley.ai是一款功能强大的文本到视频生成式AI模型。它可以从简单的文字描述中生成高清视频和动画，涵盖各种不同的风格，包括超现实视频、动漫以及介于两者之间的所有内容。用户只需提供简要的文字提示，即可创造电影级的视觉效果。该模型主打高清、16:9电影画质，视频质量比大多数其他一代AI视频工具要好得多。

0240

AI大模型 # AI 视频生成工具 # Moonvalley.ai # Moonvalley.ai AI视频转换工具

悟道大模型

0240

AI大模型 # 人工智能大模型 # 基础模型研究中心 # 大模型

Gen-3 Alpha

Gen-3 Alpha是Runway公司开发的一款先进的AI视频生成模型。它能够根据用户的输入（如文本描述、图像或视频片段）创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。

0240

AI大模型 # AI视频创作工具 # AI视频生成模型 # AI视频编辑控制

天壤小白大模型

天壤小白是基于语言大模型的AI应用开放平台，无需代码开发，即可快速、灵活地搭建个性化的AI应用。通过提示词工程、语义搜索、向量数据库等各类AI工具组件，破解幻觉难题，为开发者和企业提供一站式的大模型应用服务。覆盖知识管理、市场销售、客户服务、内容生成、辅助决策、多语言翻译等多个场景。

0240

AI大模型 # AI助手 # Embedding # SQL生成

灵医bot – 百度医疗健康大模型

灵医Bot是百度旗下的医疗健康大模型，它基于百度文心大模型的强大知识图谱和知识理解能力，为医疗行业提供智能问答、文档理解、病历生成、辅助诊疗、病历质控等多种场景化服务。

0230

AI大模型 # AI大模型 # 健康大模型 # 医疗大模型

MuseV

MuseV是一个由腾讯音乐娱乐旗下的天琴实验室推出的基于SD扩散模型的高保真虚拟人视频生成框架。支持文生视频、图生视频、视频生视频等多种生成方式，能够保持角色一致性，且不受视频长度限制。这意味着用户可以通过MuseV轻松地将文本、图像或现有视频转换成高质量的虚拟人视频，无需担心角色形象的不统一或视频时长的限制。

0230

AI大模型 # ai数字人视频 # AI数字人视频生成 # MuseV

火山方舟大模型

火山方舟是一个由火山引擎推出的大模型服务平台，面向企业提供模型精调、评测、推理等全方位的平台服务。集成了国内多个优秀的大模型，如 MiniMax、智谱 AI、复旦 MOSS 等，覆盖了自然语言处理、计算机视觉、语音识别等多个领域。火山方舟旨在为大模型的开发、应用、运营提供一站式的解决方案，降低大模型使用的门槛，推动大模型的产业化和普及。

0230

AI大模型 # 大模型服务平台 # 火山方舟 # 火山方舟大模型

孟子大模型

孟子大模型是澜舟科技推出的大规模预训练语言模型，可处理多语言、多模态数据，同时支持多种理解和生成任务，能快速满足不同领域、不同应用场景的需求。

0220

AI大模型 # AI大模型 # 孟子GPT # 孟子大模型

天工大语言模型

「天工」是国内首个对标ChatGPT的双千亿级大语言模型，也是一个对话式AI助手。「天工」通过自然语言与用户进行问答交互，AI生成能力可满足文案创作、知识问答、逻辑推演、数理推算、代码编程等多元化需求。

0220

AI大模型 # AI大模型 # AI搜索 # 天工AI

智海-录问 – 法律大模型

智海-录问是由浙江大学、阿里巴巴达摩院以及华院计算三家单位共同设计研发的法律大模型。

0220

AI大模型 # AI大模型 # ai法律 # 法律大模型

ModelScope创空间

魔搭社区是一个汇聚各领域最先进的机器学习模型的平台，为用户提供模型探索体验、推理、训练、部署和应用的一站式服务。快速实现机器学习模型的应用，提升数据处理和分析效率。

0220

AI大模型 AI社区 # 人工智能 # 开发者社区 # 开源

Goku

Goku 是一个基于流生成的视频生成基础模型，由香港大学和字节跳动研究团队共同开发。Goku 模型主要用于生成高质量的视频内容，尤其在广告和营销场景中表现尤为出色。

0220

AI大模型 AI工具 # 图像到视频生成 # 多模态视频生成 # 文本到视频生成

AnimateZero

AnimateZero是腾讯AI团队发布的一款AI视频生成模型，通过改进预训练的视频扩散模型(Video Diffusion Models)，能够更精确地控制视频的外观和运动，实现从静态图像到动态视频的无缝转换。

0220

AI大模型 # AI视频生成模型 # AnimateZero # AnimateZero动画生成器

CatVTON

CatVTON是一款基于扩散模型的虚拟试穿技术工具，旨在提供高效、低资源需求的虚拟试穿体验。通过在空间维度上简单地拼接服装和人物图像来实现不同类别服装的虚拟试穿，该方法有效地降低了模型复杂度和计算成本，同时保持了高质量的虚拟试衣效果，特别适用于电商平台、时尚设计、个人造型顾问、增强现实应用和虚拟时装秀等场景。

0220

AI大模型 # AI虚拟试衣 # AI虚拟试衣工具 # CatVTON

UniVG

UniVG是百度推出的一种统一模态视频生成系统。它能够处理多种输入模态，如文本和图像，并生成与输入语义高度一致的视频。UniVG采用了多条件交叉注意力技术和偏置高斯噪声方法，以提高生成视频的质量和保留原始内容。

0220

AI大模型 # UniVG视频生成 # UniVG视频生成系统 # 多模态视频生成

Boximator

0220

AI大模型 # AI动画生成器 # AI视频生成工具 # AI视频编辑工具

文心千帆

文心千帆是百度智能云推出的产业级知识增强大模型，包括基础大模型、任务大模型、行业大模型，以及丰富的工具与平台，支撑企业与开发者进行高效便捷的应用开发。它能够从海量数据和大规模知识中融合学习，效率更高，效果更好，具备知识增强、检索增强和对话增强的技术特色。

0220

AI大模型 # 大模型平台 # 文心千帆 # 文心千帆大模型平台

VideoCrafter2

VideoCrafter2是腾讯推出的一个先进的视频生成模型，它借助深度学习技术，致力于提高视频的视觉质量、动态效果以及概念组合，能够根据用户提供的文本描述生成高质量、流畅的视频作品。

0220

AI大模型 # AI视频生成模型 # VideoCrafter2 # VideoCrafter2 图像到视频转换

中国移动“九天”人工智能大模型

0210

AI大模型 # AI大模型 # 客服大模型 # 政务大模型

超拟人大模型 – 聆心智能

CharacterGLM超拟人大模型由聆心智能与AI大模型公司智谱AI深度合作，基于GLM基座深度优化升级打造而成。

0210

AI大模型 # AI大模型 # Character.AI

TeleChat大模型 – 中国电信

TeleChat大语言模型概览名称TeleChat大语言模型所属公司中国电信参数量级百亿级别发布时间2023年7月3日 TeleChat大语言模型简介 2023年7月3日，2023 全球数字经济大会人工智能高峰论坛上，中国电信集团数字智能科技分公司副总经理张鑫公布中国电信版 ChatGPT 产品 TeleChat 大模型。该模型支持输出代码、写演讲稿等，其公司研发目标是成为“百亿级 AI 服务

0210

AI大模型 # AI大模型 # TeleChat # 中国电信

NotaGen

NotaGen 是由中央音乐学院与清华大学等机构联合研发的AI音乐生成模型，专注于生成高质量古典音乐乐谱，同时支持流行音乐创作。作为开源项目，其目标是推动音乐与人工智能的深度融合，为专业作曲家、教育机构及音乐爱好者提供创作辅助工具。

0210

AI大模型 # AI古典音乐生成模型 # AI大模型 # 分类导航

DeepSeek

DeepSeek（深度求索）是一款当前非常火爆的开源大型语言模型，因其性能媲美世界顶尖的闭源模型如 ChatGPT 和 Claude 而备受瞩目。该模型在极低成本的情况下完成训练，为用户提供了高效、精准的语言理解和生成能力。

0210

AI大模型 AI对话聊天 # DeepSeek # 开源语言模型

Qwen2

Qwen2是由阿里云通义千问团队开源的新一代大语言模型。这个系列包括了不同规模的解码器语言模型，从0.5B到72B不等，涵盖了中文和英文以及其他27种语言的高质量数据。Qwen2的设计旨在提高模型在自然语言理解、代码编写、数学解题和多语言处理方面的能力。

0210

AI大模型 # Qwen2大语言模型

悟道大模型

0210

AI大模型 # 人工智能大模型 # 基础模型研究中心 # 大模型

悟道大模型

0210

AI大模型 # 人工智能大模型 # 基础模型研究中心 # 大模型

腾讯混元DiT

腾讯混元DiT是一个基于Diffusion transformer的文本到图像生成模型，也是业内首个中文原生的DiT架构文生图开源模型。该模型具有中英文细粒度理解能力，能够与用户进行多轮对话，根据上下文生成并完善图像。

0210

AI大模型 # AI广告创意工具 # 中文原生Diffusion Transformer模型 # 中文文生图模型

讯飞星火大模型

讯飞星火大模型是科大讯飞发布的一个基于深度学习的自然语言处理模型，以中文为核心，具备跨领域多任务上的类人理解和生成能力。注册免费领取1500万Tokens，该模型对标ChatGPT，并在多个领域表现出色。

0210

AI大模型 # 人工智能大模型 # 国内大模型公司 # 大语言模型

Face Adapter

Face Adapter 是一种专门为预训练的扩散模型设计的适配器，主要用于面部重演和面部交换任务。它能够实现高精度和高保真度的面部编辑，提供精细的个体识别和属性控制功能。

0210

AI大模型 # AI在线换脸器 # AI换脸工具 # AI换脸模型

盘古大模型

盘古大模型 3.0 是一个面向行业的AI大模型系列，包含自然语言、视觉、多模态、预测、科学计算大模型等五个基础大模型，可以为用户提供知识问答、文案生成、代码生成，以及多模态大模型的图像生成、图像理解等能力。

0210

AI大模型 # AI模型训练 # AI预测模型 # 千亿参数AI模型

Veo

Veo 是 Google DeepMind 开发的一种先进的视频生成模型。它能够生成1080p高分辨率、长时长的高质量视频。Veo 支持多种电影和视觉风格，能够准确捕捉文本提示的细微差别，并提供创意控制。这个模型旨在使视频制作更易于访问，并在叙事、教育等领域开启新的可能性。

0210

AI大模型 # AI 视频生成工具 # AI视频生成器 # ai视频生成工具有哪些

阿里云百炼

阿里云百炼是基于通义大模型、行业大模型以及三方大模型的一站式大模型开发平台。面向企业客户和个人开发者，提供完整的模型服务工具和全链路应用开发套件，预置丰富的能力插件，提供API及SDK等便捷的集成方式，高效完成大模型应用构建。

0210

AI大模型 # AI大模型开发平台 # AI应用开发平台 # AI模型部署平台

TechGPT-东北大学

TechGPT是一种强大的自然语言处理工具，具有广泛的应用领域，包括计算机科学、材料、机械、冶金、金融和航空航天等。

0200

AI大模型 AI开放平台 # 人工智能 # 自然语言处理

Amazon Tian大模型

Amazon Titan大模型是亚马逊推出的一系列功能强大的文本和图像生成式人工智能模型，可以用于执行各种自然语言和计算机视觉任务，如文本生成、摘要、分类、问答、信息提取、图像生成、图像描述等。

0200

AI大模型 # AI大模型 # amazon # Tian

MiniGPT-4 | AI看图

MiniGPT-4上传图片并用自然语言与他们聊天，Demo开放在线可玩！

0200

AI 聊天与助手 ai图片生成 # GPT-4

AnythingLLM 本地AI知识库

AnythingLLM | The ultimate AI business intelligence tool

0200

AI大模型 AI导航 # 互联网工具 # 智能神器 # 高效工具

千穰大模型

航旅纵横发布的民航领域垂直大模型，目前仅供航旅纵横Plus会员申请使用

0200

AI大模型 AI训练模型 # 民航大模型 # 航旅纵横

天谱乐

天谱乐是唱鸭旗下的AI音乐品牌，为用户提供个性化、智能化的音乐创作体验。它支持文本、图片和视频生成音乐，让创作变得简单便捷。利用先进的多模态理解与生成技术，天谱乐能够生成与图片和视频情感高度契合的音乐，并提供发行级的歌曲创作服务。无论是专业音乐人还是普通爱好者，天谱乐都能帮助您高效创作出独一无二的音乐作品。

0200

AI大模型 AI工具 # AI音乐创作平台 # 在线AI音乐创作平台 # 天谱乐

RMBG-2.0

RMBG-2.0是由BRIA AI 开发的开源图像背景移除模型，通过先进的卷积神经网络（CNN）实现高精度的前景与背景分离。该模型在经过精心挑选的数据集（包括一般图像、电子商务、游戏和广告内容）上进行了训练，专为大规模企业内容创建的商业用例设计，其准确性、效率和多功能性可以媲美领先的 Source Available 型号。

0200

AI大模型 # BRIA AI RMBG-2.0 # RMBG-2.0 # 开源背景移除模型

Llama 2

Llama 2是Meta AI推出的新一代大型语言模型（LLM），参数规模从70亿到700亿不等。它是为对话场景而优化的，称为Llama 2-Chat，能够在多数基准上超越开源的对话模型，并且在人类评估的有用性和安全性上，可能是闭源模型的合适替代品。

0200

AI大模型 # Llama 2 # Llama 2大模型 # Llama 2模型

Idea-2-3D

Idea-2-3D 是一个3D 模型生成框架，能够从多模态输入（如文本、图像和 3D 模型）中生成高质量的 3D 模型。该框架由三个基于大型多模态模型（LMM）的智能代理组成，分别负责生成提示、选择模型和反馈反映。通过这些代理的协作和批评循环，Idea-2-3D 能够自动生成与输入高度一致的 3D 模型。

0200

AI大模型 # 3D模型生成 # Idea-2-3D # Idea-2-3D生成框架

Yi大模型

Yi大模型是由李开复博士领导的AI公司“零一万物”发布的一款开源的中英双语预训练大模型。这个模型在多个性能指标上取得了国际最佳性能认可，被称为“全球最强开源模型”。Yi-34B模型特别之处在于它拥有全球最长的200K上下文窗口，能够处理40万汉字的超长文本输入，这在语言模型中是非常重要的，因为它对于理解和生成与特定上下文相关的文本至关重要。

0200

AI大模型 # Yi大模型 # 中英双语预训练大模型 # 多模态AI模型

IMYAI智能助手

IMYAI智能助手是一款功能强大、简单易用的AI服务平台,集成了GPT4、Claude、Midjourney、Stable Diffusion等先进技术。无论您是需要写作灵感、绘画创意,还是寻求办公助理、生活规划,IMYAI都能提供专业、高效的解决方案。

0200

AI大模型 # IMYAI智能助手 # 多模态AI大语言模型 # 多模态AI模型

DriveGPT 雪湖·海若 | 自动驾驶生成式大模型

"雪湖·海若"是毫末智行发布的自动驾驶生成式大模型，它通过引入驾驶数据建立RLHF（人类反馈强化学习）技术，对自动驾驶认知决策模型进行持续优化，现阶段主要用于解决自动驾驶的认知决策问题，终极目标是实现端到端自动驾驶。

0190

AI大模型 # AI大模型 # DriveGPT # 毫末智行

学而思九章大模型（MathGPT）

学而思九章大模型（MathGPT）是好未来教育集团自主研发的一款专注于数学问题解决和教学的人工智能应用。

0190

AI大模型 # AI大模型 # MathGPT # 九章大模型

Amazon Nova

Amazon Nova是亚马逊云科技（AWS）推出的一系列生成式AI基础模型（Foundation Models），可以为用户提供高效、低成本的多模态处理能力。Amazon Nova系列模型包括Amazon Nova 理解模型、Amazon Nova 创意内容生成模型、Amazon Nova Act 智能体。Amazon Nova系列模型支持多种语言，并完美结合准确性、速度与成本效率，适用于各种智能任务。Amazon Nova系列模型目前仅在亚马逊的Bedrock平台上提供早期试用。

0190

Agent智能体 AI大模型 # Agent智能体 # AI基础模型 # AI大模型

知海图Chat

知海图Chat是知乎与面壁智能合作推出的新一代中文大语言模型，能与你互动对话，帮你了解世界知识、处理数理逻辑、编写程序代码、激发创作灵感；利用海量知识数据，帮助你更好地获取信息、做出规划、解决问题。

0190

AI大模型 AI编程开发 # AI 聊天问答 # AI大模型 # 知乎

“鸿湖”大模型 – 中国联通

鸿湖图文AI大模型1.0，是首个面向运营商增值业务的大模型。

0190

AI大模型 # AI大模型 # 中国联通 # 鸿湖图文大模型

S2V.AI

S2V.Ai是由MiniMax公司推出的一项创新AI视频生成技术，通过S2V-01模型，用户只需上传一张图片，就能将图片中的主体转化为视频中的角色，并实现高度一致性和自然过渡。这项技术为用户提供了快速、低成本、高质量的视频生成解决方案。

0190

AI大模型 AI工具 # ai视频生成 # AI视频生成模型 # MiniMax AI模型

Google Gemini

Google Gemini是由谷歌推出的一款人工智能多模态大模型，于2023年12月6日发布。这个模型具有强大的功能，能够同时识别文本、图像、音频、视频和代码五种类型的信息。它还能理解并生成主流编程语言的高质量代码，如Python、Java、C++，并且进行了全面的安全性评估。

0190

AI大模型 # Gemini编程语言生成 # Google Bard Gemini # Google DeepMind Gemini

Magi

Magi 的模型是一个可以自动将漫画页转录成文字并生成剧本。该模型通过识别漫画页面上的面板、文字块和角色，实现了全自动的剧本生成功能。

0190

AI大模型 # Magi # Magi模型 # 漫画转录成文字

Boximator

0190

AI大模型 # AI动画生成器 # AI视频生成工具 # AI视频编辑工具

SeamlessM4T

SeamlessM4T是Meta推出的一款多语言和多任务模型，能够处理语音识别、文本翻译和语音合成等任务。它支持近100种语言，可以将语音转录为文本，再进行翻译，甚至可以将翻译后的文本转化为语音。

0190

AI大模型 # SeamlessM4T模型 # 多模态翻译 # 多语言翻译模型

SDXL-Lightning

SDXL-Lightning是一款由字节跳动开发的开源免费的文生图开放模型，能根据文本快速生成相应的高分辨率图像。该模型能够在极短的时间内生成高质量和高分辨率的图像，是目前最快的文生图模型之一。

0190

AI大模型 # SDXL-Lightning # SDXL-Lightning模型 # 图像生成工具

EMO

EMO (Emote Portrait Alive) 是阿里巴巴集团智能计算研究院的研究团队开发的一个音频驱动型肖像视频生成框架。具体来说，EMO系统基于音频信号驱动来生成肖像视频。用户只需要提供一张参考图片和一段音频文件（例如说话、唱歌的声音），EMO就能够根据音频内容生成一个生动的视频，视频中的人物会展现出丰富的面部表情和多变的头部动作，仿佛照片中的人物正在唱你所制定的语言或歌曲。

0190

AI大模型 # AI肖像视频生成工具 # Emote Portrait Alive # 单张照片生成视频

Lumiere

Lumiere是谷歌发布的一个文本到视频扩散模型，于2024年正式发布。这个模型能够直接生成全帧率、低分辨率视频，通过训练海量文本和视频数据，可以将文字描述直接转化为高质量、真实、多样且连贯动作的视频。适用于多种内容创作和视频编辑应用，如图像到视频、视频修复和风格化生成。

0190

AI大模型 # AI 视频生成 # AI 视频生成工具 # AI视频生成模型

ClotheDreamer

ClotheDreamer 是一种基于 3D 高斯方法的工具，用于从文本提示生成可穿戴的、可生产的 3D 服装资产。由上海大学、上海交通大学、复旦大学和腾讯优图实验室共同推出。它采用了一种名为 Disentangled Clothe Gaussian Splatting (DCGS) 的新型表示方法，使得服装和人体模型可以分别优化。

0190

AI大模型 # 3D 服装生成 # 3D服装模型 # ClotheDreamer

Outfit Anyone

Outfit Anyone是一种虚拟试穿技术，它可以让用户在照片上穿上任何衣服。它是阿里巴巴集团智能计算研究所开发的一个创新项目，利用先进的人工智能和机器学习技术，提供高质量和细节一致的虚拟试穿效果。它可以适应不同的姿势和身材，甚至可以在动漫角色上试穿服装。

0190

AI大模型 # Outfit Anyone AI # 虚拟试穿开源代码 # 虚拟试穿技术

MagicVideo-V2

MagicVideo-V2是字节跳动公司团队开发的一款AI视频生成模型和框架。它通过集成文本到图像（Text-to-Image, T2I）模型、图像到视频（Image-to-Video, I2V）模型、视频到视频（Video to Video, V2V）模型和视频帧插值（Video Frame Interpolation, VFI）模块，以实现从文字描述到高分辨率、流畅且具有高度美学的视频的自动化生成。

0190

AI大模型 # ai视频生成 # AI视频生成器 # AI视频生成工具

华知大模型

华知大模型是由同方知网与华为合作开发的中华知识大模型。它是一个专注于知识服务与科研行业的全栈自主可控的大模型，旨在覆盖政企文教等多个行业场景，并提供30多项通用能力体系。华知大模型的核心特色能力包括智能写作、学术搜问、AI伴读、标准智能问答、机构业务知识智能问答以及图书馆读者智能服务系统等。

0190

AI大模型 # AI伴读工具 # 中华知识大模型 # 华知大模型

百度智能云客悦

百度智能云客悦是百度推出的智能客服平台。其旗下的智能外呼平台是一款集合NLP（自然语言处理）、ASR（自动语音识别）、TTS（语音合成）等人工智能技术，提供公有云服务并支持同时面向多名用户，自动发起外呼通话的智能化产品。

0190

AI大模型 # 智能IVR系统 # 智能外呼平台 # 智能客服平台

AnyText

AnyText是阿里云开源的一种基于扩散的多语言视觉文本生成和编辑模型，它利用了深度学习、自然语言处理、计算机视觉等技术，实现了对图像中文本的检测、识别、生成和编辑。

0190

AI大模型 # 文生图模型 # 文生图模型开源 # 视觉文本生成

华为盘古大模型

华为盘古大模型,官网入口网址,盘古ai为各行各业进行赋能

0180

AI大模型 AI开发者社区 # 华为 # 华为云 # 华为盘古

叮当健康 – HealthGPT

叮当HealthGPT是一款应用型医药人工智能产品。

0180

AI大模型 # AI大模型 # 健康大模型 # 医疗大模型

月之暗面Moonshot AI

国内领先的AI大模型公司

0180

AI大模型 AI导航 # 互联网工具 # 智能神器 # 高效工具

Jurassic Models

Jurassic是一个由AI21 Labs公司开发的大型语言模型（LLM），可以生成自然语言文本。它的名字来源于侏罗纪时期的恐龙，寓意它的强大和先进。

0180

AI大模型 # AI大模型

达观数据·曹植GPT

专注于长文本处理的AI大语言模型

0180

AI大模型 AI导航 # 互联网工具 # 智能神器 # 高效工具

面壁露卡

提供多种AI工具的综合性AI大语言模型

0180

AI大模型 AI导航 # 互联网工具 # 智能神器 # 高效工具

智源悟道

国产先进的人工智能大模型

0180

AI大模型 AI导航 # 互联网工具 # 智能神器 # 高效工具

MiniMax

MiniMax-与用户共创智能是一家领先的通用人工智能科技公司，提供多模态、千亿参数的MoE大模型，助力企业和开发者快速搭建AI应用。

0180

AI大模型 AI平台机构 # 人工智能 # 开放平台

”姜子牙“开源通用大模型

姜子牙大模型英文名Ziya发布时间2023-05-17最新版本Ziya-BLIP2-14B-Visual-v1更新时间2023-06-05参数量级130亿所属公司IDEA研究所开放平台https://huggingface.co/IDEA-CCNL/Ziya-BLIP2-14B-Visual-v1模型分类多模态大模型姜子牙大模型简介姜子牙大模型是由IDEA研究院开发的一系列开源通用人工智能模

0180

AI大模型 # AI大模型 # 姜子牙大模型 # 封神榜

Med-PaLM

Med-PaLM是由 Google Research 发布的大型语言模型，专为医学领域设计。

0180

AI大模型 AI编程开发 # AI大模型 # Google # LLM

天壤小白—AI场景应用开发

天壤小白 - 人人可用的AI场景应用开发平台

0180

AI大模型 AI导航 # 互联网工具 # 智能神器 # 高效工具

零一万物，Yi-6B 和 Yi-34B 大模型

零一万物-AI2.0大模型技术和应用的全球公司

0180

AI大模型 # Yi-34B # Yi-6B # 零一万物

腾讯健康医疗大模型

以混元大模型为基座的医疗大模型

0180

AI健康与医疗 AI医疗 # AI大模型 # 医疗大模型 # 混元大模型

FlashVideo

FlashVideo是一个由字节跳动和香港大学联合开发的高效高分辨率视频生成框架，特别适用于文本到视频的生成。通过创新的两阶段框架设计和流匹配技术，FlashVideo 能在短时间内生成 1080p 高清视频，优化视频流畅性，并减少计算成本。

0180

AI大模型 AI工具 # AI视频生成框架 # 动态视频生成框架 # 视频生成框架

TangoFlux

TANGOFLUX是一个高效的文本转音频（TTA）生成模型，拥有 515M 参数，能够在单个 A40 GPU 上仅需 3.7 秒生成长达 30 秒的 44.1kHz 立体声音频，TangoFlux不仅可以生成音效如鸟叫、口哨、爆炸等声音，还能生成音乐。

0180

AI大模型 AI工具 # TangoFlux # TTA生成模型 # 开源音频生成模型

VISION XL

VISION XL 是一款专注于解决视频逆问题的超高清视频修复工具。利用潜在图像扩散模型，VISION XL 高效处理视频去模糊、超分辨率和修复等任务，显著提升视频清晰度。支持多种降质形式和高分辨率重建，保证时间一致性。适用于视频修复、去模糊和超分辨率增强，让用户轻松实现高清视频的清晰化处理。

0180

AI大模型 # AI视频修复 # VISION XL # 一键视频清晰化

Codex大模型

Codex大模型是一个基于GPT技术的强大编程语言模型，具备自动生成代码、文档、测试用例等功能。它能够理解和处理复杂的编程问题，提高开发效率，是编程领域的重要创新。

0180

AI大模型 # AI代码生成工具 # AI代码辅助工具 # 编程大模型

CogVideo

CogVideo是目前最大的通用领域文本到视频生成预训练模型，含94亿参数。CogVideo将预训练文本到图像生成模型（CogView2）有效地利用到文本到视频生成模型，并使用了多帧率分层训练策略。用于文本到视频的生成。它是基于Transformer架构的，旨在通过理解和转换文本描述来生成相应的视频内容。CogVideo能够处理大量的文本-视频对数据，并通过学习这些数据的模式来生成与文本描述相匹配的视频。

0180

AI大模型 # CogVideo # 文本到视频生成预训练模型 # 文本生成视频大模型

言犀

言犀是京东自营智能人机交互平台，助力企业服务数智化转型。以AI技术驱动，从文字、语音到多模态交互，从对话智能到情感智能，聚焦体验、效率与转化，旨在打造新一代智能人机交互平台，面向不同行业和客户场景助力企业服务和营销实现数智化转型升级。

0180

AI大模型 # 智能人机交互平台 # 言犀

甲骨文AI协同平台-殷契文渊

殷契文渊是一个甲骨文AI协同平台，它提供了丰富的甲骨文资料库，包括图片、释文、研究论文等。利用人工智能技术，帮助用户更高效地进行甲骨文的自动识别和解读。

0180

AI大模型 # AI甲骨文字识别 # 殷契文渊 # 殷契文渊 AI协同平台

Ferret-UI

Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态AI大语言模型。它专为增强对移动端用户界面（UI）屏幕的理解而设计，具备引用、定位和推理功能。这个模型能够理解手机屏幕上的内容并执行任务，专注于移动端和用户交互。

0180

AI大模型 # Ferret-UI # 多模态AI大语言模型 # 智能UI交互助手

Hyper-SD

Hyper-SD 是字节跳动推出的一种先进图像生成框架，结合了轨迹分段一致性蒸馏（TSCD）和人类反馈学习（RLHF），显著提升了扩散模型在少步骤推理下的图像生成性能。通过 Hyper-SD，用户可以在 1 到 8 步的推理过程中生成高质量的图像，极大地提高了生成速度和效率。

0180

AI大模型 # Hyper-SD # Hyper-SD 图像生成 # 字节跳动 Hyper-SD

Harmonai

Harmonai是一个开源生成音频工具，让音乐创作更有趣。您可以使用舞蹈扩散模型生成各种风格的音乐，或者使用Harmonai Studio在线制作自己的音乐作品。加入Harmonai，体验AI音乐的魅力。

0180

AI大模型 # ai音频模型 # ai音频生成模型 # Harmonai音频工具

书生·浦语 InternLM

书生·浦语 InternLM 是由商汤科技与上海AI实验室联合香港中文大学和复旦大学共同开发的新一代大型语言模型。它是在过万亿token数据上训练的多语千亿参数基座模型，具有较高的知识水平，尤其在中英文阅读理解、推理任务等需要较强思维能力的场景下性能优秀。

0180

AI大模型 # 书生·浦语 # 书生·浦语 InternLM # 多语言AI模型

V-Express

V-Express是由南京大学和腾讯AI实验室共同开发的一项技术，旨在通过参考图像、音频和一系列V-Kps图像来生成说话的头像视频。这项技术可以根据不同的信号，如声音、姿势、图像参考等来控制视频内容，确保即使是弱信号也能有效地影响最终生成的视频，使视频生成更加逼真和多样化。

0180

AI大模型 # AI视频合成 # V-Express视频生成 # 动态视频生成工具

AiLMe大模型-100B v2 – APUS

AiLMe-100B是APUS公司训练的1000亿参数规模的多模态大模型,具备文本、图像、视频、音频的理解和生成能力。

0170

AI大模型 # AiLMe # AI大模型 # APUS

云从科技从容大模型

从容大模型是云从科技自主研发的一种基于语言模型的人工智能系统，该系统可以根据给定的文本或语音数据进行学习和分析，并输出相关的答案或建议，能够深度理解自然语言的含义和语义规则，具有高度智能化及自适应性。

0170

AI大模型 # AI # AIGC # AI大模型

超拟人大模型 – 聆心智能

CharacterGLM超拟人大模型由聆心智能与AI大模型公司智谱AI深度合作，基于GLM基座深度优化升级打造而成。

0170

AI大模型 # AI大模型 # Character.AI

度小满轩辕金融大模型

轩辕是国内首个开源的千亿级中文对话大模型，同时也是首个针对中文金融领域优化的千亿级开源对话大模型。轩辕在BLOOM-176B的基础上针对中文通用领域和金融领域进行了针对性的预训练与微调，它不仅可以应对通用领域的问题，也可以解答与金融相关的各类问题.

0170

AI大模型 # AI大模型 # 轩辕大模型 # 金融大模型

「天工」Skywork-13B系列

Skywork-13B 不仅在 C-Eval，MMLU 等基准测试上全面超越了 LLaMA2-13B，而且这次开源范围包括了 Skywork-13B-Base 模型、Skywork-13B-Math 模型以及每个模型的量化版模型。此外，昆仑万维还同时开源了 600GB、150B Tokens 的高质量中文语料数据集「Skypile/Chinese-Web-Text-150B」。昆仑万维还宣布，Skywork-13B 系列大模型将全面开放商用 —— 开发者无需申请，0 门槛商用。

0170

AI大模型 # Skywork-13B # 天工 # 昆仑万维

Langboat 澜舟科技

业界领先的AI大模型认知智能公司

0170

AI大模型 AI导航 # 互联网工具 # 智能神器 # 高效工具

天工 — 双千亿级大语言模型

天工 — 双千亿级大语言模型，国内大模型，基于自研双千亿级大语言模型

0170

AI大模型 # 大语言模型 # 天工大模型

Gemini Pro 2.0

谷歌推出的高性能AI模型，专为编程和复杂任务优化

0170

AI大模型 AI大模型 TOP # AI大模型 # AI大模型 TOP # AI热门产品

WizardMath：通过增强的 Evol-Inguidance 为大型语言模型赋能数学推理

WizardMath是由微软的团队开发的数学大模型。

0170

AI大模型 # AI大模型 # 数学大模型

炼丹侠

AI服务平台

0170

AI大模型新出AI # AI大模型 # 新出AI # 炼丹侠

第四范式说大模型

式说大模型概览发布时间2023年4月26日最新版本式说3.0参数量级无固定参数，最高可达千亿级别所属公司第四范式模型官网https://www.4paradigm.com/product/SageGPT.html 式说大模型简介式说3.0模型是第四范式公司开发的一种基于多模态大模型的新型开发平台，它可以利用生成式AI技术来重构企业软件，提升软件的体验和开发效率。主要功能：理解和生成文本、语音

0170

AI大模型 # AIGS # AI大模型 # GPT

Moonshot AI（月之暗面）

Moonshot AI是一家致力于将能源转化为智能的人工智能公司，他们的核心产品Kimi.ai是全球首个支持输入20万汉字的智能助手，具有超大内存和多种功能，可应用于学习、信息检索和娱乐休闲等场景。

0170

AI大模型 AI平台机构 # 人工智能 # 智能助手

XVERSE 元象科技大语言模型

XVERSE-13B 是由深圳元象科技自主研发的支持多语言的大语言模型。

0170

AI大模型 # AI大模型 # 元象 # 大语言模型

超算互联

高性能计算服务平台，

0170

AI大模型 AI开发者社区 # AI大模型 # SCNet # 超算互联

商汤日日新开放平台

日日新开放平台

0170

AI大模型首页 # AI大模型 # AI开放平台 # 商汤日日新

百度智能云千帆

百度智能云是百度多年技术沉淀打造的智能云计算品牌，致力于为客户提供全球领先的人工智能、大数据和云计算服务。凭借先进的产品、技术和丰富的解决方案，全面赋能各行业，加速产业智能化

0170

AI大模型首页 # AI # AI大模型 # CDN

Step-Video-T2V

Step-Video-T2V 是由阶跃星辰与吉利汽车集团联合开源的一款先进文本生成视频（Text-to-Video）模型。这款模型在 2025 年 2 月 18 日正式发布，具备强大的多模态生成能力，支持中文和英文输入，适用于广告、影视制作、教育等多个场景。

0170

AI大模型 AI工具 # Step-Video-T2V开源模型 # Text-to-Video模型 # 多模态视频生成模型

CineMaster

CineMaster是一个3D感知和可控的文本到视频生成框架，旨在帮助用户创建高质量的电影视频。该框架通过两个阶段的工作流程，赋予用户专业电影导演般的控制力，允许他们在 3D 空间中精确地放置场景中的对象，并灵活地操控对象和摄像机。

0170

AI大模型 AI工具 # 3D感知视频生成 # 创意视频生成工具 # 文本到视频生成

Cherry Studio

Cherry Studio 是一个支持多模型服务的AI桌面客户端，支持 Windows、macOS 和 Linux，未来还将支持移动端。用户可以通过Cherry Studio无缝集成多种大型语言模型 (LLM)，包括 OpenAI、Anthropic 和 Gemini 等，甚至本地部署的模型，确保数据隐私和安全。

0170

AI大模型 AI工具 # ai对话助手 # Cherry Studio # 多平台AI客户端

星流图像大模型

星流图像大模型由 LiblibAI 发布的一款自研图像大模型，名为 Star-3 Alpha。该模型基于业界领先的 F.1 基础算法架构训练而成，辅以全球最大的 LORA 增强模型库及不断进化的 AI 图像控制能力。在图像精准度、色彩表现力、美学捕捉的细腻表达等方面实现了显著的飞跃，成为新的业界标杆。

0170

AI大模型 # AI去除背景 # AI生图 # AI绘图

光语大模型

光语大模型是无限光年公司推出的一款结合大语言模型与符号推理的 AI 大模型，融合视觉与语言处理技术，拥有 10 亿视觉模型参数和 130 亿语言模型参数。该模型在金融、医疗等垂直领域表现出色，通过灰盒可信技术确保输出的稳定性和可靠性，有效解决幻觉问题，提升推理精度和可信度。

0170

AI大模型 # 光语大模型

EduChat

EduChat是一个教育领域的对话大模型，提供开放问答、作文批改、启发式教学和情感支持等教育特色功能，助力实现因材施教、公平公正、富有温度的智能教育。

0170

AI大模型 # EduChat # 教育对话大模型 # 教育问答

NineF AI

NineF AI 是一站式免费主流 AI 大模型集成平台，集成了 GPT、Claude、Llama 等全球顶尖 AI 模型，提供多角度智能解答，助您提升工作效率和决策准确性。界面简洁直观，支持图片和文档上传，满足各类创作和研究需求，是激发创新灵感的理想人工智能助手。

0170

AI大模型 # AI 大模型集成平台 # NineF AI

讯飞开放平台

讯飞开放平台，一个领先的人工智能技术与生态服务平台，致力于为开发者与企业提供全面的智能交互能力。我们不仅提供语音、图像、自然语言识别等核心交互技术，还拥有丰富的行业解决方案与SaaS产品，助力您轻松构建各类智能应用。

0170

AI大模型 # android讯飞语音 # 科大讯飞语音技术 # 讯飞开放平台

书生通用大模型

书生通用大模型是由上海人工智能实验室发布的大型预训练模型。它包括多个基础模型，如书生·多模态、书生·浦语和书生·天际等。这些模型旨在支持科研创新和产业应用，提供一个全链条开源的研发与应用平台。

0170

AI大模型 # 书生通用大模型

Etna模型

Etna大模型是七火山科技推出的一个文生视频的AIGC模型，它能够根据简短的文本描述生成相应的视频内容。七火山科技发布的Etna文生视频模型支持生成视频时长达到8~15秒，每秒可达60帧，分辨率最高可达4K（3840*2160），画面细腻逼真。

0170

AI大模型 # AI视频创作 # Etna大模型 # Etna模型

灵境矩阵

灵境矩阵是百度推出的一个基于文心大模型的智能体（Agent）平台。它支持开发者根据自己的行业领域和应用场景，选择不同的开发方式来构建产品，以适应大模型时代的需求。开发者可以通过低成本的prompt编排方式来开发智能体，同时平台还提供了流量分发路径，帮助开发者完成商业闭环。

0170

AI大模型 # ai灵境 # AI灵境平台 # 一言官方智能体开发平台

Animate Anyone

DreaMoving是一种基于扩散模型打造的可控视频生成框架，通过图文就能制作高质量人类跳舞视频。用户只需上传一张人像，以及一段提示词，就能生成对应的视频，而且改变提示词，生成的人物的背景和身上的衣服也会跟着变化。简单来说就是，一张图、一句话就能让任何人或角色在任何场景里跳舞。

0170

AI大模型 # AI动画生成器 # AI动画生成工具 # AI驱动的角色动画

商量拟人大模型

商量拟人大模型是商汤科技推出的一款AI拟人大模型，它支持个性化角色创建与定制、知识库构建、长对话记忆、多人群聊等功能，可实现行业领先的角色对话、人设及剧情推动能力。该模型广泛应用于情感陪伴、影视/动漫/网文IP角色、明星/网红/艺人AI分身、语言角色扮演游戏等拟人对话场景。

0170

AI大模型 # AI情感陪伴 # AI拟人大模型 # AI角色扮演游戏

Adobe Firefly Image2

Adobe Firefly Image 2 是Adobe推出的一款生成式人工智能模型，建立在Firefly图像模型的基础上，专为设计师和创作者提供更强大、更智能的图像生成能力。它通过简单的文字描述，可以生成高质量的图像、文字效果和鲜艳的调色板。

0170

AI大模型 # Adobe Firefly Image 2 # AI 图像生成 # ai绘画一键生成绘画

Mistral AI

Mistral AI 是一家来自法国的人工智能服务商，专注于大型语言模型和生成式人工智能的构建、培训和应用。Mistral AI 的目标是与 OpenAI 和谷歌竞争，为企业开发生成式人工智能基础设施。

0170

AI大模型 # Mistral AI # 新媒派

魔搭ModelScope社区

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！

0170

AI大模型 # AI模型社区 # AI训练模型 # 机器学习模型

SEED-Story

SEED-Story是一个腾讯开源的基于大型语言模型（MLLM）的多模态长篇故事生成模型，它能够根据用户提供的图片和文本生成连贯的叙事文本和风格一致的图片。无论是小说创作、剧本编写还是视觉故事，SEED-Story都能提供高质量、多模态的内容，助力创意产业的发展。

0170

AI大模型 # AI故事生成器 # 叙事文本图片生成 # 多模态故事生成

云雀大模型

云雀大模型是字节跳动公司开发的一款大规模预训练语言模型。该模型采用 Transformer 架构，它能够处理多种自然语言处理任务，如聊天、绘画、写作和学习。云雀大模型利用了大量的数据进行训练，包括文本、图像、视频和音频等，以学习丰富的语言知识和语境信息。此外，它还具有视频内容理解能力，能够识别视频中的对象、场景和情感等关键要素，为多模态任务提供支持。

0170

AI大模型 # AI智能体 # 云雀大模型 # 云雀语言模型

“星河”视觉大模型 – 中国电信

星河通用视觉大模型是中国电信研发的一种基于深度学习的图像和视频分析技术。

0160

AI大模型 # AI大模型 # 中国电信 # 星河视觉大模型

MINIMAX通用大模型

MINIMAX通用大模型是一家由前商汤科技副总裁、通用智能技术负责人闫俊杰于2021年11月创立的人工智能公司，致力于成为通用人工智能时代的基础设施建设者和内容应用创造者。

0160

AI大模型 # AI大模型 # Minimax # MINIMAX通用大模型

灵心健康大模型SoulChat

灵心健康大模型是一个中文领域心理健康对话大模型，经过百万规模心理咨询领域中文长文本指令与多轮共情对话数据联合指令微调得到。

0160

AI大模型 # AI大模型 # 健康大模型 # 医学大模型

左医GPT – 左手医生医疗大语言模型

左医GPT是左手医生推出的医疗大语言模型。

0160

AI大模型 # AI大模型 # 健康大模型 # 医疗大模型

云雀语言模型

云雀是一款由字节跳动旗下火山引擎平台研发的大语言模型，通过便捷的自然语言交互，能够高效的完成互动对话、信息获取、协助创作等任务。

0160

AI大模型 AI编程开发 # AI大模型 # 云雀 # 云雀语言模型

云知声山海大模型

0160

AI大模型 # AI大模型 # 云知声 # 山海大模型

9EH AI

一站式AI智能体，提高工作效率！

0160

AI写作 AI大模型 # AI大模型 # DALL # GPTs

商汤日日新大模型

商汤日日新大模型体系

0160

AI大模型首页 # AI大模型

InspireMusic

InspireMusic 是由阿里巴巴通义实验室推出的开源音乐生成框架，集成了多项音频领域的前沿研究成果，为开发者和研究者提供全面的音乐创作、风格转换和音效合成解决方案。该框架依托多模态大模型技术，支持通过文本描述或音频输入进行智能化创作，并提供完善的模型调优工具链。

0160

AI大模型 AI工具 # 开源音乐生成模型 # 音乐生成模型

Loopy AI

Loopy是一个端到端音频驱动的视频生成模型，专注于生成逼真的头像动画。利用先进的 AI 技术和时间模块设计，Loopy 能够从音频中提取自然的运动模式，并生成高质量的动画效果。支持多种视觉和音频风格，适用于虚拟主播、动画制作等应用场景。

0160

AI大模型 AI工具 # Loopy AI # 视频生成模型 # 音频驱动头像动画

HelloMeme

HelloMeme 是一个专注于生成高保真图像和视频内容的 AI 项目，特别是表情克隆技术。通过采用最新的 SD1.5 架构和空间编织注意力扩散模型，HelloMeme 可以轻松将一张图片的表情迁移到另一张图片或视频上，生成效果超越同类工具如 Liveportrait。HelloMeme 支持 ComfyUI 界面操作，非常适用于 AI 数字人、表情包制作和照片复活等领域，带来更自然细腻的表情效果。

0160

AI大模型 # AI数字人 # HelloMeme # HelloMeme AI

Evidently Al

Evidently Al 是一个开源的机器学习模型监测和测试平台，它可以帮助您分析和改进您的模型性能。它可以让您轻松地创建交互式的可视化报告，展示您的模型在验证和预测期间的表现，以及数据漂移的情况。您可以使用 Evidently 这个开源 Python 库来生成 Evidently Al 大模型所需的 JSON 配置文件，然后在 Evidently Al 大模型的网站上上传和查看您的报告。

0160

AI大模型 # Evidently Al 机器学习模型优化 # Evidently Al 模型监控工具

Mini-Gemini

Mini-Gemini是一个简单而有效的框架，用于增强多模态视觉语言模型（VLMs），由中国香港中文大学和 SmartMore 的研究人员共同推出。Mini-Gemini支持一系列密集和MoE大型语言模型（LLMs），从2B到34B。为了增强视觉token，该框架建议在不增加视觉token数量的情况下，利用额外的视觉编码器进行高分辨率细化。同时，Mini-Gemini还构建了一个高质量的数据集，以促进精确的图像理解和基于推理的生成，从而扩大当前VLM的操作范围。

0160

AI大模型 # Mini-Gemini # Mini-Gemini框架 # 多模态视觉语言模型

MuseTalk

MuseTalk是由腾讯推出的一个实时的高质量音频驱动唇形同步模型，能够根据输入的音频信号自动调整数字人物的面部图像，使其唇形与音频内容高度同步，支持多种语言，并实现每秒30帧以上的实时处理速度。这意味着观众可以看到数字人物的口型与声音完美匹配的效果。

0160

AI大模型 # Lyra实验室MuseTalk # MuseTalk实时同步 # 开源唇形同步模型

CrewAI

CrewAI是一个创新的框架，专为角色扮演中的AI代理提供自动化设置。它通过促进AI代理之间的合作，使得这些代理能够共同解决复杂问题。CrewAI的核心特征包括角色定制代理、自动任务委派、任务管理灵活性和流程导向。它既可以使用OpenAI的API，也可以通过Ollama使用本地的大模型来运行程序。

0160

AI大模型 # AI自动化代理 # CrewAI # 多角色agent框架

神力霓裳

神力霓裳是阿里大文娱发布的自研影视妆造大模型。这个模型可以根据要求快速生成影视级的各朝代服饰造型，辅助造型师进行创意设计。它主要服务于古装剧，包含造型设计、妆发设计和纹样设计三大功能。

0160

AI大模型 # 古装剧服饰设计 # 影视妆造大模型 # 影视造型设计工具

DreamTalk

DreamTalk 是一个基于扩散的、以音频驱动的表达性说话头部生成框架，能够跨多种说话风格生成高质量的说话头部视频，由清华大学、阿里巴巴和华中科大共同开发。它的主要功能是通过人工智能技术让人物头像能够说话、唱歌，并保持嘴唇的同步以及模仿表情变化。这一框架能够生成高质量的动画，使人物脸部动作看起来非常真实，不仅嘴唇动作逼真，还能展现丰富的表情，使得动画更加生动。

0160

AI大模型 # AI说话头生成 # AI面部动画生成 # DreamTalk

Hallo

Hallo是一个百度开源的AI对口型人脸视频生成框架，用户只需提供一段音频和所选人像，它利用人工智能技术，让图片中的人物能够根据语音的变化做出相应的面部表情和嘴唇动作。

0160

AI大模型 # ai对口型人脸视频生成框架 # Hallo人脸视频生成技术

BuboGPT

BuboGPT是字节跳动推出的一种先进的大型语言模型（LLM），它具有将文本、图像和音频等多模态输入进行整合的能力，并且具备将回复与视觉对象进行对接的独特功能，可以执行跨模态交互并做到对多模态的细粒度理解。这显示出BuboGPT在对齐或未对齐的任意图像音频数据理解方面有着出色的对话能力。

0160

AI大模型 # BuboGPT # BuboGPT大型语言模型 # 多模态大语言模型

GPT-4o mini

GPT-4o Mini 是 OpenAI 最新推出的小型智能模型，专为高性能和低成本的人工智能解决方案而设计。它支持文本、视觉、音频等多模态输入输出，响应速度极快，适用于实时应用场景。

0160

AI大模型 # GPT-4o mini # GPT-4o mini模型 # OpenAI 小型模型

ModelGate

ModelGate是一个集成多家主流AI大模型的智能创作与办公平台，支持多场景应用，帮助用户高效体验先进的人工智能服务。

0150

08-AI助手 AI大模型 # AI助手 # 大模型API

脑海大模型

鹏城实验室发布的通用AI大模型，以国产化基座大模型为新一代AI大模型

0150

AI大模型 AI训练模型 # MindSpore # 中国算力网 # 数字政务

“天河天元”大模型

“天河天元”是由国家超算天津中心发布的基于天河E级智能计算开放创新平台的中文大语言模型，该模型是在天河新一代超级计算机上训练完成的。它涉及各种小说、古文、百科、新闻、中医、法律等多种数据集，具有生成语言、理解语言、跨模态等能力。

0150

AI大模型 # AI大模型 # 天河天元大模型

星辰语义大模型

中国电信开源的语义大模型

0150

AI大模型 AI训练模型 # 中国电信 # 大规模预训练模型 # 星辰大模型

韬行智能Tensor Digital

致力于构筑建模、仿真、优化的智能计算平台

0150

AI大模型 AI导航 # 互联网工具 # 智能神器 # 高效工具

ChatGLM千亿对话模型

面向高校学术交流与行业合作的试用申请

0150

AIGC写作平台 AI大模型 # 学术交流 # 科学研究 # 行业合作

医联推出国内首款AI医生MedGPT

MedGPT是医联推出的首款医疗大语言模型。

0150

AI大模型 # AI大模型 # HVI慢性病 # 健康大模型

Swallow

Swallow无代码构建金融定价，简易高效

0150

Agent智能体 AI企业 # Swallow

白玉兰科学大模型

白玉兰大模型是上海交通大学推出，依托上海白玉兰开源开放研究院开源发布的一款科学大模型，包括三个领域模型。

0150

AI大模型 # AI大模型 # 上海交通大学 # 白玉兰大模型

岐黄问道·中医大模型

岐黄问道大模型是一个基于中医知识和数据的人工智能模型，由大经中医研发和发布。它可以根据用户提供的疾病、症状、体征等信息，给出中医的诊断和治疗方案。

0150

AI大模型 # AI大模型 # 中医大模型 # 医学大模型

MiniMax.io

原海螺AI的海外版，新增声音克隆功能（免费使用）

0150

AI多模态大模型 AI大模型 # Hailuo AI # Minimax # minimax ai

元象大模型XChat

元象XVERSE大模型驱动的AI聊天助手

0150

AI大模型 AI对话聊天 # AI写作 # AI助手 # AI工具

Llama 中文社区

Llama 中文社区，llama2中文大模型下载及体验入口。

0150

AI大模型 AI开发者社区 # LLaMA # llama2 # Meta

云天励飞大模型“云天天书”

“云天天书”基础大模型架构包含三个层级：通用大模型、行业大模型、场景大模型。

0150

AI大模型 # AI # AI大模型 # 云天励飞

Hugging Chat

Hugging Chat 是HuggingFace平台推出的一款免费开源的AI聊天工具，于2023年4月25日发布，致力于为每个人提供最先进的AI聊天模型，将优质的机器学习技术普及到大众中，让更多的人能够享受到人工智能带来的便利。

0150

Agent智能体 AI大模型 # Agent智能体 # AI 聊天问答 # AI大模型

Phantom

Phantom是由字节跳动推出的一款创新视频生成框架，专注于主体一致性的视频生成任务（Subject-to-Video, S2V）。它通过跨模态对齐技术，将文本和图像提示结合起来，从参考图像中提取主体元素，并生成与文本描述一致的视频内容。

0150

AI大模型 AI工具 # AI文本生成视频 # Phantom # StepPhantom开源框架

JoyGen

JoyGen是一个音频驱动的3D深度感知说话人脸视频生成框架。它通过音频驱动生成嘴唇运动和视觉外观合成，旨在实现精确的嘴唇-音频同步和高视觉质量。

0150

AI大模型 AI工具 # 3D说话人脸生成 # JoyGen # 音频驱动3D说话人脸视频模型

Magic Clothing

Magic Clothing是一个专注于控制性的服装驱动图像合成的项目，它是OOTDiffusion模型的一个分支版本，旨在通过服装来控制图像的生成。

0150

AI大模型 # Garment-Driven Image Synthesis # Magic Clothing # 控制性服装驱动图像合成

FunAudioLLM

FunAudioLLM 是由阿里巴巴通义团队开发的旨在增强人类与大型语言模型（LLMs）之间的自然语音交互的框架。其核心包括两个创新模型：SenseVoice 和 CosyVoice。SenseVoice 提供高精度的多语言语音识别、情绪识别和音频事件检测，支持超过 50 种语言，并具有极低的延迟。CosyVoice 则专注于自然语音生成，支持多语言、音色和情绪控制，能够进行零样本语音生成、跨语言语音克隆和指令遵循。

0150

AI大模型 # ai音频生成模型 # CosyVoice大模型 # FunAudioLLM

InstructAvatar

InstructAvatar是一个先进的AI框架，它使用自然语言界面来控制2D头像的情绪和面部动作。这个系统允许用户通过文本指令来精细控制头像的表情和运动，从而生成具有情感表现力的视频。

0150

AI大模型 # 2D头像动作同步 # AI动态头像设计 # AI头像互动

沃研Turbo大模型

沃研Turbo是由沃恩智慧公司专为大学生打造的科研大模型。它集成了多项科研辅助功能，包括期刊推荐、文献摘要、论文精读、翻译润色、创新点评估、个性化论文推荐和AI降重。通过多模态AIGC技术，沃研Turbo能够快速响应科研需求，提升科研效率。用户只需在网页上上传论文、文本或链接，即可享受便捷的科研辅助服务。沃研Turbo致力于简化科研过程，帮助大学生在学术道路上取得更大成就。

0150

AI大模型 # 沃研Turbo大模型 # 沃研Turbo科研大模型 # 科研大模型

DDColor

DDColor是阿里达摩院研究的一种基于深度学习的图像上色模型，它可以自动将黑白或灰度图像着色，使图像更加生动逼真。它使用了双解码器技术，能够同时考虑色彩分布和像素级详细信息，实现高度真实的图像上色效果。它还利用多尺度视觉特征和颜色损失来提高着色的语义合理性和颜色丰富性。

0150

AI大模型 # ai怎么给图像上色 # 图像着色工具 # 灰度图像上色

Seed-TTS

Seed-TTS是由字节跳动开发的一系列大规模自回归文本到语音（TTS）模型。它能够生成高度自然、与人类语音几乎无法区分的语音。这个模型特别擅长学习语音上下文、说话人相似度和自然度等方面的特征，从而产生质量极高的语音输出。

0150

AI大模型 # Seed-TTS语音合成 # 字节跳动文本到语音 # 字节跳动语音大模型

腾讯混元3D

腾讯混元3D，全称为 Hunyuan3D-1.0，是腾讯推出的首个同时支持文生和图生的3D开源模型，专门解决现有3D生成模型在生成速度和泛化能力方面的不足。该模型采用了基于Diffusion 技术的架构，能够同时支持文本生成和图像生成3D资产。

0150

AI大模型 # 3D开源模型 # Hunyuan3D-1.0 # 快速3D资产生成

Imagen 3

Imagen 3是Google DeepMind开发的最新文生图大模型。它能够根据文本提示生成高质量、高分辨率的图像，具有更好的细节和丰富的光照效果。这个模型支持多种视觉风格，从照片般逼真到油画质感，甚至黏土动画场景。Imagen 3还改进了对自然语言提示的理解，简化了生成所需图像的过程，并采用了最新的安全和责任技术，包括隐私保护和内容安全。

0150

AI大模型 # Imagen 3 图像生成工具 # Imagen 3 文生图模型 # Imagen 3文本到图像

Stanford Alpaca翻译站点

适用于消费级显卡的开源轻量级语言模型

0140

AI大模型 AI训练模型 # Alpaca # LLaMA # 开源大模型

xAI Grok AI问答

马斯克旗下的 Twitter/X 所开发的对话型聊天机器人

0140

AI大模型 AI导航 # 互联网工具 # 智能神器 # 高效工具

Bigmodel.ai – 认知大模型平台

智谱大模型门户中心，专注于AIGC领域，提供好玩有趣的AIGC应用和大模型API接口，并为客户提供行业解决方案。

0140

AIGC开发平台 AI大模型 # Bigmodel.ai – 认知大模型平台 # OpenI

LMArena AI

LMArena AI 是一个专注于众包 AI 基准测试的开放平台，由加州大学伯克利分校 SkyLab 和 LMSYS 研究团队打造。用户可以在平台上免费与 AI 聊天并进行投票，比较和测试不同的 AI 聊天机器人。LMArena AI 提供盲测模式、匿名对战、投票系统和风格控制等功能，确保评估的公平性和客观性。平台还支持多模态功能，允许用户通过图像与 AI 互动。通过 LMArena AI，用户可以了解和体验不同 AI 模型的性能，帮助他们选择合适的工具或服务。

0140

AI大模型 AI工具 # AI基准测试 # AI模型性能测试 # AI模型排行榜

53AI

53AI是一个开箱即用的企业大模型应用平台，致力于帮助企业快速部署和利用大型语言模型（LLMs），提供企业大模型落地应用、业务智能化改造、私有模型定制和大模型咨询服务。通过 53AI，企业可以轻松实现业务流程的智能化，提高运营效率和竞争力。它支持私有云部署，帮助企业实现大模型的知识库建设、模型训练和智能体开发，从而将AI技术应用于企业的各个业务流程和产品中。

0140

AI大模型 AI工具 # 53AI # 企业大模型平台 # 企业知识库建设

Grok-1

Grok-1是马斯克旗下AI创企xAI发布的一款开源AI大模型。它是一个混合专家（Mixture-of-Experts，MOE）大模型，其参数量达到了3140亿，远超OpenAI GPT-3.5的1750亿，是迄今参数量最大的开源大语言模型。旨在用作聊天机器人背后的引擎，用于包括问答、信息检索、创意写作和编码辅助在内的自然语言处理任务。

0140

AI大模型 # Grok-1 # Grok-1人工智能 # Grok-1参数量最大的开源模型

MoonShot AI

MoonShot AI（又名“月之暗面AI”）是一家致力于人工智能技术创新的公司，专注于开发和优化大型AI模型。我们的先进人工智能预测技术正改变未来。从股市分析到疫苗研发，我们的大模型技术提供了前所未有的准确性和速度。

0140

AI大模型 # MoonShot AI

ReSyncer

ReSyncer 是由清华大学、百度和南洋理工大学 S-Lab 实验室联合开发的多功能 AI 框架，专注于视频合成技术。它能够生成与音频高度同步的逼真口型视频，支持个性化调整、视频驱动口型同步、说话风格迁移和人脸交换。ReSyncer 在创建虚拟主持人、电影配音和多语言内容制作等领域具有广泛应用前景。

0140

AI大模型 # ReSyncer # 人脸交换技术 # 视频口型同步

Video-LLaVA

Video-LLaVA是由北京大学ChatLaw课题组开发的一款视频问答模型。它基于Transformer架构，能够处理视频和问题，通过自注意力机制来捕捉二者之间的关联信息，并可以回答有关其内容的问题，它准确地描述了这些媒体中的视觉效果。这个模型通过在大量视频数据上进行预训练，使得它能够理解丰富的视频特征和问题语义，进而在视频问答任务上取得了先进的性能，该技术还可用于标记图像和视频。

0140

AI大模型 # AI视频分析 # Video-LLaVA模型 # 视频摘要生成

Segment Anything

Segment Anything是一个基于深度学习的图像分割模型，它可以根据用户的输入提示（如点或框）生成高质量的物体遮罩。它可以用于为图像中的任何物体生成遮罩，无论是常见的物体（如人、车、猫等），还是罕见的物体（如火箭、恐龙、魔法棒等）。它的特点是具有强大的零样本性能，即它可以在没有见过的类别上进行分割，而不需要额外的训练数据。它的另一个优点是具有快速的推理速度，即它可以在几秒钟内处理一张图像，而不需要显卡或云计算资源。

0140

AI大模型 # 图像分割模型 # 图像分割模型SAM # 图像分割模型有哪些

心辰Lingo语音大模型

心辰Lingo语音大模型是由西湖心辰（杭州）科技有限公司开发的端到端语音大模型。该模型具备原生语音理解、多种语音风格表达、语音模态超级压缩、实时打断和控制、深度情感理解等功能，能够以超拟人化的方式进行互动。这个模型不仅能快速响应复杂指令，还能深度理解用户的情感和意图。

0140

AI大模型 # 心辰Lingo语音大模型 # 语音AI解决方案 # 语音生成模型

妙笔

0140

AI大模型 # AI绘图工具 # 中文文本转图像 # 中文文生图模型

PowerLawGLM

幂律联合智谱 AI 联合发布基于中文千亿大模型的法律垂直大模型 ——PowerLawGLM，聚焦于法律细分领域，针对中文法律场景的应用效果具有独特优势，具备丰富的法律知识和法律语言理解能力。

0130

AI大模型 AI应用 # ChatGLM # PowerLawGLM # 智谱

零一万物-01.ai

零一万物-AI2.0大模型技术和应用的全球公司（01.AI）提供卓越性能的Yi-34B预训练模型，具有高性能、成本效益和开放性，适用于自然语言处理、语音识别和图像处理等多个应用场景。

0130

AI大杂烩 AI大模型 # 大模型 # 预训练模型

赤兔大模型

赤兔大模型官网地址

0130

AI大模型 AI训练模型 # 云客服 # 即时通讯 # 双录

曹植GPT大语言模型

可内置在客户各类业务系统中提供专用服务

0130

AIGC写作平台 AI大模型 # aigc导航 # 曹植GPT大语言模型

ChatGLM

ChatGLM,清华技术,智谱AI开源的GLM系列的对话模型

0130

AI大模型 AI工具导航 # ChatGLM

TransGPT 致远交通大模型

TransGPT是国内首款开源交通大模型，主要致力于在真实交通行业中发挥实际价值。它能够实现交通情况预测、智能咨询助手、公共交通服务、交通规划设计、交通安全教育、协助管理、交通事故报告和分析、自动驾驶辅助系统等功能。

0130

AI大模型 # AI大模型 # TransGPT # 交通大模型

华为盘古

华为盘古大模型以“AI for industries”为核心理念，专注于行业应用，致力于构建金融、政务、制造、矿山、气象、铁路等多个领域的行业大模型和能力集。它集合了行业知识和大模型能力，以重新定义各行各业，成为组织、企业和个人的专业助手。

0130

AI大模型 AI大模型平台 # 盘古大模型官网

WiseDiag-Z1

WiseDiag-Z1是由杭州智诊科技推出的全科医学通用大语言模型，专为医疗领域设计，具有730亿参数和强大的医学知识库。它在知名的医学大模型主流榜单中名列前茅，适用于大多数复杂场景的健康咨询。

0130

AI大模型 AI工具 # 全科医学AI # 医学大语言模型 # 医生助手AI

FireRedASR

FireRedASR是一款由FireRedTeam开发的开源工业级自动语音识别（ASR）模型，支持普通话、中文方言和英语。它在公开的普通话 ASR 基准测试中取得了新的最优结果，并且在歌词识别方面表现出色。

0130

AI大模型 AI工具 # FireRedASR下载 # 开源语音识别工具 # 自动语音识别模型

Darwin

Darwin是一个开源项目，专注于自然科学领域的大型语言模型构建，主要涵盖物理、化学和材料科学。通过对科学文献和数据集进行预训练和微调，Darwin 在科学问答和多任务学习任务中表现优异。它结合了结构化和非结构化的科学知识，提升了语言模型在科学研究中的效能。

0130

AI大模型 AI工具 # Darwin # 开源科学研究工具 # 材料科学大模型

Janus-Pro

Janus-Pro是由 DeepSeek AI 开发的先进多模态 AI 模型，专注于实现图像理解与图像生成的无缝结合。Janus-Pro 通过优化的训练策略、扩展的训练数据和更大的模型规模，在多模态理解和文本到图像生成方面取得了显著进步。

0130

AI大模型 AI工具 # Janus-Pro

StereoCrafter

StereoCrafter是腾讯AI实验室开发的一款开源框架，能够将普通的 2D 视频转换为沉浸式的 3D 视频。通过深度估计和立体视频修复技术，StereoCrafter 提供高质量的 3D 视频生成，支持多种视频源，包括电影、视频博客、3D 动画和 AI 生成内容。

0130

AI大模型 AI工具 # 2D转3D视频转换 # AR视频生成 # StereoCrafter

GPT智库

GPT 智库是一款强大的人工智能大模型综合应用，提供互联网境外访问绿色通道、汇聚了全球顶尖的人工智能大模型和学术资源。它具备智能对话、文生图、图生图、音频翻译、图像分析和全球学术资料搜索等多种功能，为科研院所、新闻媒体、高校和政府部门提供安全、合规、可控的全球一流人工智能服务。

0130

AI大模型 # GPT智库 # 大模型应用平台

Aidge

Aidge基于阿里巴巴国际数字商业集团的大语言模型和多模态大模型，结合对全球商业的深度洞察，为客户提供全面的国际电商AI云服务。Aidge 聚焦商业场景，让客户的全球经营效果更好，成本更低。Aidge 作为国际电商领域专业前沿且经验丰富的AI服务提供方，拥有极强的多语言能力、本地化能力和营销设计能力，帮助企业客户降低语言和文化门槛，解决中小企业难以获得设计、营销、服务和人才等问题。

0130

AI大模型 # Aidge # 全球电商运营 # 国际电商AI解决方案

知海图AI

知海图AI是知乎与面壁智能合作开发的中文大模型，于2023年4月13日开始内测。它的主要功能是对知乎热榜上的问题回答进行要素抽取、观点梳理和内容聚合，以便用户能够更快、更全面地了解知友们讨论的热点与焦点。知海图AI在特定场景中的表现与GPT-4相当，显示出强大的语言理解和内容总结能力。此外，知海图AI的发布也标志着知乎在大语言模型领域的进一步布局，旨在赋能创作者、讨论场、信息获取等多个业务场景。

0130

AI大模型 # 知乎AI应用 # 知乎大模型 # 知海图AI

ReHiFace-S

ReHiFace-S是由硅基智能推出的开源实时高保真换脸算法，专注于实时视频中的高保真换脸技术。该算法支持零样本推理、超分辨率和色彩转换，适用于NVIDIA GTX 1080Ti及以上显卡。ReHiFace-S不仅提供高精度的面部特征和表情还原，还支持ONNX和实时摄像头模式，极大地简化了大规模数字人生成的过程。

0130

AI大模型 # ReHiFace-S开源项目 # 实时换脸算法 # 硅基智能换脸

封神榜（封神榜大模型）

封神榜大模型是由IDEA研究院认知计算与自然语言中心(CCNL)开发，粤港澳大湾区数字经济研究院（International Digital Economy Academy 简称“IDEA ”）由前微软公司全球执行副总裁、美国和英国工程院外籍院士沈向洋博士创建并担任理事长。

0120

AI大模型 AI自然语言处理模型 # IDEA CCNL # IDEA封神榜，封神榜大模型，封神榜，大模型，MindBot，MindBot-Lite # IDEA数字经济研究院认知计算与自然语言中心

书⽣·浦语

大语言模型书⽣·浦语

0120

AI大模型 # AI导航网 # 书生·浦语

EUREKA 学术大模型

IDEA ReadPaper团队倾力打造学术大模型

0120

AI大模型 AI训练模型 # EUREKA # IDEA # readpaper

商汤商量语言大模型

商汤自研的超千亿参数语言大模型应用平台

0120

AI大模型 AI工具集 # 商汤商量语言大模型

科大讯飞星火认知大模型

由科大讯飞推出的大语言模型，能够通过自然语言理解，完成智能对答

0120

AI大模型 AI导航 # 互联网工具 # 智能神器 # 高效工具

蜜度科技

蜜度科技推出自研行业大模型蜜巢系列，蜜度科技官网入口

0120

AIGC办公平台 AI办公 # OpenI # 蜜度科技

雅意大模型（YaYi）

中科文歌研发的自主知识产权多语言大模型

0120

AI大模型 AI训练模型 # YaYi # 中科文歌 # 雅意大模型

Syft Ai

智能追踪，定制资讯

0120

Agent智能体 AI企业 # Syft Ai

“携程问道”旅业垂直大模型

携程问道是携程集团发布的旅游行业首个垂直大模型。它基于200亿高质量非结构性旅游数据，结合携程现有的结构性实时精确数据以及携程历史训练的机器人和搜索算法，进行了自研垂直模型的训练。

0120

AI大模型 # AI大模型 # 携程 # 携程问道

RAGFlow

RAGFlow是一款开源的检索增强生成（RAG）引擎，专为深入理解文档而设计。它为各类企业和个人提供简洁高效的RAG工作流程，与大语言模型（LLM）相结合，针对各种复杂格式的数据提供可靠的问答及有依据的引用。RAGFlow非常适合需要动态内容生成且依赖外部知识库的场景，如智能客服、文档生成和数据分析等，助力用户高效挖掘大量数据中的有价值信息。

0120

AI大模型 AI工具 # 开源RAG引擎 # 文档解析工具

Hibiki

Hibiki是一个Kyutai Labs开发的一个用于流式语音翻译（也称为同步翻译）的模型。与离线翻译不同，离线翻译需要等待源语句结束后才开始翻译，而 Hibiki 能够实时积累足够的上下文，以逐块生成正确的翻译。用户在讲话时，Hibiki 会在目标语言中生成自然的语音，并提供文本翻译。

0120

AI大模型 AI工具 # Hibiki # 实时语音翻译模型 # 语音翻译模型

Tarsier

Tarsier是由字节跳动研发的大规模视频语言模型家族，旨在生成高质量的视频描述，并具备良好的视频理解能力。Tarsier 采用了简单的模型结构，结合了 CLIP-ViT 编码帧和 LLM 模型来建模时间关系。通过精心设计的两阶段训练策略，Tarsier 展现出了强大的视频描述能力和视频理解能力，在多个公共基准测试中取得了最先进的成果。

0120

AI大模型 AI工具 # Tarsier # 大规模视频语言模型 # 视频问答模型

千影QianYing

千影 QianYing 是一款由巨人网络 AI Lab 推出的有声游戏生成大模型，包含游戏视频生成大模型 YingGame 和视频配音大模型 YingSound。通过先进的人工智能技术，千影 QianYing 能够自动生成高质量、有声的游戏视频。YingGame 通过自定义角色、动作控制和物理模拟，创造互动性强的游戏内容；YingSound 则为视频添加高保真音效，实现精确的跨模态对齐和时间同步。

0120

AI大模型 # AI游戏创作工具 # YingGame大模型 # 千影QianYing

M2UGen

M2UGen是一个由腾讯和新加坡国立大学共同研发的多模态音乐生成模型，它具备音乐生成、理解和编辑的能力。具体来说，M2UGen可以接收文字、图片、视频或音频作为输入，然后生成与之相匹配的音乐。例如，给它一段文字，如诗句或故事，它能够创作出与文字内容相应的音乐；对于图片，它能创作出匹配的音乐，让图片仿佛“动起来”；对于视频，它可以根据视频内容创作出合适的背景音乐。

0120

AI大模型 # M2UGen # M2UGen音乐生成模型 # 图像到音乐转换

孟子生成式大模型

孟子生成式大模型（孟子 GPT）是由澜舟科技研发的一款功能强大的生成式可控大语言模型。它能够通过多轮对话，帮助用户在特定场景中完成各种工作任务，包括内容生成、语言理解、知识问答、推理、代码理解和生成、金融任务等。

0120

AI大模型 # AI语言模型平台 # 孟子 GPT # 孟子生成式大模型

HoloDreamer

HoloDreamer是一款文本驱动的3D场景生成框架，通过用户的文本描述生成沉浸式且视角一致的完整3D场景。它由风格化全景生成和增强型全景重建两个核心模块组成，该框架首先生成高清晰度的全景图作为完整3D场景的整体初始化，然后利用3D高斯散射（3D-GS）技术快速重建3D场景，从而实现视角一致和完全封闭的3D场景生成。HoloDreamer在虚拟现实、游戏和影视行业中有广泛应用，为这些领域提供了新的解决方案。

0120

AI大模型 # 3D场景生成 # 3D场景生成工具 # AI生成3D

MotionGen

MotionGen 是由元象科技推出的创新 3D 动作生成模型。通过结合大模型、物理仿真和强化学习等前沿算法，简化 3D 动画制作过程。用户只需输入简单的文本指令，即可快速生成逼真、流畅且复杂的 3D 动作。无论是动画、游戏、电影还是虚拟现实行业，MotionGen 都能显著提高创作效率，降低制作成本。

0120

AI大模型 # 3D 动画制作工具 # 3D动作生成模型 # MotionGen 3D 动作生成

林哥的大模型野榜

“林哥的大模型野榜”是一个专注于中国用户需求的大模型产品排行榜，旨在帮助用户更好地了解和选择适合的大模型产品。

0110

AI大模型 AI工具集 # 林哥的大模型野榜

Revfx Account Lookalikes

人工智能精准挖掘相似账户

0110

Agent智能体 AI企业 # Revfx Account Lookalikes

Grok-2翻译站点

X.ai发布的新一代AI大模型Grok-2

0110

AI大模型 # Grok # Grok-2 # xAI

MiLM-6B

小米AI大模型

0110

AI大模型 # MiLM-6B # xiaomi

Llama 3 中文体验

由Llama中文社区维护的Llama3在线体验、LLama2中文大模型Atom在线体验入口网址，实时汇总最新Llama3学习资料，已将所有代码更新适配Llama3，构建最好的中文Llama大模型，完全开源可商用

0110

AI大模型 Llama # llama.family # LLama中文大模型 # Llama中文社区

鹏程·盘古α大模型

鹏程·盘古α是业界首个2000亿...

0110

AI大模型 AI训练模型 # 盘古大模型

MOSS – 复旦大模型

复旦大模型MOSS，正式开源了

0110

AIGC开发平台 AI大模型 # Moss # MOSS开源项目 # 复旦大模型

孟子 GPT

帮助用户完成特定场景中的多种工作任务

0110

AI大模型 AI工具集 # 孟子 GPT

蓝心大模型

vivolm蓝心大模型,vivo自研的通用大模型

0110

AI大模型 AI工具导航 # vivolm # 蓝心大模型 # 蓝心大模型官网

银河大模型

专为教育领域量身打造的覆盖多学科、多学段、多场景的教育大模型。

0110

AI大模型作业帮 # 个性化学习 # 作业帮 # 教育大模型

CPM-Bee

CPM-Bee大模型,百亿参数的开源中英文双语基座大模型

0110

AI大模型 AI工具导航 # CPM-Bee

讯飞星辰MaaS平台

讯飞星辰MaaS平台是科大讯飞推出的一款一站式大模型定制精调平台，旨在为开发者和企业用户提供低门槛、全栈式的大模型应用开发服务。

0110

AI大模型 AI工具集 # 讯飞星辰MaaS平台

YAYI2

YAYI2（雅意2）是中科闻歌推出的新一代开源大语言模型，支持中文、英语等 10 多种语言。基于 Transformer 架构，参数规模达到 30B。YAYI2 采用 2 万亿 Tokens 的高质量语料进行预训练，并结合人类反馈强化学习，确保模型与人类价值观对齐。其多模态交互功能支持图文互生成、PDF 解析等。YAYI2 广泛应用于媒体宣传、舆情分析、政务治理、金融分析等领域，为企业提供 AI 辅助工具和知识库问答系统。

0110

AI大模型 AI工具 # 中文NLP模型 # 开源大语言模型

PengChengStarling

PengChengStarling是由 PengCheng Labs 开发的多语言自动语音识别工具，支持中文、英语、俄语、越南语、日语、泰语、印度尼西亚语和阿拉伯语。相比 Whisper-Large v3，PengChengStarling 的模型仅占其 20% 大小，但推理速度提高了 7 倍，且流式语音识别效果卓越。PengChengStarling 是开源的，采用 Apache 2.0 许可证，适用于语音助手、翻译工具、字幕生成和语音搜索等多种应用场景。

0110

AI大模型 AI工具 # PengChengStarling # 实时流式语音识别 # 开源语音识别模型

kimik2

Kimi K2 是北京月之暗面科技有限公司于 2025 年 7 月 11 日推出的开源大语言模型。

0100

AI大模型 AI工具集 # kimik2

Seedance

字节跳动开发的AI视频生成模型，模型能够根据文本或图像生成高质量的视频内容，支持多镜头切换、稳定运动轨迹和风格化控制，适用于创意内容创作、广告制作和教育演示等场景。

0100

AI大模型 AI工具集 # Seedance

京医千询医疗大模型

京医千询是京东健康发布的面向医疗健康行业的大模型，它能够提供多场景的智能化解决方案，包括远程问诊、智能辅诊、智能影像、智能药师等。它建立在京东言犀通用大模型基础之上，能快速完成在医疗健康领域各个场景的迁移和学习，从而实现产品和解决方案的全面AI化部署。

0100

AI大模型 # AI大模型 # 京东 # 京东健康

蚂蚁金融大模型

蚂蚁集团在上海外滩大会上宣布推出金融大模型，目前官网地址为蚂蚁集团

0100

AI大模型金融大模型 # 支小助 # 支小宝 # 蚂蚁集团

ARTE – Artificial Real Estate

AI助力房产税务，高效专业

0100

Agent智能体 AI企业 # ARTE - Artificial Real Estate

曹植大语言模型

垂直领域大语言模型

0100

AI大模型 AI工具集 # 曹植大语言模型

MathGPT官网

使用 GPT 解决数学问题，并获取每个解决方案背后的代码！

0100

AI大模型 AI导航 # Math GPT

高考志愿大模型

AI 协助高考志愿填报，超越100%真人规划师，高考志愿大模型官网入口网址

0100

AI大模型 AI训练模型 # 志愿填报助手 # 高考志愿填报 # 高考志愿大模型

Qwen3体验

0100

AI大模型体验入口 # Qwen3 # 模型体验

Baker-GPT大模型标贝科技

标贝科技-专业AI语音服务的人工智能开放平台，提供语音识别、语音合成、语音拓展、图像标注等人工智能服务，为全行业开发者提供智能语音API接口，智能语音SDK，一站式人工智能语音交互技术方案!

090

AI大模型 AI开放平台 # 标贝

免费领取AI课程

4 个小时课程！不限基础和语言！免费学习！专门为开发者量身打造的『从 0 到 1 入门 AI 大模型』

090

AI大模型 AI工具集 # Ai时代 # 免费领取AI课程

Open AI o3 API

安全驱动的先进推理模型

090

AI大模型更多神器 # Open AI o3 API

Cephalon Cloud 端脑云

AIGC 应用平台

090

AI大模型 AI工具集 # Cephalon Cloud 端脑云

APUS大模型

让AI应用更简单

090

AI大模型 AI工具集 # APUS大模型

PuLID

PuLID是一款纯净和闪电身份定制工具，通过对比对齐技术实现个性化定制，为用户提供更加个性化的身份定制体验。

090

AI大模型 # 对比对齐 # 身份定制

Langfuse Prompt Experiments

调试优化LLM应用的专业工具

090

AI大模型更多神器 # Langfuse Prompt Experiments

sql-llm-benchmark

专注于语言模型（LLM）SQL 能力评测的专业平台，构建了全面且具实践价值的 SQL 能力排行榜（SCALE），为开发者、数据库管理员及企业技术决策者提供关键参考

080

AI大模型 AI工具集 # sql-llm-benchmark

Q-GPT 奇安信大模型

奇安信发布Q-GPT安全机器人和大模型卫士

080

AI大模型 AI训练模型 # Q-GPT # 大模型卫士 # 奇安信

MiniGPT-v2多模态

MiniGPT-v2：大型语言模型作为视觉语言多任务学习的统一接口

080

AI大模型 # MiniGPT-v2

sora模型

sora模型,OpenAI新出大模型,文本生成60秒视频

080

AI大模型 AI工具导航 # sora大模型 # sora模型 # sora模型官网

元语智能 ChatYuan

ChatYuan 元语智能官网入口，ChatYuan官网在线体验网址

070

AI大模型中文AIGC项目 # ChatYuan # 元语大模型

有灵AI

网易伏羲推出的一系列人工智能平台和工具的总称

060

AI大模型 AI工具集 # 有灵AI

2024 LinkedIn Rewind

LinkedIn年度回顾文章一键生成

060

AI大模型更多神器 # 2024 LinkedIn Rewind

没有了