图像生成

Iterate是一位友好的AI艺术家，可以将您的想法转化为图像。Iterate.World 是一起制作图像的地方。给迭代一个提示，它将为你绘制一个图像。迭代可能需要几次尝试才能正确，因此请随时要求提供许多图像，并删除您不喜欢的任何图像。

Iterate

0280

令人惊叹的摄影和带有 AI 的头像，一个由AI驱动的产品图片生成网站。产品摄影设置、头像、照片背景与AI。

迪沃

0270

Nano Banana AI是一款使用先进AI技术的图像生成器和编辑器，能够通过简单的文本提示即时将文字转换为图像。它的AI模型领先于其他传统模型，具有高度准确性和速度。

Ainanobanana AI

0260

艺术创作 # AI # 人脸识别 # 图像增强

FLUX.1-dev

FLUX.1-dev是一个拥有12亿参数的修正流变换器，能够根据文本描述生成图像。它代表了文本到图像生成技术的最新发展，具有先进的输出质量，仅次于其专业版模型FLUX.1 [pro]。该模型通过指导蒸馏训练，提高了效率，并且开放权重以推动新的科学研究，并赋予艺术家开发创新工作流程的能力。生成的输出可以用于个人、科学和商业目的，具体如flux-1-dev-non-commercial-license所述。

0260

艺术创作 # AI艺术 # 图像生成 # 文本到图像

EVEAI .XYZ

以人工智能驱动的速度和风格的一致性，为你的创意项目生成生产质量的资产。

0260

Graydient AI提供顶级开放模型、无限制创作、强大的客户支持和云存储，助力用户高效生成AI图像和视频。

Graydient AI

0260

AI智能绘画 AI赋能 # AI # AI图像生成 # AI智能绘画

Vegeta AI

介绍 Vegeta AI 是一个用于创建令人惊叹的 AI 生...

0260

设计与艺术 # AI 艺术生成器 # 创意工具 # 图像生成

OmniGen2

OmniGen2 是一个高效的多模态生成模型，结合了视觉语言模型和扩散模型，能够实现视觉理解、图像生成及编辑等功能。其开源特性为研究人员和开发者提供了强大的基础，助力个性化和可控生成 AI 的探索。

0240

图像生成 # 人工智能 # 图像生成 # 图像编辑

Jrnylist

AI绘画是一项创新的技术，通过人工智能的算法和计算机的图像处理技术，可以让我们轻松地创建出美丽的绘画作品。

0240

AI在线工具 AI赋能 # 3D角色设计 # AI优化 # AI水彩画

WHAM

WHAM（World and Human Action Model）是由微软研究院开发的一种生成式模型，专门用于生成游戏场景和玩家行为。该模型基于Ninja Theory的《Bleeding Edge》游戏数据训练，能够生成连贯、多样化的游戏视觉和控制器动作。WHAM 的主要优点在于其能够捕捉游戏环境的3D结构和玩家行为的时间序列，为游戏设计和创意探索提供了强大的工具。该模型主要面向学术研究和游戏开发领域，帮助开发者快速迭代游戏设计。

0240

图像生成 # 图像生成 # 学术研究 # 游戏开发

StoryScape

释放你的创造力，定制属于你自己的故事。StoryScape AI让你成为真正的创作者，摆脱社交媒体的束缚，创作出令人沉浸的故事体验。

0240

AI说故事文本AI # AI技术 # 免费增值。# 图像生成

FLUX.1 Tools

FLUX.1 Tools是Black Forest Labs推出的一套模型工具，旨在为基于文本的图像生成模型FLUX.1增加控制和可操作性，使得对真实和生成的图像进行修改和再创造成为可能。该工具套件包含四个不同的特性，以开放访问模型的形式在FLUX.1 [dev]模型系列中提供，并作为BFL API的补充，支持FLUX.1 [pro]。FLUX.1 Tools的主要优点包括先进的图像修复和扩展能力、结构化引导、图像变化和重构等，这些功能对于图像编辑和创作领域具有重要意义。

0230

文案写作 # 人工智能 # 图像生成 # 图像编辑

SliderSpace

SliderSpace 是一项创新技术，旨在提高扩散模型的可控性和可解释性。它通过自动发现模型内部的视觉知识，将其分解为直观的滑块，用户可以通过这些滑块轻松调整图像生成的方向。该技术不仅能够揭示模型对不同概念的理解，还能显著提高图像生成的多样性。SliderSpace 的主要优点包括自动化发现方向、语义正交性和分布一致性，使其成为探索和利用扩散模型视觉能力的强大工具。该技术目前处于研究阶段，尚未明确具体的价格和商业定位。

0230

艺术创作 # 图像生成 # 多样性 # 模型解释

NUWA-Infinity

NUWA-Infinity是微软推出的一个艺术作品生成平台，它能够创作西方油画、自然风景、抽象艺术等多种风格的艺术作品。该平台支持文本到图像、图像到视频、图像外扩等多种创作方法。

0230

艺术创作 # AI艺术创作 # 创意工具 # 图像处理

ChatPlayground

ChatPlayground AI是一个集成了多种AI模型的在线平台，提供多角度的AI对话体验。它通过一个界面集成了多个AI聊天机器人，支持用户在不同场景下获取更准确、更多样化的答案。平台还提供实时网页搜索、图像生成、历史记录回顾等功能，支持多语言，满足不同用户的需求。

0220

智能聊天机器人 # AI # 图像生成 # 多语言支持

Grok App

Grok是一个由X.AI Corp开发的AI助手应用，旨在提供最真实、有用和好奇的答案。用户可以通过Grok获取任何问题的答案、生成引人注目的图像，并上传图片以更深入地了解世界。Grok以其高质量的图像生成、实时更新的数据、对话式的幽默语气和注重隐私的特性，为用户提供了一个安全、高效的AI体验平台。

0220

图像生成 # AI助手 # 信息查询 # 图像生成

AISEO AI ART Generator

create stunning images from text prompts using artificial intelligence. AISEO provides the best Ai art generator to bring your visual game to the next level.使用AISEO艺术，您可以描绘自己的想象力。

0220

AI智能绘画 AI赋能 # 3D角色设计 # AISEO # AISEO AI ART Generator

Dreamlike

Create stunning AI Art in seconds with Stable Diffusion. Upscale your images, create variations, fix faces, share your art, and more.

0210

AI智能绘画 AI赋能 # 3D角色设计 # AI优化 # AI图像生成

Midlibrary 2.0

0210

AI赋能 AI趣站 # 3D角色设计 # AI优化 # AI水彩画

BrainFever

BrainFever.ai是一个应用程序，利用人工智能技术从文本描述中生成图像。它允许用户通过简单地描述他们想要看到的内容来创建独特而有趣的图像。PRO月费每月9.99美元，PRO年费每年49.99美元，两种选项每月包括200个信用点、访问所有内容和免费支持。

0210

AI图像与设计 # AI # BrainFever # DALL-E

Text Behind Image AI

Text Behind Image是一个在线工具，允许用户在图片上添加文字，创造出文字背后效果，增强视觉冲击力。这种技术在广告、社交媒体和个人项目中尤为重要，因为它能够吸引观众的注意力并传达信息。产品背景信息表明，这是一个简单、快速且专业的解决方案，用户无需复杂的设计技能即可实现出色的设计效果。目前，该工具提供免费使用，适合个人和商业项目。

0210

图像生成 # 图像生成 # 图片编辑 # 在线服务

Darwin Studio

Darwin Studio是一款AI图像、视频和广告生成器，通过使用AI技术和算法，帮助用户快速生成高质量的图像、视频和广告。它具有高效、智能、创新的特点，可以大大提升创意工作效率。

0210

视频生成 # AI # 创意工具 # 图像生成

Stable Diffusion 3.5 Medium

Stable Diffusion 3.5 Medium是一个基于文本到图像的生成模型，由Stability AI开发，具有改进的图像质量、排版、复杂提示理解和资源效率。该模型使用了三个固定的预训练文本编码器，通过QK-规范化提高训练稳定性，并在前12个变换层中引入双注意力块。它在多分辨率图像生成、一致性和各种文本到图像任务的适应性方面表现出色。

0210

文案写作 # AI艺术 # 图像生成 # 多模态

Janus Pro

Janus Pro 是由 DeepSeek 技术驱动的先进 AI 图像生成与理解平台。它采用革命性的统一变换器架构，能够高效处理复杂的多模态操作，实现图像生成和理解的卓越性能。该平台训练了超过 9000 万个样本，其中包括 7200 万个合成美学数据点，确保生成的图像在视觉上具有吸引力且上下文准确。Janus Pro 为开发者和研究人员提供强大的视觉 AI 能力，帮助他们实现从创意到视觉叙事的转变。平台提供免费试用，适合需要高质量图像生成和分析的用户。

0210

图像生成 # AI # 创意 # 图像理解

NanoBanana AI Image Generator

NanoBanana AI 图片生成器利用Google最新的NanoBanana模型，能在数秒内生成高质量图片。其优势在于极速生成、高质量输出、SEO友好、简单易用。价格灵活，适合各类用户。

0200

图像生成 # AI工具 # 创意设计 # 图像生成

Fluxx.AI

FLUX.1 Kontext是一款革命性的多模态AI模型，将文本指令与图像编辑和生成相结合，实现精准本地化编辑，保持角色一致性和风格连贯性。该产品适用于营销内容创作、电影制作和设计等专业工作流程。

0200

文案写作 # AI图像编辑 # 图像生成 # 多模态

AI Dreamer

AI梦想家是一款AI艺术生成器APP，可在App Store中下载。用户可通过输入单词、添加风格和艺术家灵感来创作艺术。该应用程序仅需不到3秒即可生成可视化效果，用户可以将其与朋友分享。AI梦想家也可提供俄语版本。

0200

AI图像与设计 # AI艺术生成器 # 图像生成 # 艺术创作

Microsoft Copilot for Mac

Microsoft Copilot是一款由微软开发的AI助手应用，基于OpenAI和微软的AI技术，旨在为用户提供高效、便捷的智能助手服务。它能够帮助用户快速获取信息、生成文本和图像，提升工作效率和创造力。该应用支持多种语言，界面简洁易用，适合不同用户群体。它不仅适用于个人生活，还能在商业和教育场景中发挥重要作用，是一款免费的生产力工具。

0200

图像生成 # AI助手 # 创意激发 # 图像生成

Stability Matrix

Stability Matrix 是一个用户友好的桌面客户端，旨在简化 Stable Diffusion 的图像生成过程。它通过一键安装和无缝的模型集成，帮助用户轻松管理和生成图像，无需深入的技术知识。该工具支持多种操作系统，并能有效管理模型资源，降低用户的学习曲线。Stability Matrix 提供稳定性和灵活性，特别适合图像创作者、设计师及数字艺术家使用。

0200

艺术创作 # Stable Diffusion # 图像生成 # 模型管理

OminiControl

OminiControl是一个为Diffusion Transformer模型如FLUX设计的最小但功能强大的通用控制框架。它支持主题驱动控制和空间控制（如边缘引导和图像修复生成）。OminiControl的设计非常精简，仅引入了基础模型0.1%的额外参数，同时保持了原始模型结构。这个项目由新加坡国立大学的学习与视觉实验室开发，代表了人工智能领域中图像生成和控制技术的最新进展。

0200

图像生成 # AI # Diffusion Transformer # f.lux

API.box

API.box是一个提供先进AI接口的平台，旨在帮助开发者快速集成AI功能到他们的项目中。它提供全面的API文档和详细的调用日志，确保高效开发和系统性能稳定。API.box具备企业级安全性和强大可扩展性，支持高并发需求，同时提供免费试用和商业用途的输出许可，是开发者和企业的理想选择。

0200

文案写作 # AI接口 # 图像生成 # 文本生成

Draw Things: AI Generation

Draw Things: AI Generation是一款AI生成的绘画应用程序，适用于iPhone，iPad和Mac。免费下载。

0200

AI图像与设计 # AI Generation # AI绘画 # Draw Things

CogView4-6B

CogView4-6B 是由清华大学知识工程组开发的文本到图像生成模型。它基于深度学习技术，能够根据用户输入的文本描述生成高质量的图像。该模型在多个基准测试中表现优异，尤其是在中文文本生成图像方面具有显著优势。其主要优点包括高分辨率图像生成、支持多种语言输入以及高效的推理速度。该模型适用于创意设计、图像生成等领域，能够帮助用户快速将文字描述转化为视觉内容。

0200

文案写作 # 创意设计 # 图像生成 # 多语言支持

Pirate Diffusion

最好的免费AI图片生成器是Pirate Diffusion。可笑的强大--免费AI图片生成器--最好的AI图片生成器，敢于比较。

0200

AI智能绘画 AI赋能 # AI # AI绘画 # Pirate Diffusion

Janus-Pro-1B

Janus-Pro-1B 是一个创新的多模态模型，专注于统一多模态理解和生成。它通过分离视觉编码路径，解决了传统方法在理解和生成任务中的冲突问题，同时保持了单个统一的 Transformer 架构。这种设计不仅提高了模型的灵活性，还使其在多模态任务中表现出色，甚至超越了特定任务的模型。该模型基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 构建，使用 SigLIP-L 作为视觉编码器，支持 384x384 的图像输入，并采用特定的图像生成 tokenizer。其开源性和灵活性使其成为下一代多模态模型的有力候选。

0200

图像生成 # Transformer # 图像生成 # 多模态

千图网AI绘画

千图网AI绘画是一个利用人工智能技术，将用户的文字描述转化为图像的平台。它通过深度学习算法，理解用户的创意需求，并生成相应的视觉内容。这种技术的重要性在于它极大地降低了艺术创作的门槛，使得非专业人士也能轻松创作出专业级别的图像作品。产品背景信息显示，千图网AI绘画旨在释放用户的想象力与创造力，为用户提供一个简单易用的AI创意工具库。价格方面，千图网AI绘画提供免费试用，用户可以体验AI绘画的魅力，同时也提供付费服务以满足更专业的需求。

0200

图像生成 # AI绘画 # 创意工具 # 图像生成

The Next AI Tool

介绍发现终极AI工具目录。什么是The Next AI ...

0200

目录 # AI工具 # AI目录 # 创意工具

即梦Dreamina – 一站式AI创作平台

介绍即梦Dreamina 是一个将想象力转化为现实的 AI...

0200

设计与艺术 # AI艺术 # 内容创作 # 创意平台

Synth Run

Synth Run是一款AI图像与艺术生成工具，提供各种游戏元素如药水模型、像素人物全身精灵、幻想贵族肖像等，同时提供上传自己的样式或选择预制选项来创建和自定义图像的工具。该工具允许调整大小、加像素、添加轮廓、创建透明背景，共有214张图片可用，图片大小选项为512 x 512、64 x 64和960 x 960。网站还包括游戏的法术示例和环境。

0190

AI图像与设计 # Synth Run # 图像生成 # 游戏素材

Awesome GPT-4o Images

Awesome GPT-4o Images 是一个展示 OpenAI 最新多模态模型 GPT-4o 生成的图片和提示的集合。该产品充分展示了 GPT-4o 在文本与图像理解方面的能力，支持多种艺术风格的生成。它适合设计师、艺术创作者和任何对 AI 艺术感兴趣的人。该项目是免费开放的，旨在激发创作灵感并推动 AI 艺术的发展。

0190

艺术创作 # AI 艺术 # 创意设计 # 图像生成

Storytelling Chatbot

该产品利用 Gemini 2.0 语言模型和 Google Imagen 图像生成技术，结合语音识别和语音合成，为用户提供一个互动式的故事创作体验。用户可以通过语音输入选择故事走向，系统会实时生成故事内容和相关图像。该产品的主要优点是创新的交互方式和强大的内容生成能力，适合用于教育、娱乐和创意启发。目前该产品处于开源阶段，未明确具体定价，主要面向开发者和教育机构。

0190

图像生成 # AI # 图像生成 # 娱乐

FLUX.1-dev-LoRA-One-Click-Creative-Template

FLUX.1-dev-LoRA-One-Click-Creative-Template 是一个基于 LoRA 训练的图像生成模型，由 Shakker-Labs 提供。该模型专注于创意照片生成，能够将用户的文本提示转化为具有创意性的图像。模型使用了先进的文本到图像的生成技术，特别适合需要快速生成高质量图像的用户。它是基于 Hugging Face 平台，可以方便地进行部署和使用。模型的非商业使用是免费的，但商业使用需要遵守相应的许可协议。

0190

设计助手 # LORA # 创意设计 # 图像生成

涂鸦扩散

使用 AI 将您的草图转换为精致的图像

0190

LlamaGen是一个新的图像生成模型家族，它将大型语言模型的原始下一个token预测范式应用于视觉生成领域。该模型通过适当的扩展，无需对视觉信号的归纳偏差即可实现最先进的图像生成性能。LlamaGen重新审视了图像分词器的设计空间、图像生成模型的可扩展性属性以及它们的训练数据质量。

LlamaGen

0190

艺术创作 # AI艺术 # 图像生成 # 自回归模型

DiffSensei

DiffSensei是一个结合了多模态大型语言模型（LLMs）和扩散模型的定制化漫画生成模型。它能够根据用户提供的文本提示和角色图像，生成可控制的黑白漫画面板，并具有灵活的角色适应性。这项技术的重要性在于它将自然语言处理与图像生成相结合，为漫画创作和个性化内容生成提供了新的可能性。DiffSensei模型以其高质量的图像生成、多样化的应用场景以及对资源的高效利用而受到关注。目前，该模型在GitHub上公开，可以免费下载使用，但具体的使用可能需要一定的计算资源。

0190

图像生成 # 人工智能 # 图像生成 # 多模态

Grok

介绍 Grok 是一个免费的 AI 助手，旨在提升生产力。 ...

0190

生活助手 # AI 助手 # 免费工具 # 创造性头脑风暴

SOREAL

SOREAL.AI稳定扩散服务|AI图像生成器|稳定扩散在线工作室|Dreambooth微调和培训|文本到图像AI图像生成

0180

Flux Lora Online 是一个在线平台，提供多种 Flux Lora 模型，用于生成各种风格的图像。这些模型包括但不限于写实风格、动漫风格、迪士尼风格等，能够满足不同用户对图像生成的多样化需求。平台采用先进的图像生成技术，提供高分辨率和细节丰富的图像，同时拥有用户友好的界面，简化工作流程，提高生产力。

Flux Lora Online

0180

艺术创作 # 图像生成 # 在线平台 # 艺术创作

InfiniteYou

InfiniteYou（InfU）是一个基于扩散变换器的强大框架，旨在实现灵活的图像重构，并保持用户身份。它通过引入身份特征并采用多阶段训练策略，显著提升了图像生成的质量和美学，同时改善了文本与图像的对齐。该技术对提高图像生成的相似性和美观性具有重要意义，适用于各种图像生成任务。

0180

图像生成 # AI # 图像生成 # 扩散模型

DiscoDiffusion

DiscoDiffusion是一个分享AI图像艺术创作的社区，提供了使用Disco Diffusion进行艺术创作的指南。

0180

AI图像与设计 # AI模型 # AI艺术 # Disco Diffusion

霍拉拉

霍拉拉，在几秒钟内使用 AI 创建动漫艺术品。

0180

USP.ai是一款强大的生成式人工智能操作系统，帮助博客作者、文案撰写人员和出版商增强他们的文章和出版物的视觉效果。它提供了一系列功能，包括AI生成的提示和图片、一站式操作面板、AI提示库、高级分享功能等。用户可以轻松创建令人着迷的图片，完美补充其文字内容，并拥有完全的图片拥有权。

Usp.ai

0170

图像AI 图像生成器 # 图像生成 # 文案

flux-lora-collection

flux-lora-collection是由XLabs AI团队发布的一系列针对FLUX.1-dev模型的LoRAs训练检查点。该模型集合支持多种风格和主题的图像生成，如动物拟人化、动漫、迪士尼风格等，具有高度的可定制性和创新性。

0170

艺术创作 # AI艺术 # 图像生成 # 非商业用途

ogImage.click

Free OG Image Generator 是一个在线工具，旨在帮助用户快速生成用于社交媒体的高质量预览图像，如 Open Graph 图像、Twitter/X 头图等。该工具的主要优点在于其简单易用且完全免费，用户无需注册即可访问所有功能。它提供了多种专业设计的模板，支持自定义背景、渐变色、网格叠加等高级功能，能够满足不同用户的设计需求。该工具的背景信息显示其由开发者 Jude Wei 创建，旨在为用户提供一个无需复杂软件即可快速制作专业图像的平台。

0170

社交媒体 # Open Graph # 免费 # 图像生成

F Lite

F Lite 是由 Freepik 和 Fal 开发的一个大型扩散模型，具有 100 亿个参数，专门训练于版权安全和适合工作环境 (SFW) 的内容。该模型基于 Freepik 的内部数据集，包含约 8000 万张合法合规的图像，标志着公开可用的模型在这一规模上首次专注于合法和安全的内容。它的技术报告提供了详细的模型信息，并且使用了 CreativeML Open RAIL-M 许可证进行分发。该模型的设计旨在推动人工智能的开放性和可用性。

0170

图像生成 # AI 模型 # 图像生成 # 开源

Art Hub

Art Hub 是一个在线艺术社区，旨在提供一个平台，让艺术家、设计师和创意人士分享他们的作品，交流和获得灵感，并与其他人联系和合作。

0170

AI图像 AI开放平台 # AI绘画 # 共享平台 # 图像生成

PixelHaha

PixelHaha是一个AI艺术图像生成器，它允许用户通过文本提示（prompt）来创造各种风格的AI艺术作品。用户可以根据自己的灵感来描述想要的图像，然后由AI将这些描述转化为图像。这个产品的重要性在于它能够快速将创意转化为视觉作品，极大地降低了艺术创作的门槛，并且提供了一个独特的AI角色来与用户的灵魂伴侣相结合。

0170

艺术创作 # AI艺术 # 创意工具 # 图像生成

AI Banana Image Generator

AI Banana 是一款先进的图像编辑平台，利用 Nano Banana AI 技术，通过自然语言处理实现 1-2 秒内的图像生成与编辑。该产品适合各种创意需求，包括电子商务、市场营销和设计等领域。价格灵活，提供按需购买和订阅服务，满足不同用户的需求。

0160

图像生成 # AI # 创意设计 # 图像生成

shou_xin

shou_xin是一个基于文本到图像的生成模型，它能够根据用户提供的文本提示生成具有手訫风格的铅笔素描图像。这个模型使用了diffusers库和lora技术，以实现高质量的图像生成。shou_xin模型以其独特的艺术风格和高效的图像生成能力在图像生成领域占有一席之地，特别适合需要快速生成具有特定艺术风格的图像的用户。

0160

文案写作 # Diffusers # LORA # 图像生成

云景AI绘图平台

AI画图工具，输入文本生成图像，二次元、写实、人物、风景、设计素材，支持中文，图像库分享

0160

AI智能绘画 AI赋能 # AI绘画 # 人工智能绘画 # 图像处理

PicAI Image&Avatar Generator

PicAI Image&Avatar Generator是一款利用MJ的原生图像生成技术的应用。只需简单的描述，即可快速获得令人惊叹的高清AI图像，可用于创建标志、漫画、风景图片、照片、插图、头像、物品、角色、场景等各种场景和风格。此外，为了方便用户体验，我们预设了数十个MJ AI绘画指令。只需点击您喜欢的模板，即可获得您想要的图像，无需复杂的指令。经过多次迭代，我们的图像生成已经变得非常稳定和高效，而且我们的年度订阅费用仅为官方MJ费用的十分之一。

0160

头像生成 # AI # 图像生成 # 图片生成

Free Midjourney AI Art Generator

Midjourney V6 API是一款通过人工智能将文本描述转化为生动艺术品的先进平台。它提供了多种模型选择，高度逼真的效果，以及灵活的尺寸适应。该产品的主要优点包括增强的现实感、丰富的功能和用户友好的界面。

0160

艺术创作 # 人工智能 # 图像生成 # 艺术

Arteus AI

Arteus AI Image Generator是一款由Arteus AI开发的尖端工具，利用先进的人工智能技术从文本提示中创建图像。只需描述您想生成的内容，Arteus AI就能产生出来。该工具采用了生成对抗网络（GANs）或变分自编码器（VAEs）等复杂的深度学习算法，通过学习数据集中的模式并根据输入参数生成图像，从而确保高质量输出。Arteus AI Image Generator非常灵活，可以创建各种类型的图像，包括逼真的照片、抽象艺术、风景、肖像等。用户可以通过调整参数或提供具体指令来定制生成的图像。

0160

艺术创作 # 人工智能 # 图像生成 # 艺术

Flex.1-alpha

Flex.1-alpha 是一个强大的文本到图像生成模型，基于80亿参数的修正流变换器架构。它继承了FLUX.1-schnell的特性，并通过训练指导嵌入器，使其无需CFG即可生成图像。该模型支持微调，并且具有开放源代码许可（Apache 2.0），适合在多种推理引擎中使用，如Diffusers和ComfyUI。其主要优点包括高效生成高质量图像、灵活的微调能力和开源社区支持。开发背景是为了解决图像生成模型的压缩和优化问题，并通过持续训练提升模型性能。

0160

文案写作 # 图像生成 # 开源 # 微调

AskVia

Ask Via是一款基于AI技术的聊天机器人，可以帮助用户回答问题、完成任务。通过与WhatsApp无缝集成，使用GPT-3.5技术，Ask Via能够随时准备回答您的问题。无论是工作、学校还是个人使用，Ask Via都是一个全能的AI助手，随时为您提供帮助。享受智能助手带来的未来体验吧！

0160

户外旅行 # AI助手 # 代码调试 # 写作助手

Procyon AI Image Generation Benchmark

Procyon AI Image Generation Benchmark 是一款由 UL Solutions 开发的基准测试工具，旨在为专业用户提供一个一致、准确且易于理解的工作负载，用以测量设备上 AI 加速器的推理性能。该基准测试与多个关键行业成员合作开发，确保在所有支持的硬件上产生公平且可比较的结果。它包括三个测试，可测量从低功耗 NPU 到高端独立显卡的性能。用户可以通过 Procyon 应用程序或命令行进行配置和运行，支持 NVIDIA® TensorRT™、Intel® OpenVINO™ 和 ONNX with DirectML 等多种推理引擎。产品主要面向工程团队，适用于评估推理引擎实现和专用硬件的通用 AI 性能。价格方面，提供免费试用，正式版为年度场地许可，需付费获取报价。

0160

图像生成 # AI # 专业用户 # 图像生成

Facetune

Facetune是一款面部美容修图软件，主要功能包括磨皮、美白、修复、美化、红眼修复等。Facetune有两个版本，分别是Facetune2和Facetune Video。

0160

AI办公 AI助手 # AI绘画 # 图像处理 # 图像生成

Mobile Diffusion

Mobile Diffusion是一款创新的图像生成应用，利用最新的人工智能技术，将您的想象力变为现实。无需互联网连接，可以随时随地使用，操作简单方便。快来体验吧！

0160

图像AI 图像生成器 # 人工智能 # 免费 # 图像生成

FaceMimic AI

FaceMimic AI是一款利用先进AI技术将自拍照片转换成专业头像的服务。无需专业摄影师或昂贵设备，用户只需上传自拍，即可在60秒内获得高质量的头像，适用于LinkedIn、社交媒体、个人使用等多种场景。产品背景信息显示，该技术能显著提升个人在职业网络中的可见度，增加面试机会，适用于职业发展、商业形象构建、社交分享和约会应用等多个领域。价格方面，提供免费试用，并根据不同的使用需求提供不同的套餐。

0160

社交媒体 # AI # 商业形象 # 图像生成

Stable Diffusion提示搜索引擎

Stable Diffusion 提示搜索引擎是一个强大的资源，适用于希望利用 AI 技术生成视觉内容的艺术家和创意专业人士。

0160

AI搜索引擎 # AI图像搜索引擎 # AI图片搜索 # AI搜索引擎

VisualCloze

VisualCloze 是一个通过视觉上下文学习的通用图像生成框架，旨在解决传统任务特定模型在多样化需求下的低效率问题。该框架不仅支持多种内部任务，还能泛化到未见过的任务，通过可视化示例帮助模型理解任务。这种方法利用了先进的图像填充模型的强生成先验，为图像生成提供了强有力的支持。

0160

图像生成 # 图像生成 # 图像编辑 # 多任务

FluxAPI.ai

FluxAPI.ai是面向开发者的平台，提供对Black Forest Labs FLUX 1模型系列的API访问。支持高级的文本转图像和图像转图像生成。主要优点包括价格经济，其Kontext Pro定价仅$0.025，Kontext Max定价仅$0.05，相比其他平台成本更低；提供多种AI模型，能适应不同场景需求；具备灵活的生成模式和实时性能，带来流畅创作体验；还有24/7专家支持。该平台专为开发者、创作者和团队大规模使用而打造，采用基于积分的计费模式，按需购买积分，无订阅、无最低消费、无隐藏费用。

0150

图像生成 # AI模型 # API平台 # 图像生成

Grok Imagine

Grok Imagine是由Aurora引擎驱动的AI图像和视频生成平台，可生成多领域的逼真图像和动态视频内容。其核心技术基于Aurora引擎的自回归图像模型，为用户提供高质量、多样化的视觉创作体验。

0150

搜索引擎优化 # AI # Aurora引擎 # 图像生成

SLD (Self-correcting LLM-controlled Diffusion Models)

SLD是一个自纠正的LLM控制的扩散模型框架，它通过集成检测器增强生成模型，以实现精确的文本到图像对齐。SLD框架支持图像生成和精细编辑，并且与任何图像生成器兼容，如DALL-E 3，无需额外训练或数据。

0150

艺术创作 # AI艺术 # 图像生成 # 扩散模型

Artedge AI

Artedge AI是一个提供前沿AI工具的平台，旨在提升用户的创意过程。平台提供AI艺术生成器和AI亲吻生成器等工具，以快速生成高分辨率、高质量的艺术作品。这些工具不仅能够加速创意实现，还能提供独特的艺术体验，适合设计师、艺术家和创意爱好者。平台还提供定价计划，用户可以根据自己的需求选择合适的服务。

0150

艺术创作 # AI艺术 # 创意工具 # 图像生成

ImageKit AI

ImageKit AI是一个结合了人工智能和生成式AI的媒体处理和数字资产管理平台。它通过AI技术，如图像扩展、智能裁剪、背景移除、添加阴影、通过文本提示生成图像等，帮助用户提升媒体内容的质量和处理效率。ImageKit AI的背景是满足现代数字媒体管理的需求，它通过AI技术简化了图像处理流程，降低了成本，并提高了内容的个性化和质量。产品定位于为企业提供高效、智能的媒体内容管理解决方案。

0150

社交媒体 # AI # 图像处理 # 图像生成

HiDream-I1

HiDream-I1 是一款新型的开源图像生成基础模型，拥有 170 亿个参数，能够在几秒内生成高质量图像。该模型适用于研究和开发，并在多个评测中表现优异，具有高效性和灵活性，适合用于各种创意设计和生成任务。

0150

图像生成 # AI 技术 # 图像生成 # 开源模型

RodinHD

RodinHD是一个基于扩散模型的高保真3D头像生成技术，由Bowen Zhang、Yiji Cheng等研究者开发，旨在从单一肖像图像生成细节丰富的3D头像。该技术解决了现有方法在捕捉发型等复杂细节时的不足，通过新颖的数据调度策略和权重整合正则化项，提高了解码器渲染锐利细节的能力。此外，通过多尺度特征表示和交叉注意力机制，优化了肖像图像的引导效果，生成的3D头像在细节上显著优于以往方法，并且能够泛化到野外肖像输入。

0150

头像生成 # 3D头像 # AI技术 # 图像生成

SDXL_EcomID_ComfyUI

SDXL_EcomID_ComfyUI是一个为ComfyUI提供原生SDXL-EcomID支持的插件。它通过增强肖像表示，提供更真实、审美上更令人愉悦的外观，同时确保语义一致性和更大的内部ID相似性。这个插件完全集成于ComfyUI，并且不使用diffusers，而是本地实现EcomID。它的重要性在于能够提升图像生成的质量和一致性，特别是在处理人物肖像时，能够保持不同年龄、发型、眼镜等物理变化下的内部特征一致性。

0150

图像生成 # ComfyUI # EcomID # 图像生成

UnificAlly

UnificAlly是一家AI API服务平台，提供创新的AI模型和API服务，价格优惠。用户可以访问平台并选择各种先进的AI模型，如GPT 4.1、Suno、Higgsfield等，用于视频生成、图像创作、音乐作曲等。UnificAlly致力于提供高性价比的AI服务，并以快速可靠的API响应、简单易集成的REST API和详尽的文档和示例著称。

0140

图像生成 # AI服务 # API # 图像生成

Openjourney

Openjourney 是一个高保真的开源项目，旨在模拟 MidJourney 的界面，利用 Google 的 Gemini SDK 进行 AI 图像和视频生成。该项目支持使用 Imagen 4 生成高质量图像，以及使用 Veo 2 和 Veo 3 进行文本到视频和图像到视频的转换。它适合需要进行图像生成和视频制作的开发者和创作者，提供了用户友好的界面和实时生成体验，能够助力创意工作与项目开发。

0140

图像生成 # AI # Midjourney # 图像生成

达芬奇——你的AI创作大师

达芬奇是一个具有极高创造力和实用性的人工智能创作大师，它可以创建逼真的图像、插图，图形并能够视觉化自然语言的描述，更是一个重大的技术突破，将人工智能技术引入了艺术领域，为数字创意、广告设计、游戏开发等领域的创作者提供了极大的帮助。

0140

AI助手 AI图像 # AI绘画 # 图像生成 # 文本转图像

腾讯混元图像 2.0

0140

图像生成 # AI # 创作 # 图像生成

Open-MAGVIT2

Open-MAGVIT2是由腾讯ARC实验室开源的一个自回归图像生成模型系列，包含从300M到1.5B不同规模的模型。该项目复现了Google的MAGVIT-v2分词器，实现了在ImageNet 256×256数据集上达到1.17 rFID的先进重建性能。通过引入不对称分词技术，将大词汇表分解为不同大小的子词汇表，并引入'下一个子标记预测'来增强子标记间的交互，以提高生成质量。所有模型和代码均已开源，旨在推动自回归视觉生成领域的创新和创造力。

0140

销售管理 # 图像处理 # 图像生成 # 开源项目

ComfyUI-KwaiKolorsWrapper

ComfyUI-KwaiKolorsWrapper 是一个为 Kwai-Kolors 文本到图像模型设计的 Diffusers 包装器。它使用户能够通过 Diffusers 库方便地运行 Kwai-Kolors 的文本到图像生成流程。该插件支持从 Hugging Face 直接下载模型，并提供了量化模型以减少 VRAM 使用，适用于需要高效率图像生成的开发者和设计师。

0140

艺术创作 # AI艺术 # Diffusers # Hugging Face

Qwen2vl-Flux

Qwen2vl-Flux是一个结合了Qwen2VL视觉语言理解能力的FLUX框架的先进多模态图像生成模型。该模型擅长基于文本提示和视觉参考生成高质量图像，提供卓越的多模态理解和控制。产品背景信息显示，Qwen2vl-Flux集成了Qwen2VL的视觉语言能力，增强了FLUX的图像生成精度和上下文感知能力。其主要优点包括增强的视觉语言理解、多种生成模式、结构控制、灵活的注意力机制和高分辨率输出。

0140

图像生成 # 图像生成 # 多模态 # 深度学习

Mann-E Art

Mann-E Art是由Mann-E公司开发的一款基于Stable Diffusion XL的图像生成模型，专注于生成接近midjourney艺术风格的图像。该模型在训练过程中使用了约1000个midjourney输出以及团队收集的照片，擅长生成照片、艺术作品和数字绘画，但在像素艺术或矢量插画方面可能表现一般。

0140

艺术创作 # AI艺术 # Stable Diffusion XL # 图像生成

Image Variations: AI Generator

Image Variations: AI Generator是一款基于人工智能技术的图像生成工具，可以根据任何输入图像生成惊人的变体，帮助用户创造出独一无二的作品。

0140

图像AI 图像编辑 # 人工智能 # 付费 # 图像生成

Regional-Prompting-FLUX

Regional-Prompting-FLUX是一种训练无关的区域提示扩散变换器模型，它能够在无需训练的情况下，为扩散变换器（如FLUX）提供细粒度的组合文本到图像生成能力。该模型不仅效果显著，而且与LoRA和ControlNet高度兼容，能够在保持高速度的同时减少GPU内存的使用。

0140

文案写作 # AI # Controlnet # LORA

AI ContentCraft

AI ContentCraft 是一个强大的内容创作平台，旨在帮助创作者快速生成故事、播客脚本和多媒体内容。它通过集成文本生成、语音合成和图像生成技术，为创作者提供一站式的解决方案。该工具支持中英文内容转换，适合需要高效创作的用户。其技术栈包括 DeepSeek AI、Kokoro TTS 和 Replicate API，确保高质量的内容生成。产品目前开源免费，适合个人和团队使用。

0140

文案写作 # AI # 内容创作 # 图像生成

Artius

Artius Studio是一个基于AI的创意平台,为品牌提供生成专业级质量创意内容的服务,包括无限数量的公司形象照、个性化风格等。可使用现有图片训练,输出逼真或艺术化效果,免费试用。

0140

头像生成 # AI # 创意 # 图像生成

人脸生成器

人工智能生成的图像从未如此好看。从我们的生产准备数据库中探索和下载我们多样的、无版权的头像图片。使用完全由 AI 生成的照片增强您的创意作品。通过我们分类和标记的应用程序查找模型图像，或通过 API 集成图像。

0140

AI赋能 AI趣站 # AI生成 # API集成 # 下载

1.58-bit FLUX

1.58-bit FLUX是一种先进的文本到图像生成模型，通过使用1.58位权重（即{-1, 0, +1}中的值）来量化FLUX.1-dev模型，同时保持生成1024x1024图像的可比性能。该方法无需访问图像数据，完全依赖于FLUX.1-dev模型的自监督。此外，开发了一种定制的内核，优化了1.58位操作，实现了模型存储减少7.7倍，推理内存减少5.1倍，并改善了推理延迟。在GenEval和T2I Compbench基准测试中的广泛评估表明，1.58-bit FLUX在保持生成质量的同时显著提高了计算效率。

0140

图像生成 # 图像生成 # 模型优化 # 自监督学习

AILIBRI

AILIBRI是一个汇集了超过2000个AI神经网络工具的目录网站，涵盖了文本、图像、视频、音频等多个领域的工具。它为用户寻找合适的AI工具提供了极大的便利，无论是专业人士还是初学者，都能在这里找到满足其需求的工具。该网站提供了详细的分类和搜索功能，帮助用户快速定位到所需的工具。

0140

音频处理 # AI工具 # 图像生成 # 文本处理

Aiartapps

Aiartapps为设计师和创意工程师提供各种AI艺术相关的资源和工具，包括生成艺术、人物头像创作、儿童故事生成、图像创作等。用户可通过该平台使用各种AI模型进行创作，无需具备机器学习知识。产品提供API接口、SDK、稳定的扩散生成等功能，同时还有创作灵感、社区交流、优惠活动等。定价灵活，涵盖免费、付费和免费试用等多种模式。

0140

艺术创作 # AI # 创作工具 # 图像生成

Tingo.ai

用户能够根据自己的喜好创建和互动一个AI女友。这个工具以其定制化选项、深度学习能力和灵活的互动功能为主要特点，为用户提供了一个可以进行情感交流和个性化互动的虚拟伴侣。

0140

AIGC智能对话 AI女友 # AI伴侣 # AI女友 # Tingo.ai

Random Animal

Random Animal Generator是一个利用先进人工智能技术的网站，用户可以在短时间内生成高质量、独特的动物图像。这项技术的重要性在于它能够快速满足用户对动物图像的需求，无论是用于娱乐、教育还是设计灵感。产品背景信息显示，该网站由专业的机器学习算法支持，能够提供即时的结果和多样化的动物种类及风格选择。价格方面，网站提供了不同层次的服务选项，以满足不同用户的需求。

0140

图像生成 # AI # 动物 # 图像生成

Sana_600M_512px

Sana是一个由NVIDIA开发的文本到图像的生成框架，能够高效生成高达4096×4096分辨率的图像。Sana以其快速的速度和强大的文本图像对齐能力，可以在笔记本电脑GPU上部署，代表了图像生成技术的一个重要进步。该模型基于线性扩散变换器，使用预训练的文本编码器和空间压缩的潜在特征编码器，能够根据文本提示生成和修改图像。Sana的开源代码可在GitHub上找到，其研究和应用前景广阔，尤其在艺术创作、教育工具和模型研究等方面。

0140

文案写作 # Nvidia # 图像生成 # 文本到图像

Gnomic智能体平台

提示词工程师之家

0140

AI工具工具大全 # AI写作 # AI社区 # Gnomic

YouArt

Youart是一体化AI创意工作室，提供强大的AI图像和视频生成器，通过文本提示将您的想法转化为令人惊叹的视觉作品。

0130

图像生成 # AI # 图像生成 # 视频生成

AI Fiesta

AI Fiesta提供了多个顶级AI模型，让用户可以比较模型回答，并选择最适合每项任务的AI。该产品的主要优点在于聚合了多个顶尖AI模型，提供便捷的比较功能，价格合理且功能强大。

0130

图像生成 # 图像生成 # 多模型对比 # 实时回答

Image FX

ImageFX是由Google强大的AI技术驱动的先进AI图像生成器，将简单的文本提示转化为令人惊叹的图像。其主要优点包括生成高品质、详细的图像、快速操作、精准控制、Google AI支持、广泛应用、用户友好界面。价格分为免费、基础和高级三个选项，适用于艺术家、设计师、营销人员等。

0130

图像生成 # AI # Google技术 # 图像生成

Diffusion Land

Diffusion Land允许您使用各种AI模型生成图像。他们还提供了几个预先构建的概念，可用于生成某些类型的图像。

0130

Light Year AI是一个将文本与视觉艺术结合的平台，它通过提供文本到图像和视频的转换服务，为创意工作者和普通用户提供了一个全新的表达和分享想法的方式。

Light Year AI

0130

AIGC绘画工具 AI绘画社区 # AI绘画 # ai绘画社区 # Light Year AI

ComfyUI_HelloMeme

HelloMeme是一个集成了空间编织注意力（Spatial Knitting Attentions）的扩散模型，用于嵌入高级别和细节丰富的条件。该模型支持图像和视频的生成，具有改善生成视频与驱动视频之间表情一致性、减少VRAM使用、优化算法等优点。HelloMeme由HelloVision团队开发，属于HelloGroup Inc.，是一个前沿的图像和视频生成技术，具有重要的商业和教育价值。

0130

图像生成 # 图像生成 # 扩散模型 # 空间编织注意力

智普AI

认知预训练模型是一种基于人工智能技术的大模型，具有强大的创造力和智能应答能力，可以用于诗词创作、图片生成、问题回答等多种应用场景。

0130

AI绘画生成器图像AI # AI创作 # 图像生成

FLUX Pro Finetuning API

FLUX Pro Finetuning API 是由 Black Forest Labs 推出的生成式文本到图像模型的定制化工具。它允许用户通过少量示例图像（1-5张）对 FLUX Pro 模型进行微调，从而生成符合特定品牌、风格或视觉需求的高质量图像内容。该技术的主要优点在于其高度的定制化能力、对品牌一致性的保持以及与 FLUX 工具套件的无缝集成。它适用于专业创意人员、设计师和品牌方，帮助他们在营销、品牌建设和故事叙述中实现个性化内容创作。目前尚无明确价格信息，但其定位为高端创意工具，适合对生成内容质量有较高要求的用户。

0130

图像生成 # 内容创作 # 创意设计 # 品牌定制

Baseten

这是一个用于生成图像的开源模型Stable Diffusion的网站，由Stability AI开发。它可以根据文本提示生成图像，例如戴牛仔帽的狮子或宇宙飞船上安静图书馆的超逼真数字艺术。使用受CreativeML开放RAIL M许可证的管理。生成的图像由Baseten驱动。

0130

AI图像与设计 # AI图像艺术创作 # Stable Diffusion # 图像生成

猴子无限｜AI 生成引擎

猴子无限是一款AI生成引擎，可以帮助用户快速生成图像、文本等内容，提高工作效率。

0130

AI办公 AI图像 # AI办公 # 图像生成 # 图形生成

Journey.io

输入一个图片提示和你想链接的任何URL，我们将生成一个美丽的生成艺术QR码。

0130

AI设计工具 AI赋能 # AI绘画 # Journey.io # 人工智能绘画

Snowpixel App

生成媒体平台，从文本生成图像、音频、视频和 3D 对象，上传您自己的数据以训练自定义模型。

0130

anyimg.ai是一个使用先进AI模型将简单文本描述转换为令人惊叹的视觉艺术品的平台。它能够创建独特的艺术作品、照片和设计。

AnyImg AI

0120

艺术创作 # 创意艺术 # 图像生成 # 爱设计

AI Genie

AI Genie是一个图像与艺术生成的应用程序，可以通过连接到Apple Music来生成数字艺术品。

0120

AI图像与设计 # AI艺术 # 图像生成 # 应用程序

Openjourney Bot

Openjourney是一款强大的AI图像生成工具，能够帮助您生成出色的AI图像，修复人脸，交换人脸，移除背景，进行图像编辑，并提供AI聊天等功能。

0120

图像AI 图像生成器 # AI艺术 # 图像生成

Blip 3o

Blip 3o 是一个基于 Hugging Face 平台的应用程序，利用先进的生成模型从文本生成图像，或对现有图像进行分析和回答。该产品为用户提供了强大的图像生成和理解能力，非常适合设计师、艺术家和开发者。此技术的主要优点是其高效的图像生成速度和优质的生成效果，同时还支持多种输入形式，增强了用户体验。该产品是免费的，定位于开放给广大用户使用。

0120

文案写作 # 人工智能 # 图像生成 # 文本到图像

Stock AI

每次都能获得完美的图片。无论您需要什么样的图片，我们都可以帮您找到，并立即为您创建它。

0120

Frames是Runway Research推出的最新图像生成基础模型，它在风格控制和视觉保真度方面迈出了一大步。该模型擅长保持风格一致性，同时允许广泛的创意探索，能够为项目建立特定的外观，并可靠地生成忠实于您美学的变化。Frames的推出标志着在创意工作流程中，用户可以构建更多属于自己的世界，实现更大、更无缝的创意流程。

Frames

0120

图像生成 # 世界构建 # 创意探索 # 图像生成

Grok for iOS

Grok是由xAI开发的AI助手，旨在提供真实、有用且富有好奇心的交互体验。它能够回答各种问题、生成引人注目的图像，并通过上传图片帮助用户更深入地了解世界。Grok强调隐私保护，所有数据交互都以用户隐私为重，确保安全体验。它集成了X平台的数据，专注于实时信息，是寻求AI助手用户的理想选择。该应用免费提供给用户，适合需要高效获取信息和创意灵感的人群。

0120

图像生成 # AI助手 # 图像生成 # 实时信息

PCM

Phased Consistency Model（PCM）是一种新型的生成模型，旨在解决Latent Consistency Model（LCM）在文本条件高分辨率生成中的局限性。PCM通过创新的策略在训练和推理阶段提高了生成质量，并通过广泛的实验验证了其在不同步骤（1步、2步、4步、8步、16步）下与Stable Diffusion和Stable Diffusion XL基础模型的结合效果。

0120

视频生成 # 图像生成 # 文本条件生成 # 生成模型

Clio Sketch

FidelityBalanced是一款结合了人工智能和手绘草图的创作工具，可以帮助用户快速实现想法的可视化，具有高保真度、简单易用和多样化风格等特点。

0120

图像AI 图像生成器 # 人工智能 # 免费 # 图像生成

Illustration Generator

Illustration Generator是Icons8推出的AI图像生成器，由专业艺术家和工程师团队打造。它能够根据用户提供的文本提示或参考图像，生成具有一致艺术风格的插图，满足网页、桌面和移动应用、社交媒体、市场营销等设计需求。AI模型基于Icons8艺术家制作的视觉素材进行训练，确保生成的AI艺术作品具有一致性和专业外观。

0120

艺术创作 # AI艺术 # 专业插图 # 图像生成

Mamouth

Mamouth是一个集成了多种先进AI模型和图像生成服务的平台，旨在帮助用户保持在人工智能技术的前沿。平台提供包括GPT-4o、Claude、Llama、Mistral、Gemini等在内的AI语言模型，以及Dall-E、Midjourney和Stable Diffusion等图像生成工具。Mamouth通过订阅服务模式，为用户提供高效、便捷的AI使用体验，同时支持团队管理和工作空间功能，满足不同用户的需求。

0120

团队协作 # AI模型 # 团队协作 # 图像生成

PSHuman

PSHuman是一个创新的框架，它利用多视图扩散模型和显式重构技术，从单张图片中重建出逼真的3D人体模型。这项技术的重要性在于它能够处理复杂的自遮挡问题，并且在生成的面部细节上避免了几何失真。PSHuman通过跨尺度扩散模型联合建模全局全身形状和局部面部特征，实现了细节丰富且保持身份特征的新视角生成。此外，PSHuman还通过SMPL-X等参数化模型提供的身体先验，增强了不同人体姿态下的跨视图身体形状一致性。PSHuman的主要优点包括几何细节丰富、纹理保真度高以及泛化能力强。

0120

图像生成 # 3D重建 # 人体模型 # 人工智能

CAP4D

CAP4D是一种利用可变形多视图扩散模型（Morphable Multi-View Diffusion Models）来创建4D人像化身的技术。它能够从任意数量的参考图像生成不同视角和表情的图像，并将其适配到一个4D化身上，该化身可以通过3DMM控制并实时渲染。这项技术的主要优点包括高度逼真的图像生成、多视角的适应性以及实时渲染的能力。CAP4D的技术背景是基于深度学习和图像生成领域的最新进展，尤其是在扩散模型和3D面部建模方面。由于其高质量的图像生成和实时渲染能力，CAP4D在娱乐、游戏开发、虚拟现实等领域具有广泛的应用前景。目前，该技术是免费提供代码的，但具体的商业化应用可能需要进一步的授权和定价。

0120

图像生成 # 3D面部建模 # 4D化身 # 人像建模

Janus-Pro-7B

Janus-Pro-7B 是一个强大的多模态模型，能够同时处理文本和图像数据。它通过分离视觉编码路径，解决了传统模型在理解和生成任务中的冲突，提高了模型的灵活性和性能。该模型基于 DeepSeek-LLM 架构，使用 SigLIP-L 作为视觉编码器，支持 384x384 的图像输入，并在多模态任务中表现出色。其主要优点包括高效性、灵活性和强大的多模态处理能力。该模型适用于需要多模态交互的场景，例如图像生成和文本理解。

0120

文案写作 # 人工智能 # 图像生成 # 多模态

IMM

Inductive Moment Matching (IMM) 是一种先进的生成模型技术，主要用于高质量图像生成。该技术通过创新的归纳矩匹配方法，显著提高了生成图像的质量和多样性。其主要优点包括高效性、灵活性以及对复杂数据分布的强大建模能力。IMM 由 Luma AI 和斯坦福大学的研究团队开发，旨在推动生成模型领域的发展，为图像生成、数据增强和创意设计等应用提供强大的技术支持。该项目开源了代码和预训练模型，方便研究人员和开发者快速上手和应用。

0120

图像生成 # 人工智能 # 图像生成 # 开源

Wookeys AI

Ultimate AI Assistant是一款综合AI助手，可帮助您简化任务，提高工作效率。它提供了生成文本、图像、代码、视频、音频等多种功能，具有高度定制化的AI解决方案。无论您是需要生成创意文案、设计图像、编写代码、制作视频还是创作音乐，Ultimate AI Assistant都能满足您的需求。该产品定价根据功能和使用量而定，详情请访问官方网站。

0120

音频处理 # AI助手 # 代码生成 # 图像生成

FantasyPortrait

FantasyPortrait 是一种高保真、多情感的肖像动画生成框架，使用表达增强学习策略来捕捉细腻的面部动态，适合单角色和多角色场景。该技术的优势在于其独特的掩蔽交叉注意机制，有效防止了特征干扰，提升了动画的质量与表现力。该产品背景源于对现有面部动画方法的不足的反思，尤其是在处理多角色互动时的挑战。未来将以开源形式提供代码与模型，鼓励研究与开发。

0110

图像生成 # 动画 # 图像生成 # 多角色

Inker AI

Inker.AI 是一个在线的 AI 纹身生成器，允许用户通过上传照片或输入文字来创建个性化的纹身设计。该平台无需设计技能，用户只需简单操作即可生成专业纹身。适合各类人群，特别是艺术爱好者和纹身爱好者。产品免费使用，易于上手，具有极高的灵活性和创造力。

0110

图像生成 # AI # 个性化 # 图像生成

AI Image Variations Generator

DALL-E AI是一款基于人工智能技术的图像生成工具，能够根据用户提供的文字描述，创造出富有想象力和视觉震撼力的图像作品，适用于艺术创作、设计作品和广告宣传等多个领域。

0110

图像AI 图像编辑 # DALL-E AI # 图像生成

Dezgo

Dezgo是一个AI图像艺术创作网站，可以从任何文本提示生成高质量的图像。享受慷慨的免费套餐，提供一般和动漫模型。

0110

AI图像与设计 # AI图像创作 # Dezgo # 人工智能

Maker AI

Maker AI是一个拥有最强大的AI内容生成工具套件的网站。它提供了多种AI工具，包括AI写作和图像生成。

0110

AI写作与文本 # AI写作 # Maker AI # 内容生成

DanAI

DanAi Chat是由非洲人开发的人工智能助手，为非洲定制。它是AfricAi项目的一部分，提供本地语言输入、ChatGPT或Bard的强大功能，以及图像生成、PDF上传、电子商务、汇款等功能。体验非洲的人工智能未来。

0110

电子商务 # PDF上传 # 人工智能 # 图像生成

Interax

InteraxAI是一个无代码白标平台,提供可监控和可嵌入的AI小组件,无需编写任何代码。它允许无缝集成AI功能如文本补全、聊天机器人、图像生成等到网站、博客或SaaS平台中,开发者可以通过配置API和定制样式来 DIY AI小组件,同时可以通过会员计划或按使用次数收费来获利。关键词:聊天机器人、文本生成、图像生成、无代码、SaaS、API、嵌入式。

0110

低代码/无代码 # API # SaaS # 图像生成

Image GPT

Image GPT是一种基于大型Transformer模型的生成模型，通过无监督学习可以生成高质量的图像，并提取出优秀的特征。

0110

图像AI 图像生成器 # 图像生成 # 无监督学习

atAI.world

atAI是一个全方位的人工智能平台，提供文本生成、图像生成、代码生成、聊天机器人、语音转文字等多种功能，帮助用户快速生成高质量的内容。

0110

其它AI工具有趣的工具 # 人工智能 # 图像生成 # 文本生成

豆包桌面 AI 助手

豆包桌面 AI 助手是一款集成了多种 AI 功能的桌面应用程序，豆包电脑版客户端旨在提升用户的工作和学习效率。它通过 AI 划词翻译、搜索、AI 伴读 PDF 等功能，帮助用户快速获取信息，节省时间，提高生产力。产品由北京春田知韵科技有限公司开发，拥有简洁的界面和强大的功能，是现代办公和学习的得力助手。

0110

智能翻译 # AI # pdf # 创作

Canva文本转图像

这是一种全新的技术，它能够根据您所描述的内容生成任何您需要的图像。

0110

探索19个顶尖的文本到图像AI，使用39个GPU。

Xno.ai

0110

ArtGenius是一款利用人工智能技术的图像创作工具，不仅模仿各种绘画风格，还能通过文本识别场景和对象生成高质量逼真的图像。独特之处在于，您可以轻松创建各种令人惊叹的视觉图像，无需专业的绘画技能。

AI Art Generator Pro（Free） – ArtGenius

0110

艺术创作 # 人工智能 # 创作 # 图像生成

Luma Photon

Luma Photon 是一个创新的图像生成模型，以其高度创造性、智能化和个性化而著称。它建立在一个新的突破性架构之上，能够提供超高画质的图像，并且成本效率提高了10倍。Luma Photon 在大规模双盲评估中超越了市场上的所有模型，无论是在质量、创造力还是理解力方面都表现出色，同时在效率上也有了革命性的提升。

0110

图像生成 # AI # 创意工具 # 图像生成

ArtBlast AI

人工智能图像生成器。

0110

Leffa是一个用于可控人物图像生成的统一框架，它能够精确控制人物的外观（例如虚拟试穿）和姿态（例如姿态转移）。该模型通过在训练期间引导目标查询关注参考图像中的相应区域，减少细节扭曲，同时保持高图像质量。Leffa的主要优点包括模型无关性，可以用于提升其他扩散模型的性能。

Leffa

0110

图像生成 # 图像生成 # 姿态转移 # 扩散模型

Dreamer

将稳定扩散集成到Notion中，使用新的削减命令AI生成图像。

0110

FLUX.1-dev LoRA Outfit Generator是一个文本到图像的AI模型，能够根据用户详细描述的颜色、图案、合身度、风格、材质和类型来生成服装。该模型使用了H&M Fashion Captions Dataset数据集进行训练，并基于Ostris的AI Toolkit进行开发。它的重要性在于能够辅助设计师快速实现设计想法，加速服装行业的创新和生产流程。

FLUX.1-dev LoRA Outfit Generator

0110

文案写作 # AI # 图像生成 # 文本到图像

手绘头像定制

头像定制是一个提供个性化手绘头像服务的网站。它允许用户上传自己的照片，由专业的绘画师根据照片绘制出风格独特的头像。这种服务不仅满足了用户在社交平台上展示个性化形象的需求，也因其艺术性和独特性而受到欢迎。产品背景信息显示，该服务由经验丰富的绘画师提供，包括首席绘画师jissacos和新秀kiki等，他们擅长捕捉面部表情和个人特色。价格方面，根据绘画师的不同，提供不同价位的服务，用户可以根据自己的预算和喜好选择合适的服务。

0110

社交媒体 # 个性化 # 图像生成 # 手绘

Pew AI

Pew AI 是一个面向电子商务的AI摄影平台，提供完美的摄影助手。用户可以上传他们的产品图片，提供有关所需图像构图和设置的详细信息，即可即时获得精美的内容。

0110

AI图像与设计 # AI摄影 # 产品展示 # 图像生成

flux-condensation

fofr/flux-condensation是一个基于文本生成图像的AI模型，使用Diffusers库和LoRAs技术，能够根据用户提供的文本提示生成相应的图像。该模型在Replicate上训练，具有非商业性质的flux-1-dev许可证。它代表了文本到图像生成技术的最新进展，能够为设计师、艺术家和内容创作者提供强大的视觉表现工具。

0110

文案写作 # AI模型 # Diffusers库 # LoRAs技术

DALL·E mini

DALL·E mini是一款强大的机器学习应用，通过将文本描述转化为逼真的图像，帮助您创造出令人惊叹的视觉内容。

0110

图像AI 图像生成器 # 图像生成 # 机器学习

Stable Diffusion 3.5 Medium 2.6B

Stable Diffusion 3.5 Medium 是由 Stability AI 提供的一款基于人工智能的图像生成模型，它能够根据文本描述生成高质量的图像。这项技术的重要性在于它能够极大地推动创意产业的发展，如游戏设计、广告、艺术创作等领域。Stable Diffusion 3.5 Medium 以其高效的图像生成能力、易用性和较低的资源消耗而受到用户的青睐。目前，该模型在 Hugging Face 平台上以免费试用的形式提供给用户。

0110

文案写作 # AI # 创意工具 # 图像生成

Meta AI 图像生成工具

Meta AI 提供了一个创意激发平台，用户可以通过简单的描述生成各种风格和主题的图像，从未来主义时装秀到抽象绘画，激发无限创意。

0100

# AI # AI绘画 # Meta

NanoBananaAPI.ai

Nano Banana API 提供 AI 图像生成与编辑接口，支持自然语言编辑、角色一致性保障、多图合成等功能。其主要优点在于高效稳定的性能、逼真写实效果和多图合成创意构图。

0100

图像生成 # 写实效果 # 图像生成 # 图片编辑

SketchGPT

上传您的产品草图，看看您的产品在不同主题中的外观。100%免费。将阴影应用于草图以增加深度和维度，同时保持干净的背景。

0100

Enterpix

AI生成图像搜索引擎。

0100

高查理

点击一个按钮就可以创建图片、博客广告、网站标题。

0100

CreativeSynth是一款创新的统一框架，基于扩散模型，具有协调多模态输入和多任务处理的能力。通过将多模态特征与定制的注意力机制相结合，CreativeSynth实现了将现实语义内容导入艺术领域，通过反演和实时风格转换精确操纵图像风格和内容，同时保持原始模型参数的完整性。严格的定性和定量评估凸显了CreativeSynth在增强艺术图像的保真度方面的优势，并保留了它们固有的美学本质。通过弥合生成模型与艺术精髓之间的鸿沟，CreativeSynth成为定制数字调色板。

CreativeSynth

0100

艺术创作 # 图像生成 # 艺术 # 风格转换

EasyControl

EasyControl 是一个为 Diffusion Transformer（扩散变换器）提供高效灵活控制的框架，旨在解决当前 DiT 生态系统中存在的效率瓶颈和模型适应性不足等问题。其主要优点包括：支持多种条件组合、提高生成灵活性和推理效率。该产品是基于最新研究成果开发的，适合在图像生成、风格转换等领域使用。

0100

图像生成 # Diffusion Transformer # 图像生成 # 深度学习

稳定的扩散

众包的分布式集群稳定扩散的工人。还提供了一个客户端接口不需要安装和没有技术专长。

0100

TokenVerse 是一种创新的多概念个性化方法，它利用预训练的文本到图像扩散模型，能够从单张图像中解耦复杂的视觉元素和属性，并实现无缝的概念组合生成。这种方法突破了现有技术在概念类型或广度上的限制，支持多种概念，包括物体、配饰、材质、姿势和光照等。TokenVerse 的重要性在于其能够为图像生成领域带来更灵活、更个性化的解决方案，满足用户在不同场景下的多样化需求。目前，TokenVerse 的代码尚未公开，但其在个性化图像生成方面的潜力已经引起了广泛关注。

TokenVerse

0100

图像生成 # 个性化 # 图像生成 # 多概念

Mochi Diffusion

MochiDiffusion是一款在Mac上本地运行稳定扩散的应用程序，它使用苹果的Core ML稳定扩散实现，提供极快速和内存高效的图像生成和编辑功能。

0100

图像AI 图像生成器 # 免费 # 图像生成 # 神经网络

Toy Box Flux

Toy Box Flux是一个基于AI生成图像训练的3D渲染模型，它结合了现有的3D LoRA模型和Coloring Book Flux LoRA的权重，形成了独特的风格。该模型特别适合生成具有特定风格的玩具设计图像。它在物体和人物主体上表现最佳，动物的表现则因训练图像中的数据不足而不稳定。此外，该模型还能提高室内3D渲染的真实感。计划在v2版本中通过混合更多生成的输出和预先存在的输出来加强这种风格的一致性。

0100

设计助手 # 3D渲染 # AI生成图像 # LoRA模型

Roll Art Die

在您的Apple Silicon设备上使用StableDiffusion。仅使用文本生成AI艺术品。将您的梦想艺术品变成现实。无需云订阅。

0100

使用AI可以比以前快10倍地创建惊人的艺术和图像。

Aragon – 图像生成

0100

混元-DiT是腾讯推出的首个中英双语DiT架构的人工智能模型，专注于中文元素理解，具备长文本理解能力和细粒度语义理解。该模型能够分析和理解长篇文本中的信息，并生成相应的艺术作品，包括但不限于人物写真、创意创作等。混元-DiT的推出，对于提升中文文本理解的深度和广度，以及促进中英双语交流具有重要意义。

混元-DiT

0100

艺术创作 # 中英双语 # 人工智能 # 图像生成

flux-controlnet-canny

flux-controlnet-canny是由XLabs AI团队开发的基于FLUX.1-dev模型的ControlNet Canny模型，用于文本到图像的生成。该模型通过训练，能够根据文本提示生成高质量的图像，广泛应用于创意设计和视觉艺术领域。

0100

艺术创作 # AI艺术 # 创意工具 # 图像生成

A1

A1.art是一个平台，每个人都可以轻松构建和发现AI艺术应用。A1.art致力于成为每个人的艺术工作站，让艺术的掌握变得简单如言。

0100

艺术创作 # AI # 创作 # 图像生成

MergeML

MergeML是一款人工智能图像生成工具，使用机器学习模型名为StyleGAN2，生成高质量的图像。

0100

AI图像与设计 # MergeML # 图像生成 # 机器学习

AI Anime Girl Studio

AI AnimeGirl Creator是一个免费的AI生成二次元美少女的工具。它可以轻松生成令人惊叹的二次元美少女艺术品。

0100

艺术创作 # AI # 二次元 # 图像生成

NanoBananaX

Nano Banana是一款由Google最新Nano Banana模型驱动的人工智能图像生成与编辑平台。其重要性在于为用户提供了便捷、高效且功能强大的图像创作与编辑方式。主要优点包括闪电般的图像生成和预览速度，能实现即时迭代；高保真度，保证图像细节清晰、风格一致且符合提示要求；用户可用自然语言精确控制图像创作和编辑过程。该平台有多种价格套餐，包括按月或按年付费，提供不同的信用额度和功能，可满足从初学者到专业企业的不同需求。定位为满足各类用户对图像生成和编辑的需求，无论是个人创作者还是商业企业都适用。

090

图像生成 # AI图像编辑 # Google模型 # 图像生成

PixelCNN

PixelCNN++是一种基于PixelCNN的生成模型，具有可计算的似然函数和易于采样的特点，适用于图像生成和数据增强等应用场景。

090

图像AI 图像生成器 # 图像生成 # 生成模型

Simagizer

Simagizer是一款浏览器扩展程序，可以帮助用户对网页上的文本进行摘要，并生成可视化的摘要图像，方便分享和保存。

090

AI摘要文本AI # 免费 # 图像生成 # 摘要

ImageGen AI- Image Generator

ImageGen是一款利用人工智能技术快速生成定制图像的工具，帮助设计师、营销人员和创作者轻松获得高质量的视觉效果。

090

图像AI 图像生成器 # 人工智能 # 图像生成

SD3.5-Large-IP-Adapter

SD3.5-Large-IP-Adapter是一个基于Stable Diffusion 3.5 Large模型的IP适配器，由InstantX Team研发。该模型能够将图像处理工作类比于文本处理，具有强大的图像生成能力，并且可以通过适配器技术进一步提升图像生成的质量和效果。该技术的重要性在于其能够推动图像生成技术的发展，特别是在创意工作和艺术创作领域。产品背景信息显示，该模型是由Hugging Face和fal.ai赞助的项目，并且遵循stabilityai-ai-community的许可协议。

090

图像生成 # AI模型 # Hugging Face # IP适配器

FLUX.1-dev-IP-Adapter

FLUX.1-dev-IP-Adapter是一个基于FLUX.1-dev模型的IP-Adapter，由InstantX Team研发。该模型能够将图像工作处理得像文本一样灵活，使得图像生成和编辑更加高效和直观。它支持图像参考，但不适用于细粒度的风格转换或角色一致性。模型在10M开源数据集上训练，使用128的批量大小和80K的训练步骤。该模型在图像生成领域具有创新性，能够提供多样化的图像生成解决方案，但可能存在风格或概念覆盖不足的问题。

090

文案写作 # FLUX.1-Dev # Hugging Face # IP-Adapter

Imgcreator

创建带有文本的图像。生成基于文本的图像以帮助您思考和创造。

090

ChatDesigner是一个AI设计代理，可以通过与其聊天来生成和编辑任何图像。它提供了30多种AI图像生成和编辑工具，可以帮助你创建和编辑照片、生成相似的图像、AI肖像、产品照片、更改背景等。

ChatDesigner

090

图像AI 图像生成 # AI设计代理 # 免费增值。# 图像生成

DALL E

DALL·E是一种基于神经网络的图像生成模型，能够根据文本描述生成高质量的图像，为创意设计和广告营销等领域提供了更多的创作可能性。

090

图像AI 图像编辑 # 免费增值。# 图像生成 # 文本描述

Brain Pod AI

Brain Pod AI是一个AI驱动的工具，可以帮助用户轻松、快速地撰写高质量的文章。它在Trustpilot上获得了客户的高度评价，是一个用于内容生成、图像生成和音乐生成的平台。

090

AI写作与文本 # AI写作 # Brain Pod AI # 内容生成

SDXL Flash

SDXL Flash是由SD社区与Project Fluently合作推出的文本到图像生成模型。它在保持生成图像质量的同时，提供了比LCM、Turbo、Lightning和Hyper更快的处理速度。该模型基于Stable Diffusion XL技术，通过优化步骤和CFG（Guidance）参数，实现了图像生成的高效率和高质量。

090

艺术创作 # AI艺术 # 图像生成 # 文本到图像

Fashion-Hut-Modeling-LoRA

Fashion-Hut-Modeling-LoRA是一个基于Diffusion技术的文本到图像生成模型，主要用于生成时尚模特的高质量图像。该模型通过特定的训练参数和数据集，能够根据文本提示生成具有特定风格和细节的时尚摄影图像。它在时尚设计、广告制作等领域具有重要应用价值，能够帮助设计师和广告商快速生成创意概念图。模型目前仍在训练阶段，可能存在一些生成效果不佳的情况，但已经展示了强大的潜力。该模型的训练数据集包含14张高分辨率图像，使用了AdamW优化器和constant学习率调度器等参数，训练过程注重图像的细节和质量。

090

文案写作 # diffusion # 图像生成 # 文本到图像

NanoBanana.ART

Nano Banana AI 是一款先进的 AI 图像编辑器，能够快速将您的照片转换为专业级效果。该产品支持多种图片格式，用户可以通过简单的步骤进行编辑，适合个人和商业用途。价格方面，提供免费和付费的订阅选项，以满足不同用户的需求。

080

图像生成 # AI # 专业 # 图像生成

ForefrontChat

GPT-4、图像生成、自定义角色、可分享的聊天

080

AIGC互动平台 AI聊天机器人 # GPT-4 # 可分享的聊天 # 图像生成

In-Context LoRA for Diffusion Transformers

In-Context LoRA是一种用于扩散变换器（DiTs）的微调技术，它通过结合图像而非仅仅文本，实现了在保持任务无关性的同时，对特定任务进行微调。这种技术的主要优点是能够在小数据集上进行有效的微调，而不需要对原始DiT模型进行任何修改，只需改变训练数据即可。In-Context LoRA通过联合描述多张图像并应用任务特定的LoRA微调，生成高保真度的图像集合，更好地符合提示要求。该技术对于图像生成领域具有重要意义，因为它提供了一种强大的工具，可以在不牺牲任务无关性的前提下，为特定任务生成高质量的图像。

080

图像生成 # LORA # 任务无关性 # 图像生成

ComfyUI-IF_MemoAvatar

ComfyUI-IF_MemoAvatar是一个基于记忆引导扩散的模型，用于生成表达性的视频。该技术允许用户从单一图像和音频输入创建富有表现力的说话头像视频。这项技术的重要性在于其能够将静态图像转化为动态视频，同时保留图像中人物的面部特征和情感表达，为视频内容创作提供了新的可能性。该模型由Longtao Zheng等人开发，并在arXiv上发布相关论文。

080

图像生成 # AI # 图像生成 # 情感表达

vivago.ai

vivago.ai 是一个免费的 AI 生成工具和社区，提供文本转图像、图像转视频等功能，让创作变得更加简单高效。用户可以免费生成高质量的图像和视频，支持多种 AI 编辑工具，方便用户进行创作和分享。该平台的定位是为广大创作者提供易用的 AI 工具，满足他们在视觉创作上的需求。

080

图像生成 # 4K 增强 # ai 工具 # 创作工具

Pandora Avatars

Pandora Avatars指的是Pandora官网上的一项个性化服务，用户可以使用自己的图片或选择Pandora提供的形象来创建自己的虚拟形象，并在Pandora社交媒体平台上使用。

080

AI助手 AI图像 # AI绘画 # 图像生成 # 虚拟形象

MV-Adapter

MV-Adapter是一种基于适配器的多视图图像生成解决方案，它能够在不改变原有网络结构或特征空间的前提下，增强预训练的文本到图像（T2I）模型及其衍生模型。通过更新更少的参数，MV-Adapter实现了高效的训练并保留了预训练模型中嵌入的先验知识，降低了过拟合风险。该技术通过创新的设计，如复制的自注意力层和并行注意力架构，使得适配器能够继承预训练模型的强大先验，以建模新的3D知识。此外，MV-Adapter还提供了统一的条件编码器，无缝整合相机参数和几何信息，支持基于文本和图像的3D生成以及纹理映射等应用。MV-Adapter在Stable Diffusion XL（SDXL）上实现了768分辨率的多视图生成，并展示了其适应性和多功能性，能够扩展到任意视图生成，开启更广泛的应用可能性。

080

文案写作 # 3D几何 # 图像到图像 # 图像生成

Flux_小红书真实风格

Flux_小红书真实风格模型是一款专注于生成极度真实自然日常照片的AI模型。它利用最新的人工智能技术，通过深度学习算法，能够生成具有小红书真实感风格的照片。该模型特别适合需要在社交媒体上发布高质量、真实感照片的用户，以及进行艺术创作和设计工作的专业人士。模型提供了多种参数设置，以适应不同的使用场景和需求。

080

社交媒体 # AI # 图像生成 # 小红书风格

Aperture (by Lexica)

Lexica Aperture是一款能够快速生成逼真图像的人工智能应用程序，适用于设计、游戏开发和虚拟现实等领域。

070

图像AI 图像编辑 # 人工智能 # 图像生成

Accomplice

Accomplice是一款AI驱动的平台，帮助企业生成100％免版税的徽标、照片和图形，同时节省时间、削减成本并简化工作流程。

070

AI图像与设计 # 免版税 # 图像生成 # 爱设计

Diffusion Self-Distillatio

Diffusion Self-Distillation是一种基于扩散模型的自蒸馏技术，用于零样本定制图像生成。该技术允许艺术家和用户在没有大量配对数据的情况下，通过预训练的文本到图像的模型生成自己的数据集，进而微调模型以实现文本和图像条件的图像到图像任务。这种方法在保持身份生成任务的性能上超越了现有的零样本方法，并能与每个实例的调优技术相媲美，无需测试时优化。

070

图像生成 # 图像生成 # 扩散模型 # 自蒸馏

UltrAvatar

UltrAvatar是一款逼真可动的3D头像生成模型，旨在缩小虚拟与现实世界体验之间的差距。它采用Score Distillation Sampling (SDS) loss和可微分渲染器以及文本条件来引导扩散模型生成3D头像。与现有作品相比，UltrAvatar通过增强几何保真度和优越的物理渲染纹理质量，提出了一种新颖的3D头像生成方法。它通过扩散色彩提取模型和真实性引导纹理扩散模型，去除不需要的光照效果，呈现真实的扩散颜色，使生成的头像能够在各种光照条件下呈现。我们在实验证明了该方法的有效性和鲁棒性，在实验中大幅优于现有最先进的方法。

070

头像生成 # 3D头像 # 图像生成 # 虚拟现实

RocketAI

设计的未来是可编程的。Rocket AI是一个SaaS平台，使用AI创建和编辑产品图像，并使用AI提高电子商务销售和广告表现。我们为电子商务企业提供AI解决方案，以改善其产品图像，并从简单的文本提示中生成新的想法和设计概念。

070

Image Recursor是一个基于 DALL-E 3 和 GPT-4 Vision 的图像生成工具。它通过输入一个起始图像和一些参数，可以生成一系列经过修改的图像。用户可以自定义生成的图像风格，例如恐怖、随机、神秘、强烈、有趣等。图像递归生成器可以用于创造艺术作品、设计概念图、玩具设计等多种场景。

Image Recursor

070

艺术创作 # DALL-E # GPT-4 # 图像生成

Web Stable Diffusion

WebSD是一个将稳定扩散模型带到Web浏览器的项目，可以在浏览器内部自动创建逼真的图像和各种风格的图像。

060

其它AI工具科研助手 # 图像生成 # 稳定扩散模型

Instantgen AI

Instantgen AI是一个基于人工智能的工具，可快速创建令人惊叹的内容，提高10倍的效率。使用Instantgen AI即可即时生成高质量的图像和文本，无需花费数小时进行设计和文案编写。

060

AI图像与设计 # Instantgen AI # 人工智能 # 图像生成

KLING AI

KLING AI, tools for creating imaginative images and videos, based on state-of-art generative AI methods.

060

交通旅游 # AIGC # Generative AI # itotii导航

Tinder Glowup

Tinder Glowup是一个AI医疗健康管理网站，可以生成显示腹肌外观的图像。

050

AI医疗与健康 # Tinder Glowup # 图像生成 # 腹肌训练

Brat Generator.design

Brat Generator是一个以Charli XCX的专辑封面风格为灵感的在线图像生成工具。它允许用户通过输入文本和选择背景颜色，快速生成具有个性化的专辑封面风格图像。该工具的主要优点是操作简单、快速生成图像，并且可以自定义字体风格和颜色。它适合那些希望在社交媒体上分享个性化图像的用户，尤其是音乐爱好者和创意内容创作者。目前该工具是免费的，旨在为用户提供一种轻松创建独特图像的方式。

050

社交媒体 # 个性化 # 创意 # 图像生成

BharatDiffusion

BharatDiffusion是一个基于AI的图像生成模型，专门针对印度的多样化景观、文化和遗产进行微调，能够生成反映印度丰富文化和特色的高质量图像。该模型使用Stable Diffusion技术处理所有图像生成，确保内容与印度的多样性和活力相呼应。

050

图像生成 # AI # Stable Diffusion # 创意工具

稳定扩散

稳定扩散是一个深度学习，文本到图像的模型，于2022年发布。主要用于生成基于文本描述的详细图像，但也可以应用于其他任务，如修复、超出原始边界以及生成由文本提示引导的图像到图像翻译。

040