文本到图像

排序

FLUX.1-dev

FLUX.1-dev是一个拥有12亿参数的修正流变换器，能够根据文本描述生成图像。它代表了文本到图像生成技术的最新发展，具有先进的输出质量，仅次于其专业版模型FLUX.1 [pro]。该模型通过指导蒸馏训练，提高了效率，并且开放权重以推动新的科学研究，并赋予艺术家开发创新工作流程的能力。生成的输出可以用于个人、科学和商业目的，具体如flux-1-dev-non-commercial-license所述。

0250

FLUX.1 Tools

FLUX.1 Tools是Black Forest Labs推出的一套模型工具，旨在为基于文本的图像生成模型FLUX.1增加控制和可操作性，使得对真实和生成的图像进行修改和再创造成为可能。该工具套件包含四个不同的特性，以开放访问模型的形式在FLUX.1 [dev]模型系列中提供，并作为BFL API的补充，支持FLUX.1 [pro]。FLUX.1 Tools的主要优点包括先进的图像修复和扩展能力、结构化引导、图像变化和重构等，这些功能对于图像编辑和创作领域具有重要意义。

0230

文案写作 # 人工智能 # 图像生成 # 图像编辑

Sana_1600M_1024px_MultiLing

Sana是一个由NVIDIA开发的文本到图像的框架，能够高效生成高达4096×4096分辨率的图像。该模型以惊人的速度合成高分辨率、高质量的图像，并保持强大的文本-图像对齐能力，可部署在笔记本电脑GPU上。Sana模型基于线性扩散变换器，使用预训练的文本编码器和空间压缩的潜在特征编码器，支持Emoji、中文和英文以及混合提示。

0210

文案写作 # Nvidia # 图像合成 # 多语言

FLUX.1-dev-LoRA-One-Click-Creative-Template

FLUX.1-dev-LoRA-One-Click-Creative-Template 是一个基于 LoRA 训练的图像生成模型，由 Shakker-Labs 提供。该模型专注于创意照片生成，能够将用户的文本提示转化为具有创意性的图像。模型使用了先进的文本到图像的生成技术，特别适合需要快速生成高质量图像的用户。它是基于 Hugging Face 平台，可以方便地进行部署和使用。模型的非商业使用是免费的，但商业使用需要遵守相应的许可协议。

0190

设计助手 # LORA # 创意设计 # 图像生成

Sana_1600M_1024px

Sana是一个由NVIDIA开发的文本到图像生成框架，能够高效生成高达4096×4096分辨率的高清晰度、高文本-图像一致性的图像，并且速度极快，可以在笔记本电脑GPU上部署。Sana模型基于线性扩散变换器，使用预训练的文本编码器和空间压缩的潜在特征编码器。该技术的重要性在于其能够快速生成高质量的图像，对于艺术创作、设计和其他创意领域具有革命性的影响。Sana模型遵循CC BY-NC-SA 4.0许可协议，源代码可在GitHub上找到。

0190

文案写作 # Nvidia # 开源 # 快速生成

CogView4-6B

CogView4-6B 是由清华大学知识工程组开发的文本到图像生成模型。它基于深度学习技术，能够根据用户输入的文本描述生成高质量的图像。该模型在多个基准测试中表现优异，尤其是在中文文本生成图像方面具有显著优势。其主要优点包括高分辨率图像生成、支持多种语言输入以及高效的推理速度。该模型适用于创意设计、图像生成等领域，能够帮助用户快速将文字描述转化为视觉内容。

0190

文案写作 # 创意设计 # 图像生成 # 多语言支持

Stable Diffusion 3.5

介绍 Stable Diffusion 3.5 将文本提示转...

0190

设计与艺术 # AI 图像生成 # 内容创作 # 创意工具

shou_xin

shou_xin是一个基于文本到图像的生成模型，它能够根据用户提供的文本提示生成具有手訫风格的铅笔素描图像。这个模型使用了diffusers库和lora技术，以实现高质量的图像生成。shou_xin模型以其独特的艺术风格和高效的图像生成能力在图像生成领域占有一席之地，特别适合需要快速生成具有特定艺术风格的图像的用户。

0150

文案写作 # Diffusers # LORA # 图像生成

FLUX.1-dev-LoRA-Text-Poster

FLUX.1-dev-LoRA-Text-Poster是由Shakker-Labs开发的文本到图像生成模型，专门用于艺术文本海报的生成。该模型利用LoRA技术，通过文本提示来生成图像，为用户提供了一种创新的方式来创作艺术作品。模型的训练由版权用户cooooool完成，并在Hugging Face平台上共享，以促进社区的交流和发展。模型遵循非商业用途的flux-1-dev许可协议。

0150

艺术创作 # FLUX.1-Dev # LORA # 文本到图像

zeroscope_v2_XL

管道标签不在官方列表中

0150

AIGC影视平台 AI视频模型 # 句子相似性 # 可视化问题解答 # 图像分割

智谱AI绘画

智谱AI绘画可根据用户的描述创作出新的艺术作品，还能够模仿不同的艺术风格，提供个性化的图像编辑和创作服务

0150

AIGC绘画工具 AI绘画工具 # ai绘画工具 # 个性化定制 # 创新工具

Sana_1600M_512px_MultiLing

Sana是一个由NVIDIA开发的文本到图像的框架，能够高效生成高达4096×4096分辨率的图像。Sana能够以极快的速度合成高分辨率、高质量的图像，并且具有强烈的文本-图像对齐能力，可以在笔记本电脑GPU上部署。该模型基于线性扩散变换器，使用固定预训练的文本编码器和空间压缩的潜在特征编码器，支持英文、中文和表情符号混合提示。Sana的主要优点包括高效率、高分辨率图像生成能力以及多语言支持。

0140

文案写作 # Nvidia # 多语言 # 文本到图像

HUAHUA话画

深刻理解中国文化和东方审美的AI作图平台，通过其自研的AI生图引擎，为用户提供了一个强大的视觉应用工具

0140

AIGC绘画工具 AI绘画工具 # AI作图平台 # ai绘画工具 # HUAHUA话画

Stable Diffusion 3.5 Medium

Stable Diffusion 3.5 Medium是一个基于文本到图像的生成模型，由Stability AI开发，具有改进的图像质量、排版、复杂提示理解和资源效率。该模型使用了三个固定的预训练文本编码器，通过QK-规范化提高训练稳定性，并在前12个变换层中引入双注意力块。它在多分辨率图像生成、一致性和各种文本到图像任务的适应性方面表现出色。

0140

文案写作 # AI艺术 # 图像生成 # 多模态

Continual Diffusion

Continual Diffusion是一种先进的文本到图像定制化模型，可以根据用户提供的示例图像和文本，生成高质量、符合要求的图像。它具有连续学习和自我调节的特点，适用于各种应用场景。

0140

其它AI工具科研助手 # 免费 # 文本到图像 # 连续自定义

LimeWire

LimeWire提供免费AI图像生成服务，支持多种AI模型，助力用户快速将创意转化为图像。

0130

AI智能绘画 AI赋能 # AI图像生成 # AI智能绘画 # AI赋能

SLD (Self-correcting LLM-controlled Diffusion Models)

SLD是一个自纠正的LLM控制的扩散模型框架，它通过集成检测器增强生成模型，以实现精确的文本到图像对齐。SLD框架支持图像生成和精细编辑，并且与任何图像生成器兼容，如DALL-E 3，无需额外训练或数据。

0130

艺术创作 # AI艺术 # 图像生成 # 扩散模型

Sana_600M_512px

Sana是一个由NVIDIA开发的文本到图像的生成框架，能够高效生成高达4096×4096分辨率的图像。Sana以其快速的速度和强大的文本图像对齐能力，可以在笔记本电脑GPU上部署，代表了图像生成技术的一个重要进步。该模型基于线性扩散变换器，使用预训练的文本编码器和空间压缩的潜在特征编码器，能够根据文本提示生成和修改图像。Sana的开源代码可在GitHub上找到，其研究和应用前景广阔，尤其在艺术创作、教育工具和模型研究等方面。

0130

文案写作 # Nvidia # 图像生成 # 文本到图像

Blip 3o

Blip 3o 是一个基于 Hugging Face 平台的应用程序，利用先进的生成模型从文本生成图像，或对现有图像进行分析和回答。该产品为用户提供了强大的图像生成和理解能力，非常适合设计师、艺术家和开发者。此技术的主要优点是其高效的图像生成速度和优质的生成效果，同时还支持多种输入形式，增强了用户体验。该产品是免费的，定位于开放给广大用户使用。

0120

文案写作 # 人工智能 # 图像生成 # 文本到图像

Generate Prompt Ideas

SocialBu是一款强大的社交媒体管理工具，集成了自动化发布、智能回复和AI生成器等多种功能，帮助用户轻松管理和推广社交媒体账号。

0120

AI提示指令文本AI # AI生成器 # 免费 # 文本到图像

Sana_1600M_512px

Sana是一个由NVIDIA开发的文本到图像的生成框架，能够高效生成高达4096×4096分辨率的图像。Sana以其快速的速度、强大的文本图像对齐能力以及可在笔记本电脑GPU上部署的特性而著称。该模型基于线性扩散变换器，使用预训练的文本编码器和空间压缩的潜在特征编码器，代表了文本到图像生成技术的最新进展。Sana的主要优点包括高分辨率图像生成、快速合成、笔记本电脑GPU上的可部署性，以及开源的代码，使其在研究和实际应用中具有重要价值。

0110

文案写作 # Nvidia # 开源 # 快速合成

AWPortraitCN

AWPortraitCN是一个基于FLUX.1-dev开发的文本到图像生成模型，专门针对中国人的外貌和审美进行训练。它包含多种类型的肖像，如室内外肖像、时尚和摄影棚照片，具有强大的泛化能力。与原始版本相比，AWPortraitCN在皮肤质感上更加细腻和真实。为了追求更真实的原始图像效果，可以与AWPortraitSR工作流程一起使用。

0110

文案写作 # AWPortraitSR # FLUX.1-Dev # 在线推理

MusePro

Muse Pro通过GPT-4 Vision技术提供无与伦比的速度和质量，支持实时AI引导，让艺术家可以使用熟悉的工具和创新的AI释放创造力。它具备文本到图像的功能、随机化创作、细节增强、视觉描述、直观的AI控制滑块、暂停功能以及图层和画笔库等多样化工具。

0110

艺术创作 # AI引导 # 文本到图像 # 绘画工具

Regional-Prompting-FLUX

Regional-Prompting-FLUX是一种训练无关的区域提示扩散变换器模型，它能够在无需训练的情况下，为扩散变换器（如FLUX）提供细粒度的组合文本到图像生成能力。该模型不仅效果显著，而且与LoRA和ControlNet高度兼容，能够在保持高速度的同时减少GPU内存的使用。

0100

文案写作 # AI # Controlnet # LORA

Stable Diffusion 3.5 Medium 2.6B

Stable Diffusion 3.5 Medium 是由 Stability AI 提供的一款基于人工智能的图像生成模型，它能够根据文本描述生成高质量的图像。这项技术的重要性在于它能够极大地推动创意产业的发展，如游戏设计、广告、艺术创作等领域。Stable Diffusion 3.5 Medium 以其高效的图像生成能力、易用性和较低的资源消耗而受到用户的青睐。目前，该模型在 Hugging Face 平台上以免费试用的形式提供给用户。

0100

文案写作 # AI # 创意工具 # 图像生成

SeeDream 4

Seedream4是一款拥有革命性多模态AI技术的图像生成器，结合文本到图像生成、精确图像编辑和批量创作于一体。其主要优点包括1.8秒快速生成速度、自然语言控制、完整的创意控制和企业集成可用性。价格信息请访问官方网站。

090

文案写作 # AI # 企业集成 # 图像生成器

Bylo.ai

Bylo.ai是一款高级的AI图像生成器，能够将文本描述快速转换为高质量的图像。它支持负面提示和多种模型，包括流行的Flux AI图像生成器，让用户可以自定义创作。Bylo.ai以其免费在线访问、快速高效生成、高级自定义选项、灵活的图像设置和高质量图像输出等特点，成为个人和商业用途的理想选择。

090

文案写作 # AI图像生成 # 文本到图像 # 自定义创作

text-to-pose

text-to-pose是一个研究项目，旨在通过文本描述生成人物姿态，并利用这些姿态生成图像。该技术结合了自然语言处理和计算机视觉，通过改进扩散模型的控制和质量，实现了从文本到图像的生成。项目背景基于NeurIPS 2024 Workshop上发表的论文，具有创新性和前沿性。该技术的主要优点包括提高图像生成的准确性和可控性，以及在艺术创作和虚拟现实等领域的应用潜力。

090

文案写作 # 姿态估计 # 扩散模型 # 文本到图像

FLUX.1-dev-IP-Adapter

FLUX.1-dev-IP-Adapter是一个基于FLUX.1-dev模型的IP-Adapter，由InstantX Team研发。该模型能够将图像工作处理得像文本一样灵活，使得图像生成和编辑更加高效和直观。它支持图像参考，但不适用于细粒度的风格转换或角色一致性。模型在10M开源数据集上训练，使用128的批量大小和80K的训练步骤。该模型在图像生成领域具有创新性，能够提供多样化的图像生成解决方案，但可能存在风格或概念覆盖不足的问题。

090

文案写作 # FLUX.1-Dev # Hugging Face # IP-Adapter

Edify Image

Edify Image是NVIDIA推出的一款图像生成模型，它能够生成具有像素级精确度的逼真图像内容。该模型采用级联像素空间扩散模型，并通过新颖的拉普拉斯扩散过程进行训练，该过程能够在不同频率带以不同的速率衰减图像信号。Edify Image支持多种应用，包括文本到图像合成、4K上采样、ControlNets、360° HDR全景图生成和图像定制微调。它代表了图像生成技术的最新进展，具有广泛的应用前景和重要的商业价值。

090

文案写作 # 4K上采样 # AI图像生成 # 像素空间扩散模型

FLUX.1-dev LoRA Outfit Generator

FLUX.1-dev LoRA Outfit Generator是一个文本到图像的AI模型，能够根据用户详细描述的颜色、图案、合身度、风格、材质和类型来生成服装。该模型使用了H&M Fashion Captions Dataset数据集进行训练，并基于Ostris的AI Toolkit进行开发。它的重要性在于能够辅助设计师快速实现设计想法，加速服装行业的创新和生产流程。

090

文案写作 # AI # 图像生成 # 文本到图像

NeuralSVG

NeuralSVG是一种用于从文本提示生成矢量图形的隐式神经表示方法。它受到神经辐射场（NeRFs）的启发，将整个场景编码到一个小的多层感知器（MLP）网络的权重中，并使用分数蒸馏采样（SDS）进行优化。该方法通过引入基于dropout的正则化技术，鼓励生成的SVG具有分层结构，使每个形状在整体场景中具有独立的意义。此外，其神经表示还提供了推理时控制的优势，允许用户根据提供的输入动态调整生成的SVG，如颜色、宽高比等，且只需一个学习到的表示。通过广泛的定性和定量评估，NeuralSVG在生成结构化和灵活的SVG方面优于现有方法。该模型由特拉维夫大学和MIT CSAIL的研究人员共同开发，目前代码尚未公开。

090

文案写作 # 人工智能 # 文本到图像 # 矢量图形生成

flux-condensation

fofr/flux-condensation是一个基于文本生成图像的AI模型，使用Diffusers库和LoRAs技术，能够根据用户提供的文本提示生成相应的图像。该模型在Replicate上训练，具有非商业性质的flux-1-dev许可证。它代表了文本到图像生成技术的最新进展，能够为设计师、艺术家和内容创作者提供强大的视觉表现工具。

090

文案写作 # AI模型 # Diffusers库 # LoRAs技术

Flux-Midjourney-Mix2-LoRA

Flux-Midjourney-Mix2-LoRA 是一款基于深度学习的文本到图像生成模型，旨在通过自然语言描述生成高质量的图像。该模型基于Diffusion架构，结合了LoRA技术，能够实现高效的微调和风格化图像生成。其主要优点包括高分辨率输出、多样化的风格支持以及对复杂场景的出色表现能力。该模型适用于需要高质量图像生成的用户，如设计师、艺术家和内容创作者，能够帮助他们快速实现创意构思。

080

文案写作 # Diffusion模型 # LORA # 创意生成

Stable Diffusion 3.5 ControlNets

Stable Diffusion 3.5 ControlNets是由Stability AI提供的文本到图像的AI模型，支持多种控制网络（ControlNets），如Canny边缘检测、深度图和高保真上采样等。该模型能够根据文本提示生成高质量的图像，特别适用于插画、建筑渲染和3D资产纹理等场景。它的重要性在于能够提供更精细的图像控制能力，提升生成图像的质量和细节。产品背景信息包括其在学术界的引用（arxiv:2302.05543），以及遵循的Stability Community License。价格方面，对于非商业用途、年收入不超过100万美元的商业用途免费，超过则需联系企业许可。

080

文案写作 # AI图像生成 # Canny边缘检测 # 控制网络

flux-controlnet-canny

flux-controlnet-canny是由XLabs AI团队开发的基于FLUX.1-dev模型的ControlNet Canny模型，用于文本到图像的生成。该模型通过训练，能够根据文本提示生成高质量的图像，广泛应用于创意设计和视觉艺术领域。

080

艺术创作 # AI艺术 # 创意工具 # 图像生成

SDXL Flash

SDXL Flash是由SD社区与Project Fluently合作推出的文本到图像生成模型。它在保持生成图像质量的同时，提供了比LCM、Turbo、Lightning和Hyper更快的处理速度。该模型基于Stable Diffusion XL技术，通过优化步骤和CFG（Guidance）参数，实现了图像生成的高效率和高质量。

080

艺术创作 # AI艺术 # 图像生成 # 文本到图像

MV-Adapter

MV-Adapter是一种基于适配器的多视图图像生成解决方案，它能够在不改变原有网络结构或特征空间的前提下，增强预训练的文本到图像（T2I）模型及其衍生模型。通过更新更少的参数，MV-Adapter实现了高效的训练并保留了预训练模型中嵌入的先验知识，降低了过拟合风险。该技术通过创新的设计，如复制的自注意力层和并行注意力架构，使得适配器能够继承预训练模型的强大先验，以建模新的3D知识。此外，MV-Adapter还提供了统一的条件编码器，无缝整合相机参数和几何信息，支持基于文本和图像的3D生成以及纹理映射等应用。MV-Adapter在Stable Diffusion XL（SDXL）上实现了768分辨率的多视图生成，并展示了其适应性和多功能性，能够扩展到任意视图生成，开启更广泛的应用可能性。

080

文案写作 # 3D几何 # 图像到图像 # 图像生成

Fashion-Hut-Modeling-LoRA

Fashion-Hut-Modeling-LoRA是一个基于Diffusion技术的文本到图像生成模型，主要用于生成时尚模特的高质量图像。该模型通过特定的训练参数和数据集，能够根据文本提示生成具有特定风格和细节的时尚摄影图像。它在时尚设计、广告制作等领域具有重要应用价值，能够帮助设计师和广告商快速生成创意概念图。模型目前仍在训练阶段，可能存在一些生成效果不佳的情况，但已经展示了强大的潜力。该模型的训练数据集包含14张高分辨率图像，使用了AdamW优化器和constant学习率调度器等参数，训练过程注重图像的细节和质量。

080

文案写作 # diffusion # 图像生成 # 文本到图像

Flux 1.1 Pro AI

Flux 1.1 Pro AI是一个基于人工智能的高级图像生成平台，它利用尖端的AI技术将用户的文本提示转化为高质量的视觉效果。该平台在图像生成速度上提高了6倍，图像质量显著改善，并增强了对提示的遵从性。Flux 1.1 Pro AI不仅适用于艺术家和设计师，还适用于内容创作者、营销人员等专业人士，帮助他们在各自的领域中实现视觉想法，提升创作效率和质量。

070

生产力 # AI图像生成 # 创作效率 # 图像质量提升

Easy Diffusion

Easy Diffusion是一种简单易用的AI图像生成软件，通过安装Stable Diffusion并提供自己的用户界面，用户可以轻松创建美丽的艺术作品，无需任何依赖或技术知识。

040

图像AI 图像生成器 # AI生成图像 # 文本到图像

没有了

FLUX.1-dev

FLUX.1 Tools

Sana_1600M_1024px_MultiLing

FLUX.1-dev-LoRA-One-Click-Creative-Template

Sana_1600M_1024px

CogView4-6B

Stable Diffusion 3.5

shou_xin

FLUX.1-dev-LoRA-Text-Poster

zeroscope_v2_XL

智谱AI绘画

Sana_1600M_512px_MultiLing

HUAHUA话画

Stable Diffusion 3.5 Medium

Continual Diffusion

LimeWire

SLD (Self-correcting LLM-controlled Diffusion Models)

Sana_600M_512px

Blip 3o

Generate Prompt Ideas

Sana_1600M_512px

AWPortraitCN

MusePro

Regional-Prompting-FLUX

Stable Diffusion 3.5 Medium 2.6B

SeeDream 4

Bylo.ai

text-to-pose

FLUX.1-dev-IP-Adapter

Edify Image

FLUX.1-dev LoRA Outfit Generator

NeuralSVG

flux-condensation

Flux-Midjourney-Mix2-LoRA

Stable Diffusion 3.5 ControlNets

flux-controlnet-canny

SDXL Flash

MV-Adapter

Fashion-Hut-Modeling-LoRA

Flux 1.1 Pro AI

Easy Diffusion

热门网址