热门

Canva文本转图像

12个月前发布 18 00

这是一种全新的技术，它能够根据您所描述的内容生成任何您需要的图像。

收录时间：

2025-05-30

打开网站手机查看

图像生成 # 图像生成

Canva文本转图像

Canva文本转图像

这是一种全新的技术，它能够根据您所描述的内容生成任何您需要的图像。

数据统计

相关导航

Diffusion Land

Diffusion Land允许您使用各种AI模型生成图像。他们还提供了几个预先构建的概念，可用于生成某些类型的图像。

稳定扩散

稳定扩散是一个深度学习，文本到图像的模型，于2022年发布。主要用于生成基于文本描述的详细图像，但也可以应用于其他任务，如修复、超出原始边界以及生成由文本提示引导的图像到图像翻译。

WHAM

WHAM（World and Human Action Model）是由微软研究院开发的一种生成式模型，专门用于生成游戏场景和玩家行为。该模型基于Ninja Theory的《Bleeding Edge》游戏数据训练，能够生成连贯、多样化的游戏视觉和控制器动作。WHAM 的主要优点在于其能够捕捉游戏环境的3D结构和玩家行为的时间序列，为游戏设计和创意探索提供了强大的工具。该模型主要面向学术研究和游戏开发领域，帮助开发者快速迭代游戏设计。

Leffa

Leffa是一个用于可控人物图像生成的统一框架，它能够精确控制人物的外观（例如虚拟试穿）和姿态（例如姿态转移）。该模型通过在训练期间引导目标查询关注参考图像中的相应区域，减少细节扭曲，同时保持高图像质量。Leffa的主要优点包括模型无关性，可以用于提升其他扩散模型的性能。

RocketAI

设计的未来是可编程的。Rocket AI是一个SaaS平台，使用AI创建和编辑产品图像，并使用AI提高电子商务销售和广告表现。我们为电子商务企业提供AI解决方案，以改善其产品图像，并从简单的文本提示中生成新的想法和设计概念。

Procyon AI Image Generation Benchmark

Procyon AI Image Generation Benchmark 是一款由 UL Solutions 开发的基准测试工具，旨在为专业用户提供一个一致、准确且易于理解的工作负载，用以测量设备上 AI 加速器的推理性能。该基准测试与多个关键行业成员合作开发，确保在所有支持的硬件上产生公平且可比较的结果。它包括三个测试，可测量从低功耗 NPU 到高端独立显卡的性能。用户可以通过 Procyon 应用程序或命令行进行配置和运行，支持 NVIDIA® TensorRT™、Intel® OpenVINO™ 和 ONNX with DirectML 等多种推理引擎。产品主要面向工程团队，适用于评估推理引擎实现和专用硬件的通用 AI 性能。价格方面，提供免费试用，正式版为年度场地许可，需付费获取报价。

Openjourney

Openjourney 是一个高保真的开源项目，旨在模拟 MidJourney 的界面，利用 Google 的 Gemini SDK 进行 AI 图像和视频生成。该项目支持使用 Imagen 4 生成高质量图像，以及使用 Veo 2 和 Veo 3 进行文本到视频和图像到视频的转换。它适合需要进行图像生成和视频制作的开发者和创作者，提供了用户友好的界面和实时生成体验，能够助力创意工作与项目开发。

SDXL_EcomID_ComfyUI

SDXL_EcomID_ComfyUI是一个为ComfyUI提供原生SDXL-EcomID支持的插件。它通过增强肖像表示，提供更真实、审美上更令人愉悦的外观，同时确保语义一致性和更大的内部ID相似性。这个插件完全集成于ComfyUI，并且不使用diffusers，而是本地实现EcomID。它的重要性在于能够提升图像生成的质量和一致性，特别是在处理人物肖像时，能够保持不同年龄、发型、眼镜等物理变化下的内部特征一致性。

暂无评论

您必须登录才能参与评论！

none

暂无评论...