跳转到主要内容
所有收藏
Image Guidance 图像导引
Image Guidance 图像导引
Nick Lee avatar
作者:Nick Lee
超过一年前更新

概述

ControlNet仍然是Leonardo.Ai平台最受欢迎的功能之一,许多用户发现它对于调整图像构图和实现特定角色姿势非常有用。考虑到这一点,我们很高兴宣布对该功能进行了重大升级:

图像导引:

图像导引提供了许多好处,例如新功能、多图像上传、独立加权以及同时利用多达 4 个参考图像的能力。


关于图像导引

  • 支援的选项:Depth, Sketch, Canny, Pose, Normals, Pattern, QR, Lineart, HED 和 Text Image输入。

  • 4x图像上传(高级):现在您可以上传多达 4 个参考图像,并分别应用不同的ControlNet选项,以及单独调整它们的权重。

  • 新的UI变更:为了更容易管理不同的图像导引选项,我们在AI图像生成页面中添加了一个方便的新区块。Image2Image和Image Prompt也可以通过此处管理。


优势

使用图像导引,您现在可以透过比以往更加精细的控制来微调您的体验。所有用户都将能够存取一系列图像导引功能,而高级用户将能够存取3个额外专属选项以及同时上传4个参考图像。

您可以从丰富多样的功能中进行选择,例如深度、草图、姿势甚至QR code,对深度感知、线稿表现、姿势复制、图样识别等方面实现前所未有的控制。加上直觉的使用者新介面,打造您理想的构图和风格变得更容易。


功能细分:

Depth to image: 利用深度资讯来增强影像的三维效果。它提高了深度感知,可用于各种 3D 相关任务,例如深度感知图像处理和渲染。

Edge to Image: 可以有效地复制图像的构图,但改变风格和主题。它识别图像中物体的边缘,将其转换为线稿表示。这种表现随后塑造了最终图像,模型将填充识别的边缘 - 类似于着色本。值得注意的是,较高的强度值在最终结果中保留更多线条,使该功能非常适合渲染或重新设计现有线稿。如果您希望使用参考图像的合成,请使用此选项。

Line Art: 渲染图像中物件轮廓的另一种选择,此方法旨在以创建图像的简易线稿,以该线稿作为生成结果的导引。将线稿与参考结合使用以获得最佳效果。

Edge to Image (alt): 边缘检测 (HED) 是 Canny 和 Lineart 的替代演算法,非常适合处理复杂的细节和轮廓。与 Canny 相比,它创建的轮廓更加平滑且无杂讯,并且能够更好地保留参考图像的相关细节。

Sketch to Image: 专注于构图,采用素描或涂鸦作为最终图像的指引。它特别适合需要特定安排或构图的项目(例如建筑视觉化),可作为基础蓝图,根据您艺术的视角塑造结果。

Pose to Image: 专注于人物姿势的重现,扫描参考图像,寻找人物(或类似)形象,并尝试在生成的图像中复制他们的姿势。虽然它对于特定角色姿势来说是一个非常实用的工具,但同时也必须注意它对复杂的姿势有潜在限制。

Normal Map: 法线贴图对于 3D 图形领域中的人员来说是再熟悉不过的。本质上,它向程式通报物件的表面拓扑(排列),提供对其外观的精确控制并促进图像重新布局画面光影。法线贴图类似于深度图,但受益于更高层次的细节,这使得它们对于强调影像的中心主题特别有用。

Pattern to Image: 擅长利用对比度和明度来解释和渲染影像。它可以在高对比度图样(特别是黑白图像)上发挥最佳作用,识别图样的风格和形状,然后更改生成的图样以模仿上传的设计,无论主题如何。此功能尤其擅长将各种图样转化为具有引人注目效果的视觉作品。

QR code to Image: 此功能专为生成和增强QR code而设的。它可以优化 QR code设计,提高其可读性,并使其适应特定的视觉风格或品牌,在视觉上更加美观而不仅仅是实用。

Text Image Input (Text to Image): 透过上传白色背景的黑色文字图像,此选项可让您产生风格化的艺术文字。

请注意,并非所有新的图像导引工具都适用于所有基本模型。无法使用的工具将变为灰色,并提供悬浮说明以利进行必要的更改来启用它们。为了快速参考,以下是一个实用的表格,以便您可以查看哪个ControlNet适用于哪个Stable Diffusion版本,以及哪些是高级选项。

如何使用图像导引

请继续阅读我们的快速指南,以了解如何快速开始使用图像导引

  1. 请至 AI Image Generation page页面。在Generation History旁边,您现在将看到一个名为Image Guidance的新选项-选择此选项。

  2. 将来源图像上传到新的图像导引框。(高级用户可以访问 4 个导引框并上传最多 4 张图片)。

  3. 从下拉式选单中选择选定的 ControlNet 选项。那些与当前基本模型不相容的将显示为灰色。⚠️ 符号将提供悬停说明,以便修改选项以使其可用。如果您希望使用图像作为初始图像,请选择“Image to Image”选项。如果您想使用“Image Prompt”功能,请先在左侧边栏中启用“Prompt Magic”。

  4. 选择您所需的权重强度。(请注意,较高的权重可以使 ControlNet 更符合您的基础图像,但可能会产生不必要的结果,因此我们建议尝试不同权重以找到完美的平衡)。

  5. 点击生成!


常见问题

新的 ControlNet 需要多少代币?

  • 每个图像导引选项任务需要额外花费 2 个代币。
    (请注意,Image to Image不会产生额外的代币费用)

图像导引最适合与哪些生成管道配合使用?

  • 所有模型和管道,包括 Alchemy、PhotoReal 和 Prompt Magic。
    (注意Prompt Magic V2仅支援Image Prompt)

结果不一致,该怎么办?

  • 如果您没有获得想要的影像结果,我们建议调整权重,或选择不同的参考图像。


意见反馈

我们知道图像导引是一项备受期待的功能,我们期待看到每个人使用它创建的作品!尽管如此,这些功能是新的,因此我们很想知道您是否有遇到任何问题或对更新有其他想法。

请随时在这里留下您的反馈。

这是否解答了您的问题?