如何使用稳定扩散技术创建超逼真的人工智能图像

CN
Decrypt
关注
11个月前

你准备好模糊现实与由AI生成的艺术之间的界限了吗?

如果你关注生成式AI领域,尤其是图像生成,你可能熟悉Stable Diffusion。这个开源AI平台引发了一场创意革命,让艺术家和爱好者能够在自己的电脑上免费探索人类创造力的领域。

只需简单的提示,你就可以得到一幅风景画、幻想插图、3D生物或卡通。但真正令人瞠目结舌的能力在于这些工具创造出令人惊叹的逼真图像。

然而,要做到这一点需要一些技巧,以及对细节的关注,这是一般模型有时缺乏的。一些狂热的用户可以通过看图快速判断出是由MidJourney或Dall-e生成的图像。但当涉及到创造能够愚弄人脑的图像时,Stable Diffusion的多功能性是无与伦比的。

从对颜色和构图的细致处理到传达人类情感和表达的惊人能力,一些定制模型正在重新定义生成式AI领域的可能性。以下是我们认为是使用Stable Diffusion进行超逼真图像生成的精品专业模型。

我们使用相同的提示与所有模型,并避免使用LoRas(低秩适应附加修饰符),以便在比较中更加公平。我们的结果是基于提示和文本嵌入。我们还使用渐进变化来测试我们生成的小变化。

提示

我们的积极提示是:专业照片,白种男子特写照,穿着黑色毛衣,面部严肃,戏剧性的光线,大自然,阴郁,多云天气,浅景深

我们的负面提示(指导Stable Diffusion不要生成的内容)是:嵌入:BadDream,嵌入:UnrealisticDream,嵌入:FastNegativeV2,嵌入:JuggernautNegative-neg,(变形的虹膜,变形的瞳孔,半逼真,CGI,3D,渲染,素描,卡通,绘画,动漫:1.4),文本,裁剪,超出画面,最差质量,低质量,JPEG伪影,丑陋,重复,恐怖,残缺,额外手指,变异的手,画得不好的手,画得不好的脸,变异,变形,模糊,脱水,解剖不良,比例不良,额外肢体,克隆脸,畸形,比例失调,畸形肢体,缺胳膊,缺腿,额外胳膊,额外腿,融合的手指,手指过多,长颈,嵌入:negative_hand-neg。

所有使用的资源将在本文末列出。

Stable Diffusion 1.5:老而优雅的AI老将

Stable Diffusion 1.5:就像一辆老式美国肌肉车,在拖车比赛中击败了更花哨的最新车型。开发人员已经对SD1.5进行了很长时间的调整,以至于它实际上将Stable Diffusion 2.1淘汰了。事实上,今天很多用户仍然更喜欢这个版本,而不是比它新两代的SDXL。

当涉及到创建几乎无法与真实照片区分的图像时,这些模型就是你的新宠。

1. Juggernaut Rborn

Juggernaut Rborn是一个备受喜爱的模型,以其逼真的色彩构图和区分主题和背景的出色能力而闻名。该模型特别擅长在肖像中生成高质量的皮肤细节、头发和浅景深效果。

最新版本已经经过微调,以提供更引人入胜的结果。Juggernaut一直提供的色彩构图往往比许多其他Stable Diffusion模型的过饱和、不自然的颜色更加真实。它的生成倾向于更温暖、更淡化,类似于未经编辑的RAW照片。

要获得最佳结果仍然需要一些调整:使用DPM++ 2M Karras采样器,设置约35步,平均CFG比例为7。

2. Realistic Vision v5.1

在逼真图像生成领域的真正开拓者,Realistic Vision v5.1在Stable Diffusion的发展历程中带来了一个重要时刻,使其能够在逼真度方面与MidJourney和其他任何模型竞争。v5.1版本擅长捕捉面部表情和瑕疵,使其成为肖像爱好者的首选。它还能很好地处理情感,并更专注于主题而不是背景,确保最终结果始终逼真。由于其出色的性能和多功能性,这个模型备受青睐。

虽然有更新版本(v6.0),但我们更喜欢V5.1,因为我们觉得它在逼真图像中重要的细节方面仍然更好。在皮肤、头发或指甲等方面,5.1版本更具说服力,但除此之外,结果是相似的,改进似乎是渐进的。

3. I Can’t Believe It’s Not Photography

以其多功能性和令人印象深刻的光效果而闻名的I Can’t Believe It’s Not Photography模型是超逼真图像生成的一个很好的全能选择。它非常有创意,能很好地处理不同的角度,并且不仅适用于人物,还适用于各种主题。

这个模型在640x960分辨率下特别出色,这比原始的SD1.5更高,但也可以在768x1152分辨率下取得出色的结果,这是SDXL本身的分辨率水平。

为了获得最佳效果,请使用DPM++ 3M SDE Karras或DPM++ 2M Karras采样器,20-30步,以及2.5-5的CFG比例(低于通常值)。

荣誉提及:

Photon V1:这款多功能模型擅长为各种主题(包括人物)生成逼真的结果。

Realistic Stock Photo:如果您想生成看起来经过精心打磨和完美处理的肖像照片,这款模型是一个绝佳选择。它可以创建没有任何皮肤瑕疵的令人信服和准确的图像。

aZovya Photoreal:虽然不那么出名,这款模型产生了令人印象深刻的结果,并且在与它们的训练配方合并时可以增强其他模型的性能。

Stable Diffusion XL:多才多艺的远见者

虽然Stable Diffusion 1.5是我们在逼真图像方面的首选,但Stable Diffusion XL提供了更多的多功能性和高质量的结果,而不需要诸如增强分辨率之类的技巧。它需要一点点的功率,但可以在具有6GB vRAM的GPU上运行,比SD1.5需要的少2GB。

以下是引领潮流的模型。

1. Juggernaut XL(版本x)

在其前身的成功基础上,Juggernaut XL为Stable Diffusion XL带来了电影般的外观和令人印象深刻的主题焦点。这款模型提供了与饱和度有所不同的特色色彩构图,以及良好的身体比例和理解长提示的能力。它更专注于主题,并且很好地定义了派别——就像任何SDXL模型现在可以做到的那样。

为了获得最佳效果,请使用832x1216的分辨率(用于肖像),DPM++ 2M Karras采样器,30-40步,以及3-7的低CFG比例。

2. RealVisXL

以逼真为目标定制的RealVisXL是捕捉使我们成为人类的微妙瑕疵的首选。它擅长生成皮肤纹理、痣、色调变化和下巴,确保最终结果始终令人信服。它可能是生成逼真人类的最佳模型。

为了获得最佳效果,请使用15-30+个采样步骤和DPM++ 2M Karras采样方法。

3. HelloWorld XL v6.0

通用模型HelloWorld XL v6.0采用了GPT4v标记,为图像生成提供了独特的方法。虽然可能需要一些时间来适应,但结果绝对值得努力。

这款模型特别擅长呈现在AI生成的图像中经常缺失的模拟美学。它也很好地处理了身体比例、瑕疵和光线。然而,它在本质上与其他SDXL模型不同,这意味着您可能需要调整提示和标记以获得最佳结果。

为了比较,这里是使用GPT4v标记的类似生成,使用了积极提示:电影美学、专业照片、白人男子的特写肖像照,穿着黑色毛衣,面部表情严肃,身处大自然,阴沉多云的天气,穿着黑色羊毛毛衣,氛围深沉,具有电影质感,略带模拟摄影的影响。

SDXL的荣誉提及包括:PhotoPedia XL、Realism Engine SDXL和已弃用的Fully Real XL。

超逼真图像的专业技巧

无论您选择哪个模型,以下是一些专家技巧,可帮助您获得令人印象深刻、栩栩如生的结果:

  1. 尝试嵌入实验:为了增强图像的美学效果,尝试使用模型创建者推荐的嵌入,或者使用广受欢迎的嵌入,如BadDream、UnrealisticDream、FastNegativeV2和JuggernautNegative-neg。还有针对特定特征的嵌入可用,比如手部、眼睛等。

  2. 掌握LoRA的力量:虽然我们在这里没有提到,但这些方便的工具可以帮助您在图像中添加细节、调整光线并增强皮肤纹理。有许多LoRA可用,所以不要害怕尝试并找到最适合您的那些。

  3. 使用面部细节扩展工具:这些功能可以帮助您在面部和手部获得出色的结果,使您的图像更加令人信服。Adetailer扩展可用于A1111,而Face Detailer Pipe节点可用于ComfyUI。

  4. 发挥ControlNets的创造力:如果您是一个对手部要求完美的人,ControlNets可以帮助您获得无瑕疵的结果。还有针对其他特征的ControlNets可用,比如面部和身体,所以不要害怕尝试并找到最适合您的那些。

要获得帮助入门,您可以阅读我们的Stable Diffusion指南

以下是我们在本指南中引用的资源:

SD1.5模型:

SDXL模型:

嵌入:

希望您在探索AI生成的图像和艺术时,找到这些稳定扩散工具的介绍有所帮助。祝您创作愉快!

Ryan Ozawa编辑。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

Bybit: $50注册体验金,$30000储值体验金
广告
分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接