来源:AICG工具箱 责编:网络 时间:2025-01-24 11:49:36
AI奇点网工具使用教程丨Stable Diffusion使用教程系列
Stable diffusion 交互界面介绍
文生图(txt2image)即为让AI按照文本叙述生图。
打开Stable Diffusion WebUI网页后,第一个看到的是以下画面,这就是文生图的页面。
英文版
中文汉化版
生图流程为在左上角填入提示词,勾选左下角的生图参数,再点击右上角生成图片。其余SD WebUI的功能用法大抵都按照此逻辑设计,有些参数是通用的。
1. 参数解说
Stable Diffusion checkpoint
目前使用的存盘点模型。
Prompts 提示词
这是填入正向与负向提示词的字段。
Sampling Methods 采样方法
Sampling Methods即为采样方法,各种方法得出的结果不太一样。
UniPC是2023年发表的采样方法。
DDIM和PLMS是2022年随Stable Diffusion v1发表的采样方法。
若要兼顾品质与速度,请优先试试这三种采样方法:UniPC、DPM++ 2M Karras、Euler a。
Sampling Steps 采样步数
采样步数建议值至少为20,在使用Euler a和UniPC采样方法的时候就有很好效果。
相对的DDIM需要80以上的采样步数才会有好结果。
Restore faces 脸部修复
使用脸部修复模型改善脸部生成效果。缺省使用CodeFormer,可在Settings切换为GFPGAN。
Tiling 平铺
生成类似地板花纹一样可连续的图片。
Hires_fix 高清修复
可以提升图片的画质,但是会耗费更多VRAM。
Upscaler
要使用的放大器。
Hires steps
高清修复步数。
Denoising strength
降噪强度。
Upscale by
缩放系数。
Width x Height 图片宽高
生成图片的宽高,尺寸越大品质越好,但越会吃掉更多VRAM。
缺省宽高为512x512,新版的建议可以试试768x768。
其余可用的宽高比(ratio)请参考下表。
CFG Scale
CFG Scale即Classifier-free guidance scale
AI生图与你给的提示词的相关度,数值越高越会按照你说的内容下去生图。
Batch count
设置按左上角的Generate后要生成多少次的图片。
Batch size
设置按左上角的Generate后,一次生成内要算多少图片。通常要一次算多张图,调整Batch count就够了,Batch size的值维持为1。
Seed 种子码
生成图片的种子码。将种子码保存下来有助于保留生图的风格。
点击骰子图标,设置成-1即为重置种子码;回收符号则是叫出上一次生图所使用的种子码。
Seeds Extra
测试更多种子码变化之用。
Variation seed
Variation strength
变化强度,此值越高,生图结果越不可预料。
Resize seed from width
Resize seed from height
Scripts
加载用户撰写的指令稿。内置的有:
Prompt Matrix:会生出一个表格图片,用于比对不同提示词生图的效果Prompts from files or textbox:从写好提示词的文件生成图片。X/Y/Z plot:用于比对不同提示词、采样方法、CFG Scale、种子码的组合所生图的效果。保存提示词
右上角可以保存与加载生图提示词。
5个按钮由左至依序为:
1. 叫出上次生图使用的设置值
2. 清空提示词
3. 激活额外网络
4. 套用选中的风格
5. 保存目前的提示词
保存的提示词此处称为风格(styles)
下方的Styles列表即为保存的提示词。点击保存的提示词(可多选),再点击上面的剪贴板图标,即会将该提示词组合加到左边的提示词字段。
发送结果到其他页面
生图后可以点击右下角的Send to image to image(发送到图生图),将生图结果发送到图生图的页面做进一步处理。
【下一节】stable diffusion如何使用文生图 Text to image>>>
4月18日,金山办公展示了其具备大语言模型能力的生成式AI应用——WPS AI!据官方介绍,WPS AI是国内协同办公赛道上的首个类ChatGPT式应用。
上周 OpenAI 在首次开发者大会上,发布了重磅炸弹 GPTs!你无需任何编程知识,通过简单聊天的交互方式就能创建数学、论文、创意设计等不同任务的专属GPT小助理啦。快来体验一下吧
谷歌一出手,又把AI视频生成卷上了新高度。一句话生成视频,现在在名为Lumiere的AI操刀下,AI视频竟然可以这么厉害!
大半夜的,可能是我认为做海报、做logo、做文字最猛的AI绘图产品,Ideogram,更新了他们的2 0版本。
金山WPS AI新功能新玩法首发测评:不含水分,中文版「GPT+Office」真的来了!
一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度丨Lumiere AI使用体验分享
字节跳动发布豆包视频生成模型,这效果让我分不清AI虚拟与现实的边界
Ideogram更新,AI可直接生成海报丨附最新使用教程
号外!华军AI产品榜重磅首发:8月国产AI文生视频工具大爆发
国内首次2024全科高考AI测评开分:阿里通义、GPT-4o等七款大模型参与,文科进一本理科进二本
Midjourney VS Stable Diffusion超全对比丨一篇让你全面了解他们的区别!
实测阿里通义千问视觉大模型Qwen-VL Max「超大杯」:会读图、写代码,秒懂网络梗图,中文顶流性能视觉大模型
Midjourney V6生图超进化!国外大神深度测评:对比V5.2版本,画质逼真骇人,人像细节不再有「AI感」
谷歌Gemini引发争议!网友质疑宣传片疑似剪辑效果 夸大宣传丨实测对标GPT-4测评基准有失偏颇