来源:AICG工具箱 责编:网络 时间:2025-01-23 15:23:25
AI奇点网工具使用教程丨Stable Diffusion 使用教程系列
低 VRAM 生图 Tiled Diffusion
SD是一款很强大的AI绘画软件,使用GPU进行大量运算后生成图片。但是这个算法非常吃显存, 我认为最好的显存是12G,且相对小的显存依旧有很大的使用困难,容易爆显存数据溢出绘画失败。
大佬 pkuliyi2015 开发了 MultiDiffusion with Tiled VAE这个项目,该插件可以大幅减少 SD 运算的时候所需显存,相当于是连续画多张图,再合并起来。这种拆分任务的方式让显存较小的硬件也能够低成本地画出更大的图。
同时,由于这个特性,让 MultiDiffusion with Tiled VAE 甚至能够在参数不变的情况下将原图从1024 * 800 放大到 4096 * 3200。(简单说该插件降低设备要求同时还能提高画面分辨率,神器)
下面我们来看一下这个是怎么安装使用的
1.打开网址:https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111
1: 官方下载
打开Automatic1111 WebUI -> 点击“扩展”选项卡 -> 点击“可用”选项卡 -> 找到“[MultiDiffusion 放大器(TiledDiffusion with Tiled VAE)]” -> 点击“安装”
2: URL 安装
打开Automatic1111 WebUI -> 点击“扩展”选项卡 -> 点击“从网址安装”选项卡 -> 输入 https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111.git -> 点击“安装”
如何使用Tiled Diffusion
1.打开 tiled diffusion 根据图片框选操作
勾选enable tiled diffusion,旁边overwrite 为调整画面大小,勾选了sd自带的调整大小不会起作用
2.选择混合的模式(底下数值一般保持默认,或者自己尝试新的玩法)
3.选择 region prompt control 勾选 enable control 上传任意一张图片
这里上传的图片只作为画布大小的提供参考,并无其他用途。
4.分区域绘画
首先选择第一块区域,勾选enable region 1,可根据自己的需求多区域生成图片接着选择这快区域在画布上当做前景还是背景(拖动红**域沾满整个画布选择background。弱红**域只占画布一小部分可选foreground)输入提示词 (提示词为具体的东西)5.生成图片,等待出图
【注意事项】
从图中可以看到如何将图像分割成块。
在每个步骤中,潜在空间中的每个小块都将被发送到 Stable Diffusion UNet。
小块一遍遍地分割和融合,直到完成所有步骤。
块要多大才合适?
较大的块大小将提升处理速度,因为小块数量会较少。
然而,最佳大小取决于您的模型。
SD1.4仅适用于绘制512 * 512图像(SD2.1是768 * 768)。由于大多数模型无法生成大于1280 * 1280的好图片。
因此,在潜在空间中将其除以8后,你将得到64-160。
因此,您应该选择64-160之间的值。
个人建议选择96或128以获得更快的速度。
重叠要多大才合适?
重叠减少了融合中的接缝。显然,较大的重叠值意味着更少接缝,但会显著降低速度,因为需要重新绘制更多的小块。
与 MultiDiffusion 相比,Mixture of Diffusers 需要较少的重叠,因为它使用高斯平滑(因此可以更快)。
个人建议使用 MultiDiffusion 时选择32或48,使用 Mixture of Diffusers 选择16或32
放大算法(Upscaler) 选项将在图生图(img2img)模式中可用,你可选用一个合适的前置放大器。
4月18日,金山办公展示了其具备大语言模型能力的生成式AI应用——WPS AI!据官方介绍,WPS AI是国内协同办公赛道上的首个类ChatGPT式应用。
上周 OpenAI 在首次开发者大会上,发布了重磅炸弹 GPTs!你无需任何编程知识,通过简单聊天的交互方式就能创建数学、论文、创意设计等不同任务的专属GPT小助理啦。快来体验一下吧
谷歌一出手,又把AI视频生成卷上了新高度。一句话生成视频,现在在名为Lumiere的AI操刀下,AI视频竟然可以这么厉害!
豆包视频生成模型拥有精准的语义理解能力,支持多动作多主体交互的内容生成。遵从更复杂的 prompt,解锁时序性多拍动作指令与多个主体间的交互能力
金山WPS AI新功能新玩法首发测评:不含水分,中文版「GPT+Office」真的来了!
一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度丨Lumiere AI使用体验分享
字节跳动发布豆包视频生成模型,这效果让我分不清AI虚拟与现实的边界
国内首次2024全科高考AI测评开分:阿里通义、GPT-4o等七款大模型参与,文科进一本理科进二本
Midjourney VS Stable Diffusion超全对比丨一篇让你全面了解他们的区别!
实测阿里通义千问视觉大模型Qwen-VL Max「超大杯」:会读图、写代码,秒懂网络梗图,中文顶流性能视觉大模型
Midjourney V6生图超进化!国外大神深度测评:对比V5.2版本,画质逼真骇人,人像细节不再有「AI感」
谷歌Gemini引发争议!网友质疑宣传片疑似剪辑效果 夸大宣传丨实测对标GPT-4测评基准有失偏颇
飞书AI协同办公产品“飞书智能伙伴”实测:AI员工搬砖效率震惊全公司
有哪些好用的大模型_SDXL大模型测评