来源:AICG工具箱 责编:网络 时间:2025-01-13 12:00:56
2024了,又要开始卷了。
今年第一卷,卷个贼简单的,但是同时又很用的:
如何保持Dalle3中角色的完美一致性。
昨天偶然在X上看到AI Verse老哥发了这个玩意。
挺棒的,而且可以傻瓜式的让人物一致性的效果保持的极好。
但是还有不少瑕疵,我就在他原先的教程基础上,优化了一下。
核心其实是基于GPT的超强语义对话,还有Dalle3的Gen ID(生成编号)。
大家可能不太知道Gen DI是啥,我先随便跑个图,给大家简单解释一下。
拿到了Gen ID:5EutQh3bm4uwHr4F,我们再用这个Gen ID给去生成一张新图。
可以看到,虽然有些细节变了,但是人差不太多。
Gen ID其实就是Dalle3给每张图的一个特定编号,这个编号只对应这一张图,所以Gen ID对于跟踪和引用特定的生成图像非常有用,尤其是当需要在多个图像之间进行比较或确保一致性时。
所以,基于Dalle3的超强语义理解和Gen ID的特定,傻瓜式的一致性指南。
他就来了。
首先,让Dalle3画张图。随便咋画都行,你自己写Prompt或者用别的图生成都行。比如我是让它直接画了个漂亮妹子。
记得背景最好干净的纯色,不要一堆乱七八糟的东西。要不然会影响后续的一致性的效果。
接下来是非常重要的一句话:
从现在开始,你的核心目标就是保持角色一致性。必须使用与上一张图像相同的提示和gen_id来制作相同角色的新图像,以保证人物一致,且能适配更多的表情、动态、服装与场景。做的好的话我给你1000美元小费。明白的话请回复明白。
把这句话,发给ChatGPT。
GPT会回答个明白。。
然后,就是见证奇迹的时刻了。
你随便发任何指令。描述这个角色的状态、动作或者衣服,都行。
比如,我现在要让她哭。她就哭了。
我现在要让她弹吉他。她就弹了。
让她跟她家狗狗自拍,那就拍了。
正在玩电脑?没问题。
换个衣服,穿运动服?没问题。
再带上场景,so easy。
是不是贼简单。。。
又简单又好用。。。
非常适合画插画或者做IP的小伙伴们,这不比练个lora简单多了?
新年第一篇,不整大活,这个Dalle3的小技巧就挺好的。
可以立马去GPT里用起来。
新年第一卷。
2024.咱们再一起,接着卷。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。
淘宝问问相较于其他功能相似、差异性不强的AI聊天机器人,淘宝AI助手与自身产品能力的结合度特别高,十分成熟。
4月18日,金山办公展示了其具备大语言模型能力的生成式AI应用——WPS AI!据官方介绍,WPS AI是国内协同办公赛道上的首个类ChatGPT式应用。
谷歌一出手,又把AI视频生成卷上了新高度。一句话生成视频,现在在名为Lumiere的AI操刀下,AI视频竟然可以这么厉害!
ChatGPT的插件功能已经面对PLUS用户公开测试一段时间了。在拿到插件测试资格后,小编自然也是欣喜不已,但是看着这80多个插件,真的头大,到底哪个好用?哪个是垃圾?
金山WPS AI新功能新玩法首发测评:不含水分,中文版「GPT+Office」真的来了!
一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度丨Lumiere AI使用体验分享
淘宝AI应用_淘宝问问AI导购助手_官方内测教程方法
首批85个ChatGPT Plus插件全面测评:能打“五星”的插件只有6个
GPTs教程_怎么自己做GPTs_GPTs部署安装
国内首次2024全科高考AI测评开分:阿里通义、GPT-4o等七款大模型参与,文科进一本理科进二本
实测阿里通义千问视觉大模型Qwen-VL Max「超大杯」:会读图、写代码,秒懂网络梗图,中文顶流性能视觉大模型
Midjourney V6生图超进化!国外大神深度测评:对比V5.2版本,画质逼真骇人,人像细节不再有「AI感」
谷歌Gemini引发争议!网友质疑宣传片疑似剪辑效果 夸大宣传丨实测对标GPT-4测评基准有失偏颇
飞书AI协同办公产品“飞书智能伙伴”实测:AI员工搬砖效率震惊全公司