来源:AICG工具箱 责编:网络 时间:2025-04-14 12:15:38
以下文章来自于丨机器之心
AI 帮你来试衣,想穿什么款式一键搞定。
精准捕捉服装细节,衣服纹理、图案、缝线等属性高度还原:
即使是在户外,AI 试衣也能准确展示试穿效果,保持较高质量的输出:
人物坐立姿势对衣物有遮挡,AI 也会毫无破绽的实现一键换衣,高度保持服装细节的一致性:
既然 demo 演示这么厉害,那试试让黄仁勋、奥特曼、霉霉等名人穿上机器之心的文化衫,出来的效果会怎么样呢?
试用了几轮下来,换装效果的确不错,但也有一些瑕疵,比如换装后有时会出现大花臂、衣服上的字体没有很好地还原、手部变形。
上面展示的虚拟试衣技术由韩国科学技术院(KAIST) 、OMNIOUS.AI 共同打造,他们提出了一种名为「IDM-VTON」的新型扩散模型,该技术在提高服装保真度的同时,还能生成真实的视觉效果。
IDM-VTON 整体 pipelne 如下图左所示:IDM-VTON 包括(1)TryonNet 用于处理人物图像;(2)图像提示适配器(IP-Adapter)用于编码服装图像的高级语义;(3)GarmentNet 用于编码低级特征。
在 UNet 输入中,本文将人物图像潜在的噪声潜在与分割掩码、掩码图像和 DensePose 进行了拼接。本文还提供了服装的详细说明(例如,[V]:短袖圆领 T 恤),然后这些说明作为 GarmentNet 和 TryonNet 的输入提示。
注意力模块细节如下图右所示:
TryonNet 和 GarmentNet 的中间特征被连接起来并传递到自注意力层,并使用输出的前半部分(即来自 TryonNet 的部分)。然后通过交叉注意力层将输出与来自文本编码器和 IP-Adapter 的特征融合。此外,本文还对 TryonNet 和 IP-Adapter 模块进行微调,同时冻结其他组件。
最后,我们再展示一下 IDM-VTON 的其他效果。
多人试穿同一件衣服:结果显示 IDM-VTON 可以生成高保真图像,识别服装细节。
IDM-VTON 和其他方法的比较结果可以看出,IDM-VTON 能够生成真实的图像并能够保留服装的细粒度细节。
了解更多内容,请参考原论文。
论文地址:https://arxiv.org/pdf/2403.05139.pdf
论文主页:https://idm-vton.github.io/
论文标题:Improving Diffusion Models for Authentic Virtual Try-on in the Wild
想体验这款最新的AI大模型可以访问Hugging Face网站:
https://huggingface.co/spaces/yisol/IDM-VTON
相信广大设计师朋友在工作中总会遇到一些B端类的视觉需求,通常是UI的装饰氛围模块以及UI视觉卡片。今天我们就来个小教程,帮助大家快速了解这类需求的设计方法和制作过程。
阿里云 AI 智领者峰会-北京站活动中,阿里云对外发布了新版的通义千问大模型,V2 5版本大模型正式发布,该版大模型的多项能力赶超了GPT-4。
AI 绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容(AIGC)的一个应用场景。其主要原理简单来说就是收集大量已有作品数据,通过算法对它们进行解析,最后再生成新作品,Midjourney是一个由同名研究实验室开发的人工智能程序。
商汤科技最新升级的AI文生图领域的预训练模型——秒画Artist v0 3 5版本,三个月后迭代。审美水平和专业度上达到顶尖水平,福利值(免费)直接拉满
Sora 平替:AI视频工具 Haiper免费来袭|零基础应用教程
B端设计教学_怎么进行UI视觉设计_B端设计教学
ChatGPT如何工作_ChatGPT如何进行多轮对话
小米AI助理“小爱同学”接入字节跳动豆包大模型,将用于小米旗下所有「人车家」终端
基准测评国内第一:百川智能发布新一代大模型Baichuan 4,发布旗下首款AI智能搜索助理「百小应」
我测评了10款好玩到哭的GPTs原生AI应用:教你减肥、调酒、帮你解梦…ChatGPT最新GPTs玩法大公开
谷歌Gemini引发争议!网友质疑宣传片疑似剪辑效果 夸大宣传丨实测对标GPT-4测评基准有失偏颇
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
美图whee改图教程_美图whee改图最新消息_whee官方网站
controlnet怎么操作_stable diffusion模型拆解_controlnet控图的差异跟使用技巧有哪些