来源:AICG工具箱 责编:网络 时间:2025-06-14 14:12:31
5月24日报道丨近日,谷歌在GitHub平台发布了一款3D生成模型「CAT3D」,通过使用多视角扩散模型来创建3D场景。
「CAT3D」通过使用多视角扩散模型来创建3D场景,提供了一种快速且高效的方法来生成3D内容。这次大模型的发布,彰显了3D影像重建领域取得了显著的技术进展。
在过去,3D重建场景是一项非常繁琐而复杂的工作,需要耗费巨大的人力物力算力。现如今,用户只需要提供一些包含具体对象元素的图片,「CAT3D」就能够利用这些图片生成新的视角,然后通过一个强大的3D重建流程,将这些视角转换成一个可以实时渲染的3D表示。
据介绍,「CAT3D」能够在一分钟内完成整个3D场景的创建,这比现有的单图像和少视图3D场景创建方法要快得多。
只需在模型内上传一定数量的图像,就可以这些图像为条件的多视图扩散模型来生成场景的新视图。生成的视图被馈送到强大的3D重建管线,生成可以支持交互式实时渲染的3D成像文档。总处理时间(包括视图生成和3D重建)仅仅只需一分钟而已。
该模型不仅支持单图像输入,还能够处理多图像输入,从而生成更加丰富和详细的3D场景。CAT3D利用多视图扩散模型,可以根据任意数量的输入图像和目标新视图生成高度一致的场景新视图。
与竞争对手相比,「CAT3D」输出的3D图像渲染速度又快又清晰,细节保留程度较高,重复修改的工作量少。也不会出现明显的空间景深误差与视觉上的不和谐。
谷歌表示,生成的新视图可以作为3D重建技术的输入,实现从任何视点实时渲染3D表示,这对于虚拟现实、游戏开发和建筑设计等领域非常有用。
主要特点:
快速生成:CAT3D能够在最短的时间内,即一分钟内完成整个3D场景的创建,这比现有的单图像和少视图3D场景创建方法要快得多。多视图支持:该模型不仅支持单图像输入,还能够处理多图像输入,从而生成更加丰富和详细的3D场景。高质量的3D捕获:CAT3D利用多视图扩散模型,可以根据任意数量的输入图像和目标新视图生成高度一致的场景新视图。实时渲染:生成的新视图可以作为3D重建技术的输入,实现从任何视点实时渲染3D表示,这对于虚拟现实、游戏开发和建筑设计等领域非常有用。结构优势:CAT3D使用视频扩散模型的结构,但与时间嵌入不同,每个图像都嵌入了相机姿态,这有助于更准确地捕捉场景的3D结构。3D重建管道:生成的视图被传递到3D重建管道,以创建精确的3D表示,这对于后续的3D建模和可视化至关重要。项目主页:
https://cat3d.github.io/index.html
快手可能找到了AI聊天机器人与社交软件合体的最佳方式。最近很多快手用户发现,一个名叫「AI小快」的账号格外活跃,与网友聊得火热,一个抛梗、一个接梗…
7 月 11 日消息,美图秀秀官方微博今日发文,称“AI 扩图”功能现已上线,美图秀秀 App 和 Wink App 均可以立刻体验 AI 扩图功能。功能使用门槛更低、生成效果更好,比PhotoShop、Midjourney等工具更适合中国宝宝体质。
苹果推出业界首款3nm芯片A17 Pro,全新设计的GPU是这颗芯片的最大亮点,使下一级手机游戏具有快速、高效的性能和硬件加速光线追踪。
现在AI应用产业的流量情况,整体的市场状态大概是怎么的呢,一直以来都缺少一个理性认知。数据分析师郎瀚威给了我们一些答案。
商汤AI视频生成器如影使用方法_如影使用教程_AI视频生成测评
上海公布大模型政策 打造AI“模”都丨“爱因斯坦”虚拟人已回复160万条消息丨蚂蚁推出AI安全检测平台“蚁鉴2.0”
首款有思想的自行车问世:搭载 ChatGPT 的自行车带来骑行新体验
AIGC内卷到游戏行业:网易推出国内首个AIGC手游《逆水寒》
视频人物更换背景利器!Unscreen AI 在线视频,gif,动图 抠图,去除背景神器
PS怎么低价购买_ps怎么买最便宜
马斯克突然发布新版Grok-2大模型,牺牲特斯拉资源叫板OpenAI,一手实测来了
Kimi连夜上线PPT生成功能丨测评18款AIPPT产品
夸克AI搜索_夸克最新动态_夸克官方网站
高考大模型测评_豆包文科成绩领先