来源:AICG工具箱 责编:网络 时间:2025-07-29 09:11:33
7月27日消息,今天,在2025世界人工智能大会腾讯论坛上,腾讯正式发布混元3D世界模型1.0,并全面开源。
据介绍,这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域带来了全新的可能性。除3D世界模型外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。
腾讯混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术,同时支持文字和图片输入,实现了高质量、风格多样的可漫游3D场景生成。过去需要专业建模团队数周才能搭建的3D虚拟世界,现在只需一句文字或一张图片,几分钟内即可生成。
对游戏开发者而言,混元3D世界模型极大简化了3D场景构建流程,只需输入简单指令,模型即可快速生成包含建筑、地形、植被的完整3D场景。输出的Mesh文件可用于游戏原型搭建或关卡设计,还能灵活调整前景物体、更换天空背景,满足个性化创作需求。
无建模经验的普通用户,通过混元3D创作引擎,仅需一句话或者一张图即可快速生成360°沉浸式视觉空间,生成的场景可无缝导入VisionPro等虚拟头显,带来沉浸式体验。
从官方介绍获悉,混元3D世界模型1.0的核心还在于其创新的「语意层次化3D场景表征及生成算法」。该算法将复杂3D世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离,不仅生成视觉效果逼真的整体场景,还能输出标准化的3DMesh资产,兼容Unity、UnrealEngine、Blender等主流工具。用户可对场景内元素进行独立编辑或物理仿真,无缝衔接AIGC技术与传统CG工作流。
与全球领先的开源模型相比,混元3D世界模型1.0在文生世界、图生世界的美学质量和指令遵循能力等关键维度均全面超越当前SOTA的开源模型。
腾讯混元3D世界模型1.0:
项目主页:https://3d-models.hunyuan.tencent.com/world/
体验地址:https://3d.hunyuan.tencent.com/sceneTo3D
HuggingFace模型地址:https://huggingface.co/tencent/HunyuanWorld-1
Github项目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0
欠债一个亿的大厂,万众瞩目的Stable Diffusion 3终于正式开源了!目前开源的是20亿参数的版本,据悉之后还会开源40亿和80亿的“大杯”与“超大杯”。
在2025年的今天,全国高考报名人数已经突破了1335万大关,创下了历史新高。面对如此庞大的竞争群体,以及不断深化的高考改革趋势,考生和家长们正面临着前所未有的挑战。特别是随着全国已有29个省份完成了
就在刚刚,马斯克又整大活了!他带着脑机接口Neuralink团队,开了1小时发布会,整个过程亮点满满,全程高能。首先,Neuralink宣布,目前全球已经有七人植入了设备。通过「心灵感应」产品,他们重获跟物理世
近日,GoogleDeepMind正式发布首个可完全在机器人本地部署的视觉-语言-动作模型(Visual-Language-Action,VLA)——GeminiRoboticsOn-Device。这也意味着,具身智能(EmbodiedAI)正在从依赖云端算力,迈入
创新不设限!2024新“智”慧全国AI数字创意大赛吸引百余组选手参赛
抖音开启AI搜索功能灰度测试丨OpenAI CEO奥特曼:2024年无法实现AGI丨夸克APP上线“健康大模型”
Win11迎接史诗级更新,为你的电脑植入AI大脑,微软终于硬了!
体验完ChatGPT最新联网插件Web browsing,我们发现了以下好处与坏处
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
如何利用Whee辅助制作APP动态启动页丨附保姆级提示词教程
怎么制作AI套壳软件_100学AI_AI套壳软件怎么调用接口
如何定制ChatGPT小工具_有哪些实用的ChatGPT工具推荐
通义听悟有什么能力_通义听悟有什么功能
关键词后缀参数有什么_有哪些关键词后缀