来源:AICG工具箱 责编:网络 时间:2025-08-03 07:01:35
地球的ChatGPT时刻来了!
谷歌DeepMind推出AlphaEarthFoundations模型(下面简称AEF),实现高精度绘制地球。
诺奖得主、谷歌DeepMind首席执行官DemisHassabis表示:它将为科学家提供近乎实时的地球观测。
该模型主要是解决了数据过载和信息不一致两大难题。简单来说就是观测数据多但高质量标注数据少,给绘制全球地图带来困难。
AEF就像一个虚拟卫星,整合了光学卫星图像、气候模拟等PB级的海量地球观测数据,能够利用多源、离散的数据生成通用的地理空间表示,让科学家能够按需创建地球地图,毫不费力实现全球测绘和监测。
由它生成的卫星嵌入数据集现已被联合国粮农组织、哈佛森林等超50个全球组织使用。
实际上,不只是科学家,普通人也能通过AlphaEarthFoundations轻松读懂地球的变化。
从大航海时代到现代,人类花了500年时间绘制地球,而现在AEF的出现让每天重新绘制地球成为现实。
这让前谷歌地图方面的研究员BilawalSidhu惊呼:谷歌朝着构建地球版ChatGPT迈出了重要一步。
来看看它是怎么做到的。
现在有卫星、雷达、无人机、气象站等无数设备,每天都在收集地球的图像、温度、湿度、地形等数据。
但不同国家、机构对于观测数据的标注标准可能不一样,并且地球表面随时在变化(比如森林被砍伐),但实地标注往往几年才更新一次,导致标注数据和实际情况脱节。
简单来说,地球观测数据就像“拍了无数张地球的照片”,但知道“照片里具体是什么”的标注却很少,这直接卡住了全球地图的绘制精度和效率。
而AEF的价值,就在于它能在标注稀少的情况下,依然用好海量观测数据,画出更准确的地图。
AEF是一种嵌入场模型,核心是时空精度编码器(STP),STP通过空间自注意力捕捉地理上的远距离关联,通过时间轴自注意力解析时序动态,再结合卷积操作保留局部精细特征。
通俗一点说就是把地球表面的复杂信息(如地形、植被、气候等)压缩成一组“数字密码”(嵌入向量),这些密码能精准反映地球表面的时空特征,既能看全局又能抓细节。
AEF的另一大创新是对时间的连续建模能力。
它将观测数据的支持期(数据实际采集的时间范围)与地图生成的有效期(需要映射的时间范围)分离,即使在有效期内没有直接观测数据,也能通过插值或外推生成连续的结果。
比如,如果只有2018年和2020年的卫星图像,模型能可靠推测出2019年某地区的地表状态,这解决了传统模型只能处理固定时间点数据的局限。
在数据处理上,AEF实现了多源信息的深度融合。
它能接收光学卫星、雷达、激光雷达、气候数据甚至地理文本等10多种输入,打破了数据类型的壁垒。通过统一的编码方式将这些不同类型、不同分辨率的数据转化为可兼容的特征。
例如,光学图像的植被颜色、雷达的地表结构信息、气象站的温度数据,都会被整合到同一个嵌入向量中,这个向量仅64字节。
模型的训练机制也颇具特色。它采用师生模型和对比学习策略。同时,引入文本对齐训练,将地理文本描述与对应区域的嵌入向量关联,进一步丰富特征的语义信息。
最终,AEF生成的嵌入场以10x10米方格形式精确分析地球陆地和沿海水域,同时为每个方格创建高度紧凑摘要,存储空间需求仅为其他AI系统的十六分之一,降低了分析成本。
并且这些嵌入向量无需重新训练就可直接用于各类映射任务,无论是土地覆盖分类、农作物识别还是森林变化检测,都能通过简单的迁移学习实现高精度结果。
与传统方法和其他AI测绘系统相比,AEF在不同时间段执行多种任务时,包括识别土地利用和估算地表属性等,始终保持最高准确性。
例如在某土地覆盖分类任务中,AEF的平衡准确率达0.82,而次优模型仅0.69。
AEF尤其在标签数据稀缺场景下表现出色,平均错误率比测试模型低24%,展现出卓越的学习效率。
从具体应用场景来看,AEF在主题映射(如土地覆盖分类)、生物物理变量估计和变化检测中表现全面。
例如,在年度土地覆盖变化识别中,它能精准区分森林、农田、城市等类型,对细微变化的捕捉误差远低于传统方法。
在谷歌地球引擎中,由AEF驱动的卫星嵌入数据集是同类规模中最大的数据集之一,每年包含超过1.4万亿个潜入足迹。目前已在EarthEngine数据目录发布。
这一系列年度嵌入数据已被全球多个组织采用,其中包括联合国粮食及农业组织、哈佛森林、地球观测组织等。它们借助该数据集制作功能强大的自定义地图。
例如,“全球生态系统地图集”这一项目旨在打造首个全面资源,用于绘制和监测全球生态系统。该项目正利用此数据集帮助各国将未测绘的生态系统划分为海岸灌丛、极端干旱沙漠等类别。
全球生态系统地图集全球科学负责人NickMurray说:
卫星嵌入数据集正在彻底改变我们的工作,它帮助各国绘制未知生态系统的地图——这对于精准定位保护工作的重点区域至关重要。
展示卫星嵌入数据集从粗到精的分割的无监督聚类动画
巴西MapBiomas团队正在测试该数据集,以更深入地了解全国范围内的农业和环境变化,它为亚马逊雨林等关键生态系统的保护策略和可持续发展举措提供了重要依据。
AEF还有助于解决粮食安全、森林砍伐和水资源等关键问题。
对此,有网友表示:人工智能模型正在成为公共基础设施。
毕竟,看懂地球才能更好保护它。
https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/alphaearth-foundations.pdf
[1]https://deepmind.google/discover/blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/
[2]https://x.com/GoogleDeepMind/status/1950563700286398965
[3]https://x.com/demishassabis/status/1950667643771326784
[4]https://x.com/bilawalsidhu/status/1950580970907648234
【AI奇点网2024年8月5日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
就在刚刚,马斯克又整大活了!他带着脑机接口Neuralink团队,开了1小时发布会,整个过程亮点满满,全程高能。首先,Neuralink宣布,目前全球已经有七人植入了设备。通过「心灵感应」产品,他们重获跟物理世
近日,GoogleDeepMind正式发布首个可完全在机器人本地部署的视觉-语言-动作模型(Visual-Language-Action,VLA)——GeminiRoboticsOn-Device。这也意味着,具身智能(EmbodiedAI)正在从依赖云端算力,迈入
AI时代,赚钱到底有多快?看看这个以色列老哥你就懂了。昨天,一笔看似“不起眼”的收购在硅谷刷屏:Wix用8000万美元,收下了本土AI编程公司Base44。在动辄上亿的一级市场,这个收购价格不算高。但背后的故事
抖音开启AI搜索功能灰度测试丨OpenAI CEO奥特曼:2024年无法实现AGI丨夸克APP上线“健康大模型”
打工人必备ai软件_ai软件推荐_有什么好用的ai软件
体验完ChatGPT最新联网插件Web browsing,我们发现了以下好处与坏处
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
深度解析丨ControlNet模型的工作原理与应用场景(附案例解析)
如何定制ChatGPT小工具_有哪些实用的ChatGPT工具推荐
苹果发布新一代iPad mini 7搭载「苹果AI」丨Adobe发布多款在线AI修图工具丨微软AI部门副总裁离职加盟OpenAI
AMD发布新一代AI芯片MI325X和锐龙AI PRO 300丨OpenAI需到2029年才能实现盈利丨字节发布Ola Friend AI智能体耳机
美图AI短片创作工具Moki全面开放丨OpenAI CEO奥特曼发文回应CTO离职丨B站上线自研大模型用于AI字幕生成
OpenAI奥特曼预测:「智能时代」即将到来丨字节即梦AI推出Loopy“对口型”功能丨钉钉推出365会员,强化AI付费服务