谷歌把整個地球裝進大模型!實時觀測,按天更新
地球的ChatGPT時刻來了!
谷歌DeepMind推出AlphaEarth Foundations模型(下面簡稱AEF),實現高精度繪制地球。
諾獎得主、谷歌DeepMind首席執行官Demis Hassabis表示:它將為科學家提供近乎實時的地球觀測。

該模型主要是解決了數據過載和信息不一致兩大難題。簡單來說就是觀測數據多但高質量標注數據少,給繪制全球地圖帶來困難。
AEF就像一個虛擬衛星,整合了光學衛星圖像、氣候模擬等PB級的海量地球觀測數據,能夠利用多源、離散的數據生成通用的地理空間表示,讓科學家能夠按需創建地球地圖,毫不費力實現全球測繪和監測。

由它生成的衛星嵌入數據集現已被聯合國糧農組織、哈佛森林等超50個全球組織使用。

實際上,不只是科學家,普通人也能通過AlphaEarth Foundations輕松讀懂地球的變化。
從大航海時代到現代,人類花了500年時間繪制地球,而現在AEF的出現讓每天重新繪制地球成為現實。
這讓前谷歌地圖方面的研究員Bilawal Sidhu驚呼:谷歌朝著構建地球版ChatGPT邁出了重要一步。

來看看它是怎么做到的。
高精度追蹤地球
多源信息融合,對時間連續建模
現在有衛星、雷達、無人機、氣象站等無數設備,每天都在收集地球的圖像、溫度、濕度、地形等數據。
但不同國家、機構對于觀測數據的標注標準可能不一樣,并且地球表面隨時在變化(比如森林被砍伐),但實地標注往往幾年才更新一次,導致標注數據和實際情況脫節。
簡單來說,地球觀測數據就像“拍了無數張地球的照片”,但知道“照片里具體是什么”的標注卻很少,這直接卡住了全球地圖的繪制精度和效率。
而AEF的價值,就在于它能在標注稀少的情況下,依然用好海量觀測數據,畫出更準確的地圖。

AEF是一種嵌入場模型,核心是時空精度編碼器(STP),STP通過空間自注意力捕捉地理上的遠距離關聯,通過時間軸自注意力解析時序動態,再結合卷積操作保留局部精細特征。

通俗一點說就是把地球表面的復雜信息(如地形、植被、氣候等)壓縮成一組“數字密碼”(嵌入向量),這些密碼能精準反映地球表面的時空特征,既能看全局又能抓細節。
AEF的另一大創新是對時間的連續建模能力。
它將觀測數據的支持期(數據實際采集的時間范圍)與地圖生成的有效期(需要映射的時間范圍)分離,即使在有效期內沒有直接觀測數據,也能通過插值或外推生成連續的結果。

比如,如果只有2018年和2020年的衛星圖像,模型能可靠推測出2019年某地區的地表狀態,這解決了傳統模型只能處理固定時間點數據的局限。

在數據處理上,AEF實現了多源信息的深度融合。
它能接收光學衛星、雷達、激光雷達、氣候數據甚至地理文本等10多種輸入,打破了數據類型的壁壘。通過統一的編碼方式將這些不同類型、不同分辨率的數據轉化為可兼容的特征。
例如,光學圖像的植被顏色、雷達的地表結構信息、氣象站的溫度數據,都會被整合到同一個嵌入向量中,這個向量僅64字節。

模型的訓練機制也頗具特色。它采用師生模型和對比學習策略。同時,引入文本對齊訓練,將地理文本描述與對應區域的嵌入向量關聯,進一步豐富特征的語義信息。
最終,AEF生成的嵌入場以10x10米方格形式精確分析地球陸地和沿海水域,同時為每個方格創建高度緊湊摘要,存儲空間需求僅為其他AI系統的十六分之一,降低了分析成本。

并且這些嵌入向量無需重新訓練就可直接用于各類映射任務,無論是土地覆蓋分類、農作物識別還是森林變化檢測,都能通過簡單的遷移學習實現高精度結果。

卓越性能
與傳統方法和其他AI測繪系統相比,AEF在不同時間段執行多種任務時,包括識別土地利用和估算地表屬性等,始終保持最高準確性。
例如在某土地覆蓋分類任務中,AEF的平衡準確率達0.82,而次優模型僅0.69。
AEF尤其在標簽數據稀缺場景下表現出色,平均錯誤率比測試模型低24%,展現出卓越的學習效率。

從具體應用場景來看,AEF在主題映射(如土地覆蓋分類)、生物物理變量估計和變化檢測中表現全面。
例如,在年度土地覆蓋變化識別中,它能精準區分森林、農田、城市等類型,對細微變化的捕捉誤差遠低于傳統方法。

衛星嵌入數據集
在谷歌地球引擎中,由AEF驅動的衛星嵌入數據集是同類規模中最大的數據集之一,每年包含超過1.4萬億個潛入足跡。目前已在Earth Engine數據目錄發布。
這一系列年度嵌入數據已被全球多個組織采用,其中包括聯合國糧食及農業組織、哈佛森林、地球觀測組織等。它們借助該數據集制作功能強大的自定義地圖。
例如,“全球生態系統地圖集”這一項目旨在打造首個全面資源,用于繪制和監測全球生態系統。該項目正利用此數據集幫助各國將未測繪的生態系統劃分為海岸灌叢、極端干旱沙漠等類別。
全球生態系統地圖集全球科學負責人Nick Murray說:
衛星嵌入數據集正在徹底改變我們的工作,它幫助各國繪制未知生態系統的地圖——這對于精準定位保護工作的重點區域至關重要。

△展示衛星嵌入數據集從粗到精的分割的無監督聚類動畫
巴西MapBiomas團隊正在測試該數據集,以更深入地了解全國范圍內的農業和環境變化,它為亞馬遜雨林等關鍵生態系統的保護策略和可持續發展舉措提供了重要依據。
AEF還有助于解決糧食安全、森林砍伐和水資源等關鍵問題。
對此,有網友表示:人工智能模型正在成為公共基礎設施。

畢竟,看懂地球才能更好保護它。
論文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/alphaearth-foundations.pdf




























