地球級AI智能體爆誕!谷歌地球開外掛,一夜為20億人洪水預警
地理AI,還得看谷歌!
谷歌首次實現地球尺度的復雜地理空間推理,把地球變成「可計算對象」。
基于數十年在世界建模上的經驗,結合Gemini的先進推理能力,谷歌重磅升級Earth AI——
從環境監測到災害響應,盡在其中。

谷歌地球AI「Google Earth AI」是一系列地理空間AI模型和數據集,其中包括由Gemini驅動的地理空間推理模型,可自動連接不同的地球AI模型——天氣預報、人口地圖和衛星圖像——并回答不同的問題。
此前,谷歌在Gemini API中上線了谷歌地圖工具。
谷歌地球開外掛, 不止Gemini當導游
單個AI能力日益強大,但現實世界的問題常常需要融合跨領域知識。
臺風可能在哪里登陸?哪些社區最不安全?應如何防臺風?
要回答這類問題,需統籌處理影像、人口與環境數據,綜合推理。
今年,谷歌推出的地球AI因此而生。
但這次,結合強大的基礎模型與Gemini的空間推理智能體,谷歌首次實現了「地球尺度」的復雜現實問題推理能力。
基于真實世界數據,基礎模型提供對地球的深度認知。
而智能體則扮演智慧指揮者角色:將復雜問題拆解為多步驟方案,通過調用基礎模型、查詢海量數據庫、運用地理空間工具執行計劃,最終融合各階段成果形成整體解決方案。

今日,谷歌重磅推出Earth AI全新創新成果:
- 發布新一代影像與人口基礎模型,并公布技術細節和評估報告
- 提出空間推理智能體

研究表明,借助地理空間推理,分析人員不再僅能預測風暴路徑,更能一次性鎖定最脆弱的社區與高危基礎設施。
例如,非營利組織GiveDirectly通過融合洪水數據與人口密度信息,精準定位急需援助的受災群體,提升救災效率。

谷歌表示,自去年開始試點的集成對話功能,可幫助用戶在衛星影像中發現目標與規律。例如,用戶只需輸入「查找藻華」,即可讓谷歌地球監控飲用水源狀況。
這項研究令人振奮之處在于它正在推動的重要AI落地應用:
- 波士頓兒童醫院開展的精準社區健康干預
- GiveDirectly在災害中快速定位最需援助的群體
- 世界衛生組織非洲區預測霍亂暴發風險區的行動
- 空中客車通過檢測植被侵占輸電線路幫助客戶預防停電
- 以及芝加哥大學運用模型預測印度季風季來臨,并與印度農業與農民福利部合作,向3800萬農民發送精準預報。
谷歌也有實用的AI落地功能——
在2025年加州山火期間,谷歌向洛杉磯地區1500萬人推送了危機警報,并在地圖中實時顯示可前往的避難所位置。

這些成果背后,正是谷歌在地理空間AI領域的深厚積累——其模型不僅用于洪水與山火預警,也涵蓋氣旋、空氣質量等眾多場景。
谷歌首次實現地球尺度的推理
在最新發布的技術論文中,谷歌首次公開「遙感基礎模型」與「人口動力學基礎模型」,并展示了地理空間推理智能體的強大能力:
- 智能地理推理:基于Gemini的智能體,可協調多維度Earth AI模型,解答復雜跨模態問題。
- 深度洞察升級:谷歌地球集成Earth AI模型+Gemini功能,支持用戶通過自然語言在衛星影像中智能檢索目標。
- 云端開放接入:通過Google Cloud平臺,向可信測試者直接開放Earth AI核心模型(影像/人口/環境)。

傳送門:https://arxiv.org/abs/2510.18318
Earth AI建立在多源、多模態的地理空間數據與工具基礎上(下圖左側)。
之后,影像、人口與環境三大垂類領域子智能體與模型處理這些數據(下圖中部)。
最終由Earth AI地理空間推理智能體(下圖右側)進行全局整合,從而實現全方位的地理空間分析與洞察生成。

三大基礎模型:影像、人口、環境
遙感基礎模型簡化了三大核心能力, 加速了衛星影像分析。
首先,合成標注+網絡獲取的數據,構成了核心組件訓練數據集。
訓練好的視覺語言模型與開放詞匯檢測模型,可直接應用于分類、檢測與檢索任務;通過微調,視覺Transformer編碼器則可提升下游特定任務的表現。

遙感基礎模型的訓練與應用流程,核心為視覺語言模型、開放詞匯對象檢測模型、預訓練ViT編碼器
用戶可使用自然語言提出查詢,即可獲得快速精準的響應,如「找出暴雨后圖像中被淹沒的道路」。
基于海量高分辨率航拍影像與文本描述聯合訓練,在多項公開地球觀測基準測試中,遙感基礎模型取得突破性表現——
基于文本的圖像檢索任務平均提升超16%,而針對新類別物體的零樣本檢測精度,更達到基準線的兩倍以上。

要深入理解人類活動與地理環境之間復雜的互動關系,需要研究涵蓋「移動性AI」(Mobility AI)與「人口動力學基礎模型」(Population Dynamics Foundations)等領域。
在這次研究中,人口動力學基礎模型引入了兩項關鍵創新:
1、覆蓋17個國家的全球統一嵌入表示(embeddings);
2、按月更新的人類活動動態嵌入。
這些新特性對于時間敏感型預測尤為重要,因為它們能更精準地捕捉人類行為的變化節奏。
訓練分為兩階段——
第一階段為離線訓練:通過整合多元地理空間數據(地圖數據、搜索趨勢、人流活躍度及環境條件),生成緊湊的區域嵌入表征。
第二階段利用預訓練嵌入,針對細分下游任務進行動態微調,實現局部統計數據的空間插值、外推、超分辨率重建及趨勢預測等功能。

人口動力學基礎模型雙階段框架
谷歌內部在17個國家的數據上評估了「人口動力學基礎模型」,結果顯示:在預測人口密度、樹木覆蓋率、夜間燈光強度和海拔高度四項指標時,各國R2評分(取值范圍0-1,數值越高越好)均表現優異。

按美國郵政編碼,谷歌可視化了人口動力學基礎嵌入向量的各維度相似度。不同維度上的模式反映了美國人口的多樣特征。

獨立研究結果也驗證了這一模型的強大性能。
比如,牛津大學的研究人員在預測巴西登革熱傳播時引入了該模型提供的嵌入表示,顯著提升了長期預測的準確性——12個月的 R2 值(衡量模型對實際發病率解釋程度的指標)從0.456提升至0.656。
之前,谷歌已實現中程天氣預報、季風爆發預測、空氣質量監測及河流洪水預警等領域的技術突破。
近期,更將環境模型升級至支持全球范圍降水臨近預報,并將重大河流洪水預警覆蓋范圍擴展至20億人口。
地理空間推理智能體:解鎖地球潛力
解決現實世界問題,需要融合多種專業模型的洞察。
地理空間AI的未來,不在于各自為政的單一模型,而在于由高級AI協調的、集成化的多模態生態系統。、
谷歌全新推出的Gemini驅動地理空間推理智能體,能夠智能協調這些Earth AI的不同能力。
研究證實:多模型融合,預測能力更強。
Earth AI的終極目標是幫助用戶解答需要跨模型、跨數據源多維推理的復雜現實問題。
此類查詢可按復雜度分為三個層級:
- 描述與檢索型詢:事實查找,如「2020年8月,紐約最高氣溫記錄是多少?」
- 分析與關聯型查詢:揭示不同數據源間的模式關聯,如「卡特里娜颶風登陸時,路易斯安那州有多少醫院位于遭受嚴重風暴影響的區域?」
- 預測或推斷型查詢:信息預測,如「到今年11月,印度哪些城市的脆弱人口面臨最高的洪水沖擊風險?」
為了解決三大復雜度類別的查詢,谷歌專門設計了「地理空間推理智能體」。
為了迭代優化響應, 智能體不斷重復「思考與規劃→數據操作/模型推理/訓練→反思與修正」循環,直至生成基于可靠依據的最終答案。

地理空間推理智能體運行框架
比如,當用戶需要識別受風暴威脅的特定脆弱人群時,智能體通過以下透明化推理步驟實現精準分析:
- 環境風險建模:調用環境模型,精準劃定受颶風級風力威脅的地理區域范圍
- 人口密度分析:查詢Data Commons人口統計庫,識別預測登陸區內的高人口密度縣市
- 行政邊界匹配:從BigQuery公共數據集獲取目標縣市的官方行政邊界數據
- 空間疊加計算:對風力影響區域與行政邊界,進行幾何空間交集運算
- 脆弱區域定位:基于人口動態基礎模型與縣級統計數據實時訓練機器學習模型,精準定位最脆弱的郵政編碼區域
- 關鍵設施識別:運用遙感基礎模型的目標檢測能力,在最脆弱區域的衛星影像中,自動識別醫院、避難所等關鍵基礎設施
這種分層推理機制將原始數據轉化為應對災害的決策知識,體現了多模態AI在應急管理領域的突破性應用。
為評估智能體性能,谷歌開發了兩種創新評估方法:基于公開數據構建的問答基準測試(含可驗證真實答案),以及面向復雜預測場景的危機響應案例研究。

Earth AI智能體將天氣模型、人口數據與地理空間分析有機結合,實現自動化的災害風險識別與可視化推理。
在問答基準測試中,地理空間推理智能體取得了0.82的綜合準確率,顯著優于Gemini 2.5 Pro(0.50)和Gemini 2.5 Flash(0.39)基線智能體。
這一結果印證了為智能體配備專業地理空間模型與工具對處理此類查詢的關鍵價值。

創新永無止境
過去兩周,從基因組學到量子計算乃至地理空間認知領域,谷歌研究院取得了一系列新成果。

這些突破完美印證了谷歌研究負責人Yossi Matias所提出的「魔法循環」研究模式:通過基礎研究應對全球性挑戰與機遇,并直接轉化為現實應用方案。
這些方案不僅惠及全球數億民眾,更不斷揭示出待探索的新課題。
研究是人類改善日常生活、應對社會挑戰、把握時代機遇的必經之路,這也意味著科研與創新永無止境。

在更強的模型與智能工具驅動下,魔法循環正在加速運轉,產生跨學科領域的連鎖反應。

































