8月9日消息,近日,武漢大學與螞蟻集團聯合發布了新一代語義增強遙感大模型SkySense++,堪稱12邊型戰士。
其相關研究成果在國際知名學術期刊《自然·機器智能》上在線發表。
當前,遙感基礎大模型在復雜動態地球觀測場景應用中面臨挑戰,如多模態遙感影像數據融合性能欠佳、下游任務微調依賴大量數據、對遙感語義信息挖掘不足等。
為攻克這些難題,研究團隊基于前期多模態遙感大模型SkySense,研發出SkySense++。
SkySense++基于來自11個衛星載荷的2700萬組多模態遙感影像,采用兩階段漸進式學習完成預訓練。有效緩解了大模型對復雜微調流程和大量標注數據的依賴,極大提升了實用性與泛化性。
研究團隊在農業、林業、災害管理等7個領域的12種典型地球觀測任務中,對SkySense++進行全面評估。
實驗結果顯示,SkySense++ 在這12項任務中均表現卓越,性能優于其他模型。與同期最先進方法相比,在全量微調分類與檢測任務上,平均精度提升4.79%;在少樣本提示分割任務上,平均交并比提升14.08%。
SkySense++的前序版本SkySense,曾在國際計算機視覺領域頂會CVPR發表,并在2024年世界人工智能大會發布。
而此次SkySense++在農業生產評估、災害應急響應、國土資源監測等任務中,性能更為優異、穩定,還新增免微調部署能力。