从大模型发展到遥感行业：AI赋能的一些思考

本文最后更新于 2026年5月6日晚上

最近在准备一个”智慧矿区生态修复”的PPT，大纲里有一个点：AI能不能进入矿区生态修复的实际工作流。

这个问题用”能”或”不能”回答都没意义。我们都知道，技术方向听着都对，落到项目里得往下拆一层 — AI到底先碰到哪一步？数据整理、指标计算，还是结果判断？哪些环节它能省掉，哪些短期内还得人盯着。

我顺着这个问题往上，先看了大模型的发展路径。遥感其实很适合观察通用能力长成行业能力的过程，因为它本身就是一个典型的知识密集+工具密集的行业。

一、从”会说话”到”会做事”

Harness Engineering是什么？和提示词工程和上下文工程有什么关系？这是个很好的视频，里面总结了大模型发展的几个阶段：

通用大模型（Foundation Model）：把泛化能力和知识覆盖面做起来。
工具增强（Tool Use / Agent）：不再只回答问题，开始调用工具、执行任务。
垂直领域模型（Domain-Specific Model）：进入医疗、金融、遥感等专业场景。
智能体系统（Agent System）：多工具、多轮步骤，具备工作流能力。

从”会说话”，到”会做事”，再到”能把一件事做完”。

回到遥感行业，很多工作还停在”会说话”那一层 — 模型能讲原理，工具能跑流程，但把任务从头到尾串起来的东西还不多。

二、一个直觉问题

画大模型发展概念图的时候，脑子里冒出一个很具体的问题：

遥感解译，什么时候能做到”一句话直接出结果”？

这个问题离日常工作并不远。现在做遥感处理，大部分还是这两种方式：

ENVI、ArcGIS、SNAP 等专业软件；
Python + GDAL、rasterio、geemap 自己搭流程。

这些方式都能用，很多项目也确实这么跑下来的。共同点是：人还是那个把流程串起来的人。工具再多，最后还是人自己一步一步操作。

所以我想的不是”AI 能不能回答问题”，而是能不能让模型直接接管一部分操作。这一步走通了，接管的就是分析流程本身，不只是问答。

三、已经出现的早期形态

这种能力已经有了一些雏形。比如 scientific-agent-skills，里面能看到 Geospatial Science & Remote Sensing 相关的能力模块，支持”一句话生成某区域 NDVI”这类示例。

这类例子的价值不在于它有多完整，而在于它说明从语言理解到地理计算执行这条链路已经开始打通。当然，能打通链路和能在项目里稳定使用是两回事 — 遥感场景最不缺”理论上能跑”，最缺”跑起来不出问题”。

四、遥感不是一个”纯 AI 问题”

1. 云计算场景：GEE 这类平台很关键

大规模遥感计算里，Google Earth Engine（GEE）这类云平台几乎绕不开。一个直接的问题是：能不能让 AI 直接调用 GEE 接口？

思路上不复杂：模型理解用户意图 → 翻译成 GEE 脚本 → 调用接口执行 → 整理结果返回。这条链路如果能稳定跑通，用户体验会很接近：需求说出去，系统自己找数据、算指标、出结果，把大量”重复但不能少”的活先接过去。

LLM + API + 云计算平台 = 自动遥感分析系统，这已经有点”遥感智能体”的意思了，虽然在比较初级的阶段。

2. 本地/内网场景：更复杂，也更现实

更麻烦的是另一种常见情况：数据涉密、机房断网、外部 API 碰不了。这时问题变成：能不能在本地部署大模型，把遥感解译流程自动化起来？

我的判断是可以，但做法不能照搬云端那套。

五、两条可行路径

结合实际场景，有两条比较现实的路线。

路径一：模型调用专业软件

让模型”操作软件”，比如调用 ENVI 或 ArcGIS 的工具链执行现成流程。这个思路不新，问题也一直很明确：

工作流跨软件；
不同软件接口不统一；
自动化门槛高，维护成本也高。

这条路最大的问题不是模型能力，而是工具生态太碎 - 各有各的接口，流程跨几个系统后维护起来很累。

路径二：模型直接写代码

我个人更看好第二种：让模型直接生成标准化的遥感处理代码。比如指定使用 rasterio、GDAL、numpy，明确数据读取方式，约定 NDVI、分类、回归等计算流程。

但这条路有一个前提：需要建立一套解译标准体系 - 什么任务适合什么数据，什么数据适合什么方法，什么方法怎么组织成流程。模型本身不知道这些规则，得先把行业经验整理出来再喂给它。

对遥感行业来说，这一步往往比”把模型接上去”本身更重要。卡住的经常不是模型能力，而是行业经验有没有被说清楚、写清楚、固化下来。

六、真正的瓶颈往往不是模型，而是人

做这类思考时一个越来越强烈的感受：

AI 的上限很大程度取决于使用者的判断能力。

内网环境下这个问题更突出 - 模型不能联网验证，幻觉问题更容易暴露，结果最后还是得靠人工判断。真正能把 AI 用好的人，通常需要同时具备三种能力：

遥感专业知识；
数据理解能力；
对模型输出的判断能力。

换句话说，AI 不是替代专家，而是放大专家。遥感工作本来就依赖经验、上下文和判断，模型能把速度提上去，方向感还要人来给。

七、定量遥感和视觉任务，不是一回事

再往下拆，遥感任务大致分两类。这不是严格的学术分类，更多是工作中的体感。

1. 视觉类任务：相对成熟

变化检测、分类、目标识别这类任务，数据结构相对简单，模型路径比较清晰，更容易被 AI 接管 - 更接近”看图说话”的能力。

2. 定量遥感：复杂得多

定量遥感的问题已经不是”看图”，而是完整的数据工程和建模工程。

数据获取：卫星、气象、DEM 等多源数据并存，获取路径复杂，很多时候得自己拼接。

数据标准化：分辨率不同、时间不同、坐标系统不同。听着像基础工作，实际做起来最耗时间。

建模：怎么训练、怎么优化、怎么验证。还会牵出样本怎么来、标签靠不靠谱、评价指标选什么这些绕不过去的问题。

对这类问题，AI 可以帮忙，但很难一口吃掉整个流程。它更像效率工具，不是一个替你完成全部决策的黑箱。

八、当前 AI 的短板：复杂图像理解还不够

多模态模型进步很快，但在遥感场景里短板还是很明显。

单张图像的理解很多时候还可以。但任务一旦变复杂，要处理的就不只是”看一张图”：数十甚至上百张样本、反复对比分析、追踪变化趋势和时序关系。遥感很多判断不是一眼能下的，要把时间、空间和背景一起看进去。模型目前在”长期视觉推理”上的支持还不够稳定 - 它可以给出一个答案，但未必真的把变化过程看明白了。

这是遥感和普通图像任务之间一个很现实的分界点。

九、这些问题会很快被解决吗？

我的判断是会，而且不会太久。三个因素都在往前走：

工具调用能力正在快速成熟；
行业数据正在逐步结构化；
本地大模型部署成本在下降。

我能想象，未来的工作方式可能是：输入”帮我分析这个矿区近 5 年的植被恢复情况”，系统自动完成数据获取（GEE 或本地库）、预处理、指标计算（NDVI 等）、变化分析、结果可视化和报告生成。

这条链路稳定下来后，很多项目最费时间的那部分工作会被明显压缩 - 人还是要在场，但不需要每一步都亲手操作。

十、回到最初的问题：AI 能否赋能矿区生态修复？

答案是可行，正在发生，还需要工程化落地。

真正决定成败的不只是模型能力，而是三件事：数据体系、工具体系、行业知识的结构化。

对矿区生态修复来说，AI 最有价值的地方可能不是”替你下结论”，而是把原本分散、重复、耗时的分析流程，变成一个可调用、可复用、可检查的工作流。它更多是在帮我们整理工作，而不是替我们做判断。

写在最后

真正要问的也许不是”AI 能不能做遥感”，而是我们准备好让 AI 接管多少工作了。还有一个更具体的问题值得想：你现在的工作流程里，有多少步骤已经可以被语言描述？

一件事一旦能被清楚描述，它就离自动化不远了。

工作心得

#AI #遥感 #大模型

从大模型发展到遥感行业：AI赋能的一些思考

https://bintodo.top/links/from-big-model-to-remote-sensing-ai.html

作者

bin

发布于

2026年5月6日

许可协议

在colab中使用geemap下载assets文件下一篇