从大模型发展到遥感行业:AI赋能的一些思考
本文最后更新于 2026年5月6日 晚上
最近在准备一个”智慧矿区生态修复”的PPT,大纲里有一个点:AI能不能进入矿区生态修复的实际工作流。
这个问题用”能”或”不能”回答都没意义。我们都知道,技术方向听着都对,落到项目里得往下拆一层 — AI到底先碰到哪一步?数据整理、指标计算,还是结果判断?哪些环节它能省掉,哪些短期内还得人盯着。
我顺着这个问题往上,先看了大模型的发展路径。遥感其实很适合观察通用能力长成行业能力的过程,因为它本身就是一个典型的知识密集+工具密集的行业。
一、从”会说话”到”会做事”
Harness Engineering是什么?和提示词工程和上下文工程有什么关系?这是个很好的视频,里面总结了大模型发展的几个阶段:
- 通用大模型(Foundation Model):把泛化能力和知识覆盖面做起来。
- 工具增强(Tool Use / Agent):不再只回答问题,开始调用工具、执行任务。
- 垂直领域模型(Domain-Specific Model):进入医疗、金融、遥感等专业场景。
- 智能体系统(Agent System):多工具、多轮步骤,具备工作流能力。
从”会说话”,到”会做事”,再到”能把一件事做完”。
回到遥感行业,很多工作还停在”会说话”那一层 — 模型能讲原理,工具能跑流程,但把任务从头到尾串起来的东西还不多。

二、一个直觉问题
画大模型发展概念图的时候,脑子里冒出一个很具体的问题:
遥感解译,什么时候能做到”一句话直接出结果”?
这个问题离日常工作并不远。现在做遥感处理,大部分还是这两种方式:
- ENVI、ArcGIS、SNAP 等专业软件;
- Python + GDAL、rasterio、geemap 自己搭流程。
这些方式都能用,很多项目也确实这么跑下来的。共同点是:人还是那个把流程串起来的人。工具再多,最后还是人自己一步一步操作。
所以我想的不是”AI 能不能回答问题”,而是能不能让模型直接接管一部分操作。这一步走通了,接管的就是分析流程本身,不只是问答。

三、已经出现的早期形态
这种能力已经有了一些雏形。比如 scientific-agent-skills,里面能看到 Geospatial Science & Remote Sensing 相关的能力模块,支持”一句话生成某区域 NDVI”这类示例。
这类例子的价值不在于它有多完整,而在于它说明从语言理解到地理计算执行这条链路已经开始打通。当然,能打通链路和能在项目里稳定使用是两回事 — 遥感场景最不缺”理论上能跑”,最缺”跑起来不出问题”。
四、遥感不是一个”纯 AI 问题”

1. 云计算场景:GEE 这类平台很关键
大规模遥感计算里,Google Earth Engine(GEE)这类云平台几乎绕不开。一个直接的问题是:能不能让 AI 直接调用 GEE 接口?
思路上不复杂:模型理解用户意图 → 翻译成 GEE 脚本 → 调用接口执行 → 整理结果返回。这条链路如果能稳定跑通,用户体验会很接近:需求说出去,系统自己找数据、算指标、出结果,把大量”重复但不能少”的活先接过去。
LLM + API + 云计算平台 = 自动遥感分析系统,这已经有点”遥感智能体”的意思了,虽然在比较初级的阶段。
2. 本地/内网场景:更复杂,也更现实
更麻烦的是另一种常见情况:数据涉密、机房断网、外部 API 碰不了。这时问题变成:能不能在本地部署大模型,把遥感解译流程自动化起来?
我的判断是可以,但做法不能照搬云端那套。
五、两条可行路径
结合实际场景,有两条比较现实的路线。
路径一:模型调用专业软件
让模型”操作软件”,比如调用 ENVI 或 ArcGIS 的工具链执行现成流程。这个思路不新,问题也一直很明确:
- 工作流跨软件;
- 不同软件接口不统一;
- 自动化门槛高,维护成本也高。
这条路最大的问题不是模型能力,而是工具生态太碎 - 各有各的接口,流程跨几个系统后维护起来很累。
路径二:模型直接写代码
我个人更看好第二种:让模型直接生成标准化的遥感处理代码。比如指定使用 rasterio、GDAL、numpy,明确数据读取方式,约定 NDVI、分类、回归等计算流程。
但这条路有一个前提:需要建立一套解译标准体系 - 什么任务适合什么数据,什么数据适合什么方法,什么方法怎么组织成流程。模型本身不知道这些规则,得先把行业经验整理出来再喂给它。
对遥感行业来说,这一步往往比”把模型接上去”本身更重要。卡住的经常不是模型能力,而是行业经验有没有被说清楚、写清楚、固化下来。
六、真正的瓶颈往往不是模型,而是人
做这类思考时一个越来越强烈的感受:
AI 的上限很大程度取决于使用者的判断能力。

内网环境下这个问题更突出 - 模型不能联网验证,幻觉问题更容易暴露,结果最后还是得靠人工判断。真正能把 AI 用好的人,通常需要同时具备三种能力:
- 遥感专业知识;
- 数据理解能力;
- 对模型输出的判断能力。
换句话说,AI 不是替代专家,而是放大专家。遥感工作本来就依赖经验、上下文和判断,模型能把速度提上去,方向感还要人来给。
七、定量遥感和视觉任务,不是一回事
再往下拆,遥感任务大致分两类。这不是严格的学术分类,更多是工作中的体感。

1. 视觉类任务:相对成熟
变化检测、分类、目标识别这类任务,数据结构相对简单,模型路径比较清晰,更容易被 AI 接管 - 更接近”看图说话”的能力。
2. 定量遥感:复杂得多
定量遥感的问题已经不是”看图”,而是完整的数据工程和建模工程。
数据获取:卫星、气象、DEM 等多源数据并存,获取路径复杂,很多时候得自己拼接。
数据标准化:分辨率不同、时间不同、坐标系统不同。听着像基础工作,实际做起来最耗时间。
建模:怎么训练、怎么优化、怎么验证。还会牵出样本怎么来、标签靠不靠谱、评价指标选什么这些绕不过去的问题。
对这类问题,AI 可以帮忙,但很难一口吃掉整个流程。它更像效率工具,不是一个替你完成全部决策的黑箱。
八、当前 AI 的短板:复杂图像理解还不够
多模态模型进步很快,但在遥感场景里短板还是很明显。
单张图像的理解很多时候还可以。但任务一旦变复杂,要处理的就不只是”看一张图”:数十甚至上百张样本、反复对比分析、追踪变化趋势和时序关系。遥感很多判断不是一眼能下的,要把时间、空间和背景一起看进去。模型目前在”长期视觉推理”上的支持还不够稳定 - 它可以给出一个答案,但未必真的把变化过程看明白了。
这是遥感和普通图像任务之间一个很现实的分界点。
九、这些问题会很快被解决吗?
我的判断是会,而且不会太久。三个因素都在往前走:
- 工具调用能力正在快速成熟;
- 行业数据正在逐步结构化;
- 本地大模型部署成本在下降。
我能想象,未来的工作方式可能是:输入”帮我分析这个矿区近 5 年的植被恢复情况”,系统自动完成数据获取(GEE 或本地库)、预处理、指标计算(NDVI 等)、变化分析、结果可视化和报告生成。
这条链路稳定下来后,很多项目最费时间的那部分工作会被明显压缩 - 人还是要在场,但不需要每一步都亲手操作。
十、回到最初的问题:AI 能否赋能矿区生态修复?
答案是可行,正在发生,还需要工程化落地。
真正决定成败的不只是模型能力,而是三件事:数据体系、工具体系、行业知识的结构化。
对矿区生态修复来说,AI 最有价值的地方可能不是”替你下结论”,而是把原本分散、重复、耗时的分析流程,变成一个可调用、可复用、可检查的工作流。它更多是在帮我们整理工作,而不是替我们做判断。
写在最后
真正要问的也许不是”AI 能不能做遥感”,而是我们准备好让 AI 接管多少工作了。还有一个更具体的问题值得想:你现在的工作流程里,有多少步骤已经可以被语言描述?
一件事一旦能被清楚描述,它就离自动化不远了。