AI驱动的遗留系统现代化:将机器智能集成到ERP、SCADA和本地化部署系统中
将AI集成到遗留系统是企业数字化转型中最关键、也最容易被低估的工程挑战之一。大多数AI项目的失败并非源于模型本身,而是因为数据存放在运行了15年的SAP实例中、使用专有协议的SCADA历史数据库中,或是无人敢碰的本地Oracle数据库中。
AI层本身的构建并不困难。真正让项目陷入停滞的,是从根深蒂固的遗留系统中提取干净、一致、实时的数据,并将处理结果回写到业务运营工作流中。
本指南涵盖工程团队在为涉及遗留基础设施的AI现代化项目选型供应商之前,需要理解的技术模式、集成策略和架构决策。
目录
遗留系统AI集成为何失败
遗留系统的设计目标是保证事务完整性,而非分析可访问性。ERP系统针对记录管理进行了优化,SCADA系统针对实时控制进行了优化,本地数据库针对ACID合规性进行了优化。这些系统均未被设计为在推理时向机器学习模型提供特征向量。
数据所在位置与AI所需位置之间的鸿沟,造成了三个核心集成挑战:
- 提取(Extraction):从未针对大规模查询设计的系统中获取数据
- 规范化(Normalization):解决跨系统的Schema不一致、单位不匹配和时间对齐问题
- 回写(Actuation):在不破坏现有流程的前提下,将模型输出回写到遗留工作流
只能解决上述三点中一到两点的供应商,提供的不是完整的解决方案——而是一个团队难以投入生产的原型。
遗留系统AI集成技术栈
flowchart TB
subgraph AI["AI / ML 层"]
A1[模型训练]
A2[推理引擎]
A3[监控 & 数据漂移检测]
end
subgraph INT["集成层"]
I1[特征存储]
I2[API网关]
I3[CDC / 流处理器]
end
subgraph SRC["遗留系统"]
S1["ERP\n(SAP / Oracle)"]
S2["SCADA / IoT\n(OPC-UA / MQTT)"]
S3["本地数据库\n& API"]
end
S1 -->|OData / BAPI / CDC| I2
S2 -->|OPC-UA / REST| I3
S3 -->|ETL / CDC| I3
I2 --> I1
I3 --> I1
I1 --> A1
I1 --> A2
A2 -->|预测结果| I2
I2 -->|数据回写| S1
A3 -.->|告警| I2
核心洞察:集成层是最关键的中间层。大多数AI项目的失败发生在这里——而非模型本身。
按系统类型划分的集成模式
ERP系统(SAP、Oracle)
SAP、Oracle EBS、Oracle Fusion等ERP系统是采购、财务、制造和供应链运营的核心支柱。数十年积累的事务历史数据——采购订单、生产计划、库存移动、供应商绩效记录——对需求预测、异常检测和流程优化等AI应用场景具有极高价值。
集成挑战:SAP和Oracle通过BAPI、IDoc、OData API(SAP)和数据库视图的组合来暴露数据。强烈不建议直接访问数据库,否则有失去供应商支持协议的风险。
与SAP/Oracle ERP进行实时AI集成需要采用以下方法之一:
- SAP集成套件 / Oracle集成云:无需直接访问数据库即可提供事件驱动数据流的原生中间件
- 变更数据捕获(CDC):通过Debezium、Oracle GoldenGate或SAP Landscape Transformation进行基于日志的复制,将事务变更流式传输到下游数据平台
- RFC/BAPI轮询:适用于低频批处理场景,但会引入延迟并增加ERP负载
| 方法 | 延迟 | ERP负载 | 风险等级 | 适用场景 |
|---|---|---|---|---|
| SAP集成套件 / OIC | 低至中 | 低 | 低 | 事件驱动实时数据流 |
| CDC(Debezium、GoldenGate) | 近实时 | 极低 | 中 | 向数据平台的大容量流式传输 |
| RFC/BAPI轮询 | 中至高 | 中 | 低 | 低频批处理场景 |
| 直接数据库访问 | 低 | 高 | 极高 | ⚠ 应避免——有失去供应商支持的风险 |
需要向供应商确认的问题:能否在不需要数据库凭证的情况下运行?是否具备SAP或Oracle认证连接器的实施经验?能否在ERP版本更新时处理IDoc解析和BAPI Schema演变?
ERP系统的AI应用场景:
- 基于历史销售订单和库存移动数据的需求预测
- 基于采购和交货绩效数据的供应商风险评分
- 基于工单和资产历史的预测性维护排程
- 基于应付账款事务模式的发票异常检测
闭环回写:AI输出必须以可执行记录的形式回写至ERP——采购订单建议、维护工单、标记事务——须通过授权API(SAP BAPI调用、Oracle REST API)进行,而非直接写入数据库。跳过此步骤的供应商提供的是仪表板,而非生产级AI。
SCADA与工业物联网
SCADA AI集成呈现出与ERP截然不同的特征。数据量大(1至100Hz的传感器轮询很常见)、延迟要求严格,集成错误的后果可能是物理性的——设备损坏、安全事故、监管违规。
集成挑战:SCADA历史数据库(OSIsoft PI、Wonderware、Ignition)使用专有的时序存储格式和查询语言。OPC-UA和OPC-DA是主要的工业协议,但OPC-DA仅支持Windows,基于COM/DCOM,与容器化环境的桥接极为困难。
现代SCADA机器学习集成方法:
- OPC-UA到MQTT的桥接:将OPC-UA标签订阅转换为MQTT主题,通过消息代理(Mosquitto、EMQX、AWS IoT Core)摄入到流处理层
- 历史数据库REST API:OSIsoft PI Web API和Ignition内置REST接口提供时序查询,无需依赖专有SDK
- 边缘计算层:在工业边缘硬件(Advantech、Siemens IPC)上部署轻量级推理容器(ONNX Runtime、TensorFlow Lite),在数据源附近执行推理,降低延迟和云端往返带宽需求
网络隔离是硬性约束:大多数工业环境强制执行严格的IT/OT网络隔离(Purdue模型、ISA-95)。提议在不处理DMZ的情况下将原始SCADA数据直接传输到云端ML平台的供应商,尚未做好生产环境的准备。
Purdue模型:AI在OT网络架构中的位置
flowchart TB
subgraph L4["第4层 — 企业网络"]
ERP["ERP / IT系统"]
AI["AI平台\n(训练 + 监控)"]
end
subgraph DMZ["DMZ / 防火墙"]
GW["数据二极管 / 安全网关"]
end
subgraph L3["第3层 — 运营网络"]
HIST["历史数据库\n(OSIsoft PI / Ignition)"]
EDGE["边缘推理节点\n(ONNX / TFLite)"]
end
subgraph L2["第2层 — SCADA / HMI"]
SCADA["SCADA / HMI"]
end
subgraph L1["第1至0层 — 现场设备"]
PLC["PLC / DCS / 传感器\n(1至100Hz轮询)"]
end
PLC -->|OPC-UA| SCADA
SCADA -->|标签订阅| HIST
HIST -->|REST API| GW
GW -->|规范化时序数据| AI
HIST --> EDGE
EDGE -->|推理结果| GW
GW -->|工单 / 告警| ERP
AI推理应在第3层或边缘(第2至3层边界)运行。切勿将原始传感器数据跨DMZ传输到云端进行实时推理。
SCADA与工业物联网的AI应用场景:
| 应用场景 | 输入数据 | 模型类型 | 输出 |
|---|---|---|---|
| 预测性维护 | 振动、温度、压力 | 时序异常检测 | 故障概率 + 预计剩余寿命 |
| 流程优化 | 多变量传感器数据流 | 回归 / 强化学习 | 设定点推荐值 |
| 质量控制 | 在线传感器 + 生产参数 | 分类 | 合格/不合格 + 根因分析 |
| 异常检测 | 多变量传感器基线 | 自编码器 / 孤立森林 | 偏差分数 + 告警 |
供应商评估的关键问题:是否有在OT环境中的实际部署经验?是否理解历史数据库时序数据与事件驱动SCADA告警的区别?能否在气隙或DMZ约束的网络拓扑中运行?
本地数据库与内部API
本类别涵盖遗留基础设施的剩余部分:运行核心业务逻辑的PostgreSQL和SQL Server实例、封装在数十年前单体应用上的REST/SOAP API,以及来自过于老旧而无法暴露API的系统的基于文件的数据导出(CSV、XML、EDI)。
集成挑战:这些系统异构、文档不全,通常由少数掌握机构知识的工程师维护,且这些知识往往没有文字记录。Schema变更不频繁但影响重大。API契约非正式,有时跨版本不一致。
实用的本地AI集成方法:
- 语义层 / 数据虚拟化:dbt、Trino或Databricks Unity Catalog等工具无需物理移动数据,即可在分散的本地数据源上创建统一的查询接口
- API网关抽象:将遗留SOAP服务或未文档化的REST端点封装在受治理的API网关(Kong、Azure APIM)之后,即使底层系统演变,也能为AI流水线提供稳定的集成接口
- ETL到特征存储:定时ETL流水线(Airflow、Prefect)可提取、规范化并将特征加载到特征存储(Feast、Tecton、Hopsworks)中,ML模型在推理时无需接触生产数据库即可使用
需要警惕的情况:提议在实时推理时直接读取生产OLTP数据库的供应商,会引入降低应用程序性能的查询负载。应要求在生产系统与AI推理路径之间设置只读副本、物化视图或缓存层。
垂直集成:跨系统AI协同
当AI连接此前各自孤立的数据流时,AI驱动的垂直集成才真正展现其力量——同时构建横跨ERP、SCADA和运营数据库的智能。
案例:预测性维护与采购自动化的集成
某制造商使用SAP管理采购、使用OSIsoft PI监控设备,这两个数据源从未互相通信。垂直集成的AI层以闭环方式将它们连接起来:
sequenceDiagram
participant PI as OSIsoft PI历史数据库
participant EDGE as 边缘推理节点
participant AI as AI / ML平台
participant SAP as SAP ERP
participant ENG as 工程团队
PI->>EDGE: 振动 + 温度数据流(OPC-UA)
EDGE->>EDGE: 运行异常检测模型
EDGE->>AI: 故障概率分数 + 传感器快照
AI->>SAP: 查询备件库存和交货期(OData)
SAP-->>AI: 库存水平 + 供应商交货期
AI->>AI: 计算采购紧急度评分
alt 交货期 > 预测故障窗口
AI->>SAP: 创建采购申请(BAPI)
AI->>ENG: 发送维护建议告警
else 在安全窗口内
AI->>ENG: 仅发送建议性通知
end
该架构关闭了跨系统边界的运营闭环,此前这些环节需要维护、采购和运营团队之间的人工交接——消除了以往依赖人工协调的流程中数天的延迟。
这需要能够做系统集成的供应商,而不仅仅是ML。 许多AI供应商在建模方面能力很强,但将集成视为别人的问题。在遗留系统现代化项目中,集成能力与建模能力同等重要。
架构设计原则
无论选择哪家供应商,在评估任何遗留系统AI集成架构时,都应坚持以下五项原则:
1. 非侵入式提取:AI流水线不得修改遗留系统的配置、Schema或性能。使用CDC、历史数据库API和只读副本——绝不直接写入生产系统。
2. 推理解耦:AI模型不得位于遗留系统运营的关键路径上。即使ML服务宕机,ERP事务和SCADA控制回路也必须不受影响地持续运行。
3. 双向审计追踪:每一个触及遗留系统的AI生成动作——工单创建、采购申请、告警生成——都必须可追溯至生成该动作的模型版本、输入数据和时间戳。这在受监管行业中既是运营要求,也是合规要求。
4. Schema演变容错:遗留系统会发生变化。AI流水线必须优雅地处理Schema漂移——在遇到意外变更时明确报错,而非悄无声息地生成错误特征。
5. 增量部署:全量切换风险极高。要求在激活任何自动化之前,设置一个AI建议与现有人工流程并行运行的影子模式部署阶段,以便在实际运营条件下验证模型性能。
供应商评估标准
在评估遗留系统AI现代化的供应商时,不要仅停留在模型基准测试层面。真正的差异化问题在集成层:
| 评估维度 | 需要确认的内容 | 危险信号 |
|---|---|---|
| 连接器深度 | 是否有针对您使用的ERP版本/历史数据库的生产级连接器? | 声称"支持SAP"但无参考实施案例 |
| OT/IT边界经验 | 是否有在Purdue模型网络拓扑中工作的经验? | 提议从OT网络直接进行云端数据出口 |
| 回写能力 | 能否演示向遗留系统的闭环回写? | 仅提供仪表板,无回写功能 |
| 数据驻留 | 流水线能否完全在本地或私有云中运行? | 要求仅限云端部署 |
| MLOps交接 | 部署后谁负责监控和重新训练? | 无交接计划的永久供应商依赖 |
| IP与数据所有权 | 合同结束后,谁拥有模型权重和训练数据? | 合同中IP条款模糊或缺失 |
常见问题
能否在不替换现有系统的情况下将AI集成到遗留ERP中?
可以。非侵入式集成模式——CDC、OData API、BAPI连接器——允许AI流水线从SAP和Oracle等ERP系统提取数据并将结果回写,而无需修改核心系统配置或替换系统。
将AI集成到SCADA系统最安全的方式是什么?
在边缘(Purdue模型的L2至3层)部署推理,并使用安全的DMZ网关在OT和IT网络之间传输数据。切勿跨越OT/IT网络边界将原始传感器数据直接传输到云端ML平台进行实时推理。
遗留系统AI集成项目通常需要多长时间?
时间线因系统复杂度和数据成熟度而存在显著差异。针对单一系统的概念验证(如ERP需求预测)可在8至12周内完成。横跨ERP、SCADA和本地数据库的完整垂直集成,通常需要6至18个月才能完成生产部署。
本地AI部署需要哪些数据治理控制措施?
至少需要:数据血缘追踪、特征存储和模型端点的基于角色的访问控制、具备回滚能力的模型版本管理,以及所有AI回写到生产系统的审计日志。
结语
遗留系统不会消失——而最有价值的企业AI机会,恰恰存在于老旧基础设施与新兴智能的交汇处。工程挑战不在于构建模型,而在于构建集成层——使模型能够在数十年前设计的系统约束下真正投入运营,而那时机器学习还远未成为实际应用。
清晰界定集成接口,针对您实际使用的系统版本和网络拓扑来验证供应商的主张,并优先选择闭环架构而非仪表板。AI概念验证与能够交付可量化价值的生产系统之间的差距,几乎总是在于"管道工程"本身。
正在为遗留系统AI集成项目评估供应商?请将上方的供应商评分表作为RFP流程的起点。
Get in Touch with us
Related Posts
- AI-Driven Legacy Modernization: Integrating Machine Intelligence into ERP, SCADA, and On-Premise Systems
- The Price of Intelligence: What AI Really Costs
- 为什么你的 RAG 应用在生产环境中会失败(以及如何修复)
- Why Your RAG App Fails in Production (And How to Fix It)
- AI 时代的 AI-Assisted Programming:从《The Elements of Style》看如何写出更高质量的代码
- AI-Assisted Programming in the Age of AI: What *The Elements of Style* Teaches About Writing Better Code with Copilots
- AI取代人类的迷思:为什么2026年的企业仍然需要工程师与真正的软件系统
- The AI Replacement Myth: Why Enterprises Still Need Human Engineers and Real Software in 2026
- NSM vs AV vs IPS vs IDS vs EDR:你的企业安全体系还缺少什么?
- NSM vs AV vs IPS vs IDS vs EDR: What Your Security Architecture Is Probably Missing
- AI驱动的 Network Security Monitoring(NSM)
- AI-Powered Network Security Monitoring (NSM)
- 使用开源 + AI 构建企业级系统
- How to Build an Enterprise System Using Open-Source + AI
- AI会在2026年取代软件开发公司吗?企业管理层必须知道的真相
- Will AI Replace Software Development Agencies in 2026? The Brutal Truth for Enterprise Leaders
- 使用开源 + AI 构建企业级系统(2026 实战指南)
- How to Build an Enterprise System Using Open-Source + AI (2026 Practical Guide)
- AI赋能的软件开发 —— 为业务而生,而不仅仅是写代码
- AI-Powered Software Development — Built for Business, Not Just Code













