AI驱动的遗留系统现代化:将机器智能集成到ERP、SCADA和本地化部署系统中

将AI集成到遗留系统是企业数字化转型中最关键、也最容易被低估的工程挑战之一。大多数AI项目的失败并非源于模型本身,而是因为数据存放在运行了15年的SAP实例中、使用专有协议的SCADA历史数据库中,或是无人敢碰的本地Oracle数据库中。

AI层本身的构建并不困难。真正让项目陷入停滞的,是从根深蒂固的遗留系统中提取干净、一致、实时的数据,并将处理结果回写到业务运营工作流中。

本指南涵盖工程团队在为涉及遗留基础设施的AI现代化项目选型供应商之前,需要理解的技术模式、集成策略和架构决策。


目录

  1. 遗留系统AI集成为何失败
  2. 按系统类型划分的集成模式
  3. 垂直集成:跨系统AI协同
  4. 架构设计原则
  5. 供应商评估标准

遗留系统AI集成为何失败

遗留系统的设计目标是保证事务完整性,而非分析可访问性。ERP系统针对记录管理进行了优化,SCADA系统针对实时控制进行了优化,本地数据库针对ACID合规性进行了优化。这些系统均未被设计为在推理时向机器学习模型提供特征向量。

数据所在位置与AI所需位置之间的鸿沟,造成了三个核心集成挑战:

  1. 提取(Extraction):从未针对大规模查询设计的系统中获取数据
  2. 规范化(Normalization):解决跨系统的Schema不一致、单位不匹配和时间对齐问题
  3. 回写(Actuation):在不破坏现有流程的前提下,将模型输出回写到遗留工作流

只能解决上述三点中一到两点的供应商,提供的不是完整的解决方案——而是一个团队难以投入生产的原型。

遗留系统AI集成技术栈

flowchart TB
    subgraph AI["AI / ML 层"]
        A1[模型训练]
        A2[推理引擎]
        A3[监控 & 数据漂移检测]
    end

    subgraph INT["集成层"]
        I1[特征存储]
        I2[API网关]
        I3[CDC / 流处理器]
    end

    subgraph SRC["遗留系统"]
        S1["ERP\n(SAP / Oracle)"]
        S2["SCADA / IoT\n(OPC-UA / MQTT)"]
        S3["本地数据库\n& API"]
    end

    S1 -->|OData / BAPI / CDC| I2
    S2 -->|OPC-UA / REST| I3
    S3 -->|ETL / CDC| I3
    I2 --> I1
    I3 --> I1
    I1 --> A1
    I1 --> A2
    A2 -->|预测结果| I2
    I2 -->|数据回写| S1
    A3 -.->|告警| I2

核心洞察:集成层是最关键的中间层。大多数AI项目的失败发生在这里——而非模型本身。


按系统类型划分的集成模式

ERP系统(SAP、Oracle)

SAP、Oracle EBS、Oracle Fusion等ERP系统是采购、财务、制造和供应链运营的核心支柱。数十年积累的事务历史数据——采购订单、生产计划、库存移动、供应商绩效记录——对需求预测、异常检测和流程优化等AI应用场景具有极高价值。

集成挑战:SAP和Oracle通过BAPI、IDoc、OData API(SAP)和数据库视图的组合来暴露数据。强烈不建议直接访问数据库,否则有失去供应商支持协议的风险。

与SAP/Oracle ERP进行实时AI集成需要采用以下方法之一:

  • SAP集成套件 / Oracle集成云:无需直接访问数据库即可提供事件驱动数据流的原生中间件
  • 变更数据捕获(CDC):通过Debezium、Oracle GoldenGate或SAP Landscape Transformation进行基于日志的复制,将事务变更流式传输到下游数据平台
  • RFC/BAPI轮询:适用于低频批处理场景,但会引入延迟并增加ERP负载
方法 延迟 ERP负载 风险等级 适用场景
SAP集成套件 / OIC 低至中 事件驱动实时数据流
CDC(Debezium、GoldenGate) 近实时 极低 向数据平台的大容量流式传输
RFC/BAPI轮询 中至高 低频批处理场景
直接数据库访问 极高 ⚠ 应避免——有失去供应商支持的风险

需要向供应商确认的问题:能否在不需要数据库凭证的情况下运行?是否具备SAP或Oracle认证连接器的实施经验?能否在ERP版本更新时处理IDoc解析和BAPI Schema演变?

ERP系统的AI应用场景

  • 基于历史销售订单和库存移动数据的需求预测
  • 基于采购和交货绩效数据的供应商风险评分
  • 基于工单和资产历史的预测性维护排程
  • 基于应付账款事务模式的发票异常检测

闭环回写:AI输出必须以可执行记录的形式回写至ERP——采购订单建议、维护工单、标记事务——须通过授权API(SAP BAPI调用、Oracle REST API)进行,而非直接写入数据库。跳过此步骤的供应商提供的是仪表板,而非生产级AI。


SCADA与工业物联网

SCADA AI集成呈现出与ERP截然不同的特征。数据量大(1至100Hz的传感器轮询很常见)、延迟要求严格,集成错误的后果可能是物理性的——设备损坏、安全事故、监管违规。

集成挑战:SCADA历史数据库(OSIsoft PI、Wonderware、Ignition)使用专有的时序存储格式和查询语言。OPC-UA和OPC-DA是主要的工业协议,但OPC-DA仅支持Windows,基于COM/DCOM,与容器化环境的桥接极为困难。

现代SCADA机器学习集成方法:

  • OPC-UA到MQTT的桥接:将OPC-UA标签订阅转换为MQTT主题,通过消息代理(Mosquitto、EMQX、AWS IoT Core)摄入到流处理层
  • 历史数据库REST API:OSIsoft PI Web API和Ignition内置REST接口提供时序查询,无需依赖专有SDK
  • 边缘计算层:在工业边缘硬件(Advantech、Siemens IPC)上部署轻量级推理容器(ONNX Runtime、TensorFlow Lite),在数据源附近执行推理,降低延迟和云端往返带宽需求

网络隔离是硬性约束:大多数工业环境强制执行严格的IT/OT网络隔离(Purdue模型、ISA-95)。提议在不处理DMZ的情况下将原始SCADA数据直接传输到云端ML平台的供应商,尚未做好生产环境的准备。

Purdue模型:AI在OT网络架构中的位置

flowchart TB
    subgraph L4["第4层 — 企业网络"]
        ERP["ERP / IT系统"]
        AI["AI平台\n(训练 + 监控)"]
    end

    subgraph DMZ["DMZ / 防火墙"]
        GW["数据二极管 / 安全网关"]
    end

    subgraph L3["第3层 — 运营网络"]
        HIST["历史数据库\n(OSIsoft PI / Ignition)"]
        EDGE["边缘推理节点\n(ONNX / TFLite)"]
    end

    subgraph L2["第2层 — SCADA / HMI"]
        SCADA["SCADA / HMI"]
    end

    subgraph L1["第1至0层 — 现场设备"]
        PLC["PLC / DCS / 传感器\n(1至100Hz轮询)"]
    end

    PLC -->|OPC-UA| SCADA
    SCADA -->|标签订阅| HIST
    HIST -->|REST API| GW
    GW -->|规范化时序数据| AI
    HIST --> EDGE
    EDGE -->|推理结果| GW
    GW -->|工单 / 告警| ERP

AI推理应在第3层或边缘(第2至3层边界)运行。切勿将原始传感器数据跨DMZ传输到云端进行实时推理。

SCADA与工业物联网的AI应用场景

应用场景 输入数据 模型类型 输出
预测性维护 振动、温度、压力 时序异常检测 故障概率 + 预计剩余寿命
流程优化 多变量传感器数据流 回归 / 强化学习 设定点推荐值
质量控制 在线传感器 + 生产参数 分类 合格/不合格 + 根因分析
异常检测 多变量传感器基线 自编码器 / 孤立森林 偏差分数 + 告警

供应商评估的关键问题:是否有在OT环境中的实际部署经验?是否理解历史数据库时序数据与事件驱动SCADA告警的区别?能否在气隙或DMZ约束的网络拓扑中运行?


本地数据库与内部API

本类别涵盖遗留基础设施的剩余部分:运行核心业务逻辑的PostgreSQL和SQL Server实例、封装在数十年前单体应用上的REST/SOAP API,以及来自过于老旧而无法暴露API的系统的基于文件的数据导出(CSV、XML、EDI)。

集成挑战:这些系统异构、文档不全,通常由少数掌握机构知识的工程师维护,且这些知识往往没有文字记录。Schema变更不频繁但影响重大。API契约非正式,有时跨版本不一致。

实用的本地AI集成方法:

  • 语义层 / 数据虚拟化:dbt、Trino或Databricks Unity Catalog等工具无需物理移动数据,即可在分散的本地数据源上创建统一的查询接口
  • API网关抽象:将遗留SOAP服务或未文档化的REST端点封装在受治理的API网关(Kong、Azure APIM)之后,即使底层系统演变,也能为AI流水线提供稳定的集成接口
  • ETL到特征存储:定时ETL流水线(Airflow、Prefect)可提取、规范化并将特征加载到特征存储(Feast、Tecton、Hopsworks)中,ML模型在推理时无需接触生产数据库即可使用

需要警惕的情况:提议在实时推理时直接读取生产OLTP数据库的供应商,会引入降低应用程序性能的查询负载。应要求在生产系统与AI推理路径之间设置只读副本、物化视图或缓存层。


垂直集成:跨系统AI协同

当AI连接此前各自孤立的数据流时,AI驱动的垂直集成才真正展现其力量——同时构建横跨ERP、SCADA和运营数据库的智能。

案例:预测性维护与采购自动化的集成

某制造商使用SAP管理采购、使用OSIsoft PI监控设备,这两个数据源从未互相通信。垂直集成的AI层以闭环方式将它们连接起来:

sequenceDiagram
    participant PI as OSIsoft PI历史数据库
    participant EDGE as 边缘推理节点
    participant AI as AI / ML平台
    participant SAP as SAP ERP
    participant ENG as 工程团队

    PI->>EDGE: 振动 + 温度数据流(OPC-UA)
    EDGE->>EDGE: 运行异常检测模型
    EDGE->>AI: 故障概率分数 + 传感器快照
    AI->>SAP: 查询备件库存和交货期(OData)
    SAP-->>AI: 库存水平 + 供应商交货期
    AI->>AI: 计算采购紧急度评分
    alt 交货期 > 预测故障窗口
        AI->>SAP: 创建采购申请(BAPI)
        AI->>ENG: 发送维护建议告警
    else 在安全窗口内
        AI->>ENG: 仅发送建议性通知
    end

该架构关闭了跨系统边界的运营闭环,此前这些环节需要维护、采购和运营团队之间的人工交接——消除了以往依赖人工协调的流程中数天的延迟。

这需要能够做系统集成的供应商,而不仅仅是ML。 许多AI供应商在建模方面能力很强,但将集成视为别人的问题。在遗留系统现代化项目中,集成能力与建模能力同等重要。


架构设计原则

无论选择哪家供应商,在评估任何遗留系统AI集成架构时,都应坚持以下五项原则:

1. 非侵入式提取:AI流水线不得修改遗留系统的配置、Schema或性能。使用CDC、历史数据库API和只读副本——绝不直接写入生产系统。

2. 推理解耦:AI模型不得位于遗留系统运营的关键路径上。即使ML服务宕机,ERP事务和SCADA控制回路也必须不受影响地持续运行。

3. 双向审计追踪:每一个触及遗留系统的AI生成动作——工单创建、采购申请、告警生成——都必须可追溯至生成该动作的模型版本、输入数据和时间戳。这在受监管行业中既是运营要求,也是合规要求。

4. Schema演变容错:遗留系统会发生变化。AI流水线必须优雅地处理Schema漂移——在遇到意外变更时明确报错,而非悄无声息地生成错误特征。

5. 增量部署:全量切换风险极高。要求在激活任何自动化之前,设置一个AI建议与现有人工流程并行运行的影子模式部署阶段,以便在实际运营条件下验证模型性能。


供应商评估标准

在评估遗留系统AI现代化的供应商时,不要仅停留在模型基准测试层面。真正的差异化问题在集成层:

评估维度 需要确认的内容 危险信号
连接器深度 是否有针对您使用的ERP版本/历史数据库的生产级连接器? 声称"支持SAP"但无参考实施案例
OT/IT边界经验 是否有在Purdue模型网络拓扑中工作的经验? 提议从OT网络直接进行云端数据出口
回写能力 能否演示向遗留系统的闭环回写? 仅提供仪表板,无回写功能
数据驻留 流水线能否完全在本地或私有云中运行? 要求仅限云端部署
MLOps交接 部署后谁负责监控和重新训练? 无交接计划的永久供应商依赖
IP与数据所有权 合同结束后,谁拥有模型权重和训练数据? 合同中IP条款模糊或缺失

常见问题

能否在不替换现有系统的情况下将AI集成到遗留ERP中?
可以。非侵入式集成模式——CDC、OData API、BAPI连接器——允许AI流水线从SAP和Oracle等ERP系统提取数据并将结果回写,而无需修改核心系统配置或替换系统。

将AI集成到SCADA系统最安全的方式是什么?
在边缘(Purdue模型的L2至3层)部署推理,并使用安全的DMZ网关在OT和IT网络之间传输数据。切勿跨越OT/IT网络边界将原始传感器数据直接传输到云端ML平台进行实时推理。

遗留系统AI集成项目通常需要多长时间?
时间线因系统复杂度和数据成熟度而存在显著差异。针对单一系统的概念验证(如ERP需求预测)可在8至12周内完成。横跨ERP、SCADA和本地数据库的完整垂直集成,通常需要6至18个月才能完成生产部署。

本地AI部署需要哪些数据治理控制措施?
至少需要:数据血缘追踪、特征存储和模型端点的基于角色的访问控制、具备回滚能力的模型版本管理,以及所有AI回写到生产系统的审计日志。


结语

遗留系统不会消失——而最有价值的企业AI机会,恰恰存在于老旧基础设施与新兴智能的交汇处。工程挑战不在于构建模型,而在于构建集成层——使模型能够在数十年前设计的系统约束下真正投入运营,而那时机器学习还远未成为实际应用。

清晰界定集成接口,针对您实际使用的系统版本和网络拓扑来验证供应商的主张,并优先选择闭环架构而非仪表板。AI概念验证与能够交付可量化价值的生产系统之间的差距,几乎总是在于"管道工程"本身。


正在为遗留系统AI集成项目评估供应商?请将上方的供应商评分表作为RFP流程的起点。


Get in Touch with us

Chat with Us on LINE

iiitum1984

Speak to Us or Whatsapp

(+66) 83001 0222

Related Posts

Our Products