AI 时代,更需要以资产为核心的数据建模

近年来,像 Snowflake、Databricks 这样的现代数据平台正在深刻改变企业管理和分析数据的方式。它们在数据存储、计算能力和分析能力方面都非常强大。

但当这些技术进入工业领域时,有一个概念却依然至关重要,而且常常被现代数据平台忽视:以资产为核心的数据建模(Asset-Centric Data Modeling)。

这个理念其实并不新。几十年前,PI System 就通过 Asset Framework 将这一思想引入工业数据管理领域。虽然技术已经发生了巨大变化,但这个核心思想在今天依然成立——甚至在 AI 时代显得更加重要。

工业数据不仅仅是时间序列

工业系统每天都会产生海量的遥测数据,例如:

  • 温度
  • 压力
  • 流量
  • 振动信号
  • 能耗
  • 设备状态

乍一看,这些似乎只是普通的时间序列数据。但实际上,每一条信号都属于现实世界中的某个物理对象。例如,一条振动信号并不仅仅是一条数据流,它属于某一台电机;这台电机属于某一台泵;这台泵又属于某条生产线;而这条生产线属于某个工厂。

换句话说,工业数据始终存在于具体的资产上下文之中。如果脱离了这些资产关系,数据本身很快就会失去意义。

很多现代数据平台擅长存储海量的原始遥测数据,但这并不意味着 AI 就能理解这些数据。AI 不仅需要数据,还需要结构和语义。例如,我们提出一个很简单的问题:为什么昨天的产量下降了?

要回答这个问题,一个 AI 系统必须知道:

  • 涉及哪些设备
  • 设备之间如何连接
  • 当时运行的是哪个工艺流程
  • 那段时间发生了哪些事件
AI 时代,更需要以资产为核心的数据建模 - TDengine Database 时序数据库

资产模型为工业数据提供语义

以资产为核心的数据建模,为工业数据提供了必要的结构。一个典型的资产层级可能是:

工厂

├─ 生产线 A

│ ├─ 搅拌机

│ └─ 泵

└─ 生产线 B

每一个资产都可以包含一组属性,例如:

  • 温度
  • 振动
  • 功率
  • 运行状态

这样的结构不仅对工程师重要,对 AI 同样重要。工程师通过设备理解系统。AI 则通过资产之间的关系理解系统。

许多现代数据平台缺少这一层

现代云数据平台非常擅长存储和处理大规模数据,但它们通常把工业遥测数据简单地表示为:timestamp | tag | value,数据本身缺少语义。数据的含义需要由应用层去解释。

这种方式在传统数据分析场景中可以工作,但在工业 AI 场景中就会带来明显的问题。因为每一个 AI 项目都不得不先重建一遍资产模型,才能开始真正的分析。

资产上下文让工业 AI 成为可能

事件理解:设备停机、批次生产等事件可以在资产上下文中被正确理解。

跨设备分析:AI 可以分析不同设备之间的相互影响。

可解释的洞察:分析结果能够明确指向具体设备和工艺,而不是抽象的数据指标。

如果缺少资产上下文,AI 的分析结果往往难以解释,也难以让工程师信任。

AI 时代,更需要以资产为核心的数据建模 - TDengine Database 时序数据库

从数据历史库到 AI 就绪的工业数据基础基座

传统的数据历史库引入资产模型,主要是为了改善数据导航和可视化。但在 AI 时代,资产模型的角色已经发生变化。它成为连接原始遥测数据与智能决策之间的语义层。一个现代工业数据平台应该同时具备:

  • 高性能时序数据基础设施
  • 以资产为核心的数据建模
  • 实时分析能力
  • AI 驱动的数据洞察

只有当这些能力协同工作时,智能才能真正从工业数据中“涌现”。

结语

AI 时代不会削弱以资产为核心的数据建模的重要性。恰恰相反,它让这一能力变得更加关键。

原始遥测数据提供的是信号,资产模型提供的是意义。而没有意义,AI 就无法理解工业系统所代表的真实世界。

未来的工业数据平台,将不再只是数据库,而是一套统一的数据基础设施,在其中数据、上下文、分析和 AI紧密结合,让智能直接从工业运行数据中产生。