一起奔跑,奔赴下一站:构建AI时代的工业数据基座

Jeff Tao

2026-03-09 /

就在一周前,TDengine TSDB 时序数据库在全球安装实例数超过一百万,遍布全球60多个国家和地区,这是一个相当令人兴奋的数字。2016年底,我看到物联网、工业互联网的高速发展,市场需要有一款高性能、具有水平扩展能力的时序数据库,因此开始人生的第三次创业,带着团队开发出TDengine TSDB, 并在2019年7月将其开源。这个一百万是团队努力、用户信任、开源社区支持、创业窗口把握得当的结果。

但兴奋的背后,内心仍然焦虑,因为与九年前相比,全球IT格局已经完全改变。从2022年底ChatGPT发布起,人类迎来了一场新的工业革命,AI浪潮席卷全球,各种大模型不停迭代,推理能力也越来越强,训练、推理成本也越来越低。2024年起,AI Agent开始流行,一个简单的对话框就颠覆了很多传统的IT系统,以前需要耗费很多人力开发的软件,现在可以及时生成。大家发现,程序员的价值大幅缩水,甚至可以不需要了。以我们涛思数据为例,人事部门的周子衿就用AI生成了年会抽奖程序,开发出了招聘AI Agent,公司任何人都可以写出自动化测试脚本,这在以前是不可想象的。

作为一家2B软件公司,在AI时代我们何去何从?涛思数据是否还有价值?TDengine TSDB是否已经走到尽头?过去一年多,我一直在思考这个问题。我的结论越来越清晰:TDengine 的旅程,才刚刚开始。我们真正要打造的,不只是一个时序数据库,而是构建一个AI时代的工业数据基座 (Building Industrial Data Foundation for AI Era)。而实现这件事的关键,就是:TSDB + IDMP

AI 时代稀缺的不是功能,而是面向 AI 的数据基座

很多人认为 AI 会吞噬所有软件,这是一种误解。更准确的判断是:AI 不会让软件产品消失,AI 会让“低壁垒的功能产品”失去存在价值。AI Agent 的核心能力是:把“一个功能”变成“按需生成的能力”。

过去的软件形态是:功能 → 产品,现在变成:需求 → AI即时完成。例如活动的抽奖程序,会议记录,产品的自动化测试例,现在就可以由AI即时生成。

这些软件的共同特点是:单一功能、规则清晰、不依赖复杂数据、不涉及关键业务流程、不需要长期积累 。换句话说:一个聪明的 Prompt 就可以替代它们。因此,最先被冲击的,是“功能型软件”。

当 AI 能够即时生成你需要的功能时,企业真正需要的,不再是一个软件工具,而是:能够承载数据、流程、上下文和决策的系统,也就是一个AI时代的数据基座 。

一个企业不会因为 AI 能写报表、回答各种问题,就不需要数据采集系统、不需要数据库、不需要资产模型、生产监控以及可靠的数据基础设施了。AI 可以生成洞察,但无法替代数据的来源和结构。就像:AI 可以分析发动机数据 ,但不会替代发动机本身。

这也是为什么,我们决定把 TDengine 从一个时序数据库,发展成为一个面向AI 的工业数据基座。

工业领域是AI时代最难被颠覆的行业之一

在消费互联网领域,AI 可以迅速替代很多工具。但在工业领域,情况完全不同。工业数据具有几个关键特征:

  • 强实时性:毫秒级采集、秒级分析
  • 强上下文:每个数据点都与设备、工艺、班次、订单相关
  • 数据源类型多:不同设备的数据接口不一致、数据标准不一致
  • 高可靠性要求:错误可能导致停产甚至事故
  • 数据规模巨大:数万到数千万时间序列

AI 不可能处理海量的实时数据,更无法处理无上下文,没有统一标准的数据。这些特征决定,我们必须建立强大的工业数据基座,而且向AI开放接口,让其能轻易获取具有上下文、业务语义的数据,构建出各种工业应用,获得实时的业务洞察。AI无法取代这样的工业数据基座,而是完全依赖它。

为什么需要 IDMP工业数据管理平台

时序数据库负责把采集的工业数据存储起来,但是规模稍微大一点的企业,动辄就是几十万甚至数千万的时间线(测点),我们的一个新能源客户,测点数就超过三千万。怎么找到一个测点,以及测点之间的关联关系,我们必须有一个数据目录,或是数据地图,否则依赖AI去找,消耗的资源太大,而且不可靠。

工业上,有各种各样的数据源,有SCADA, DCS, Controller 等,每种数据源有自己接口和标准,计量单位不一致,命名不一致,因此我们必须要有数据的标准化。否则在AI读到一个数220的时候,这是电压,还是温度,都难以区分。Dianya, Voltage、DY几个词是否都表示电压,只会让 AI 幻觉严重。

另一方面,数据的采集是持续不断的,只有附上批次、订单、班次等信息后,才有真正的业务价值。不同订单的工艺配置是完全不一样的,数据特征会不一样,如果不标注出来,只会让AI的幻觉雪上加霜,因此数据的情景化是必须的,离开情景化,数据就是孤零零的一个浮点数、状态量,不具备任何业务含义。

因此任何工业数据基座,都必须有一个管理平台,这个平台负责数据目录、数据标准化和数据情景化。有了这样的一个平台,AI 才能真正的发挥作用,这个平台就是 IDMP 工业数据管理平台 (Industrial Data Management Platform) 。

幸运的是,我从2017年起就关注PI System,三年前,又开始仔细研究它的产品。PI Asset Framework 较为完美的解决了数据目录、标准化和情景化的问题。2024年中旬,看到AI的兴起,我下定决心开发IDMP,调动公司的研发资源,进行开发。2025年初 DeepSeek 的爆火,加速了AI发展的进程,也迫使我全身心的投入到IDMP的开发中。

然而,仅仅把数据组织好、管理好还远远不够。工业数据平台的最终目标,并不是存储数据,而是帮助用户展示数据、理解数据、发现问题并做出决策。如果数据只能被查询,却无法被洞察,那么再好的数据平台,其价值仍然是有限的。因此,在 IDMP 的设计之初,我还在思考一个问题:在 AI 时代,工业数据可视化到底应该扮演什么角色?

一起奔跑,奔赴下一站:构建AI时代的工业数据基座 - TDengine Database 时序数据库

TDengine 工业数据基座架构图

可视化正在从“展示数据”走向“洞察数据”

在传统工业软件中,可视化的核心功能非常简单:展示当前状态和历史趋势。无论是SCADA系统、传统数据采集系统,还是后来的工业互联网平台,可视化通常意味着几种固定的形式:实时数值、趋势曲线、简单报表,以及各种状态灯和仪表盘。中国很多工业互联网平台甚至把重点放在炫酷的大屏展示上,大量3D效果、动画效果和现代的界面设计,看上去非常震撼,但本质上仍然只是对当前状态的一种视觉呈现。

这种可视化方式在过去是合理的,因为传统软件的能力主要集中在数据采集和数据展示上,系统能够做到的事情也只是把数据展示出来,让人去理解、分析并做出决策。可视化的目标是“看见数据”,而不是“理解数据”。但在AI时代,可视化的意义应该发生根本变化。

因此在设计IDMP的可视化时,我们就不想让它成为传统意义上的图表系统,而是一个围绕“数据洞察”的分析平台。它不仅能够展示数据,还能够帮助用户理解数据的变化规律,发现隐藏在数据背后的模式,并把复杂的数据分析结果以直观的方式呈现出来,让它成为数据分析与决策支持的重要入口。

例如,在工业生产中,事件(Event)是非常重要的分析对象。设备的异常、工艺的变化、生产批次的差异,往往都体现在一系列事件之中。传统系统只能把这些事件记录下来,但很难进行系统化分析。而在IDMP中,用户可以很方便地对不同事件进行对比分析,例如对比不同批次生产过程中的温度、压力、能耗曲线,从中找出影响产品质量或能耗效率的关键因素。

在此基础上,IDMP还可以利用时间序列分析与AI算法,对未来数据进行预测,对缺失数据进行补全,对异常数据进行自动检测,并在检测到异常后生成事件分析报告。系统不仅能够告诉用户“发生了什么”,还能够进一步分析“为什么会发生”,并生成初步的根因分析报告。这些分析结果并不是以复杂的算法输出形式呈现,而是通过可视化方式,让用户能够快速理解和判断。

因此,IDMP的可视化与传统工业软件的可视化有着本质区别。传统可视化关注的是“展示”,而IDMP关注的是“洞察”;传统可视化的目标是让用户看到数据,而IDMP的目标是让用户理解数据,并基于数据做出更好的决策。

开放的系统才能让AI真正发挥作用

AI 时代的软件有一个最重要的特征:生态在快速变化。新的模型、新的 Agent、新的工具每天都在出现。如果一个系统是封闭的,它很快就会被时代淘汰。因此,AI时代的数据基座必须是开放的系统

TDengine 在设计时就坚持这一点。首先,我们提供 MCP 接口,让 AI Agent 可以直接访问 TDengine 中的数据。其次,TDengine 支持将数据实时发布到Kafka,MQTT Broker和其他各种消息队列。而且从TDengine发布的第一个版本起,我们就允许应用直接订阅 TDengine 的数据流。工业数据不只是被查询,还可以被实时消费。

MCP,发布、订阅这些接口的支持,意味着 TDengine 不只是一个数据库,而是一个数据基座AI Agent、工业应用、数字孪生系统,都可以围绕这个基座构建。

开放的好处不用多言,但工业场景的数据安全与隐私,给开放系统带来了巨大的挑战。设计之初,我们就充分考虑了这个因素。我们的解决方式是通过基于角色的权限管理,基于数据资产的树状结构目录,让一个用户只能访问到它可以访问的数据。资产模型和数据目录的价值得到了充分的体现。

我坚信,只有开放的系统,才能真正成为 AI 时代的工业数据基座

一起奔跑,奔赴下一站:构建AI时代的工业数据基座 - TDengine Database 时序数据库

TDengine IDMP 能比较多个事件,可对齐开始时间、归一化,做批次分析 

TSDB + IDMP 的组合是一完美的AI时代的工业数据基座

工业数据平台实际上有三层核心能力。第一层是数据基础设施:实时采集、高速写入、海量存储与高性能查询,这正是 TSDB 的能力。工业现场的数据具有高频率、高并发和长期积累的特点,如果没有高性能的时序数据库作为底座,再好的数据分析和AI能力都无法落地。TSDB解决的是工业数据最基础、也是最困难的问题:如何稳定、高效、长期地保存海量工业数据,并能够在毫秒级完成查询和分析。

第二层是数据语义层:数据目录、数据标准化、数据情景化,这正是 IDMP 的能力。工业数据并不是简单的数字集合,而是与设备、工艺、订单、班次等业务上下文紧密关联的数据体系。如果没有语义层的支撑,AI看到的只是孤立的时间序列,而不是具有业务含义的工业数据。IDMP通过资产模型、数据目录和情景化机制,把这些数据组织成一个具有业务语义的数据体系,使AI能够真正理解工业现场发生了什么。

第三层是数据分析与洞察层:基于采集的数据进行预测、异常检测、事件分析以及根因分析,并通过可视化方式把这些结果呈现出来,从而帮助用户理解生产过程并形成决策依据。这一层并不是简单的报表系统,而是围绕数据洞察构建的分析能力,它使工业数据从“被记录的数据”转变为“能够产生价值的数据”。

当 TSDB 与 IDMP 结合在一起时,就形成了一个完整的工业数据基座:TSDB 提供高性能的数据基础设施,IDMP 提供数据语义与业务上下文,并在此基础上提供分析与洞察能力。数据不再只是被存储和查询,而是被组织、理解和利用。

对于 AI 来说,这一点尤为重要。AI需要的从来不是孤立的数据点,而是带语义、带上下文、实时更新的数据体系。如果缺少语义层,AI只能看到一条条时间序列,很难理解设备之间的关系,也无法理解生产过程中的业务逻辑。而通过 IDMP,TSDB 中的时间序列数据被组织成完整的工业数据模型,使 AI 可以在这个模型之上进行分析、推理和决策。

正因为如此,TSDB + IDMP 的组合,并不是简单的产品叠加,而让 TDengine 成为一个AI时代的工业数据基座实现涛思数据的使命:Make Industrial Data Accessible, Affordable and Valuable。

未来的软件形态:Agent Interface + 数据基座

过去的软件结构是:用户 → UI → 应用系统 → 数据库。未来的软件结构将变成:用户 / Agent → Agent Interface → 数据基座。软件界面会越来越薄,很多操作将通过对话、AI Agent甚至自动生成的应用来完成。

真正的核心,将是底层的数据基座。未来很多工业软件,不再会是传统意义上的应用,而是运行在工业数据基座之上的 AI Agent。

传统的工业可视化软件,配置复杂,界面陈旧,完全可以由AI Agent生成,而且完全可以根据个人喜爱、关注的对象,由 AI 个性化生成。AI 时代的今天,你可以仅仅说一句 “请对比一下过去24小时每台设备的能耗”,AI就自动的生成了一个柱状图来做对比。

传统的工业软件的预警设置,是一复杂的规则引擎,配置复杂,而且需要了解业务逻辑,没有几年的经验积累,是难以驾驭的。AI 时代的今天,你可以仅仅说一句 “这台设备有任何问题,请发短信通知我”,不再有任何使用门槛。

我上面的两个例子,都已经在TDengine IDMP里实现。当我春节期间在ProveIt会上给来自全球的工业软件用户展示这样的功能时,他们都是惊叹不已,没想到AI已经真正落地在工业领域了。

我们推出的无问智推、智能问数、面板数据洞察等功能,只是IDMP内置的AI Agent完成的。但通过TDengine 的开放接口,会有大量大家意想不到的AI Agent开发出来,满足各种需求,包括极其小众的需求。2B包括工业软件一直有个性化开发的压力,在AI时代,不复存在。

谁掌握工业数据基座,谁就掌握未来工业软件的生态

一起奔跑,奔赴下一站:构建AI时代的工业数据基座 - TDengine Database 时序数据库

TDengine无问智推: AI自动生成面板、分析 

一起奔跑

对于软件行业,AI 时代的真正分水岭,不是有没有 AI,而是:你是“被 AI 使用的系统”,还是“被 AI 替代的工具”。在 我看来,未来工业软件的竞争,将围绕数据、上下文、实时性、AI融合展开,因为AI Native的工业数据基座,将成为一家企业最核心的资产。

真正改变世界的软件,是从一群工程师的长期坚持中诞生的。数据库是这样诞生的,Linux 是这样诞生的,云计算也是这样诞生的。它们的共同特点是:在很长一段时间里,只有少数人真正相信它们的重要性。我9年前研发时序数据库时,几乎没人相信,工业软件的未来也是一样。今天,很多人在谈 AI,很多人在谈 Agent,但很少有人在真正解决一个更基础的问题:AI 时代的工业数据基座 (Industrial Data Foundation for AI Era)。

没有数据基座,AI只是演示;没有数据语义,AI只会产生幻觉;没有实时数据平台,AI就无法进入工业现场。未来十年,工业世界一定会诞生新的基础设施公司。就像过去二十年里诞生的:数据库公司、云计算公司、开源基础设施公司。

而今天,我们正站在这样一个历史窗口前,工业 AI 的时代正在到来。问题不再是这个时代会不会到来,而是:当这个时代真正到来的时候,世界使用的工业数据基座是谁构建的我希望那个名字是:TDengine。

九年前,涛思数据成立之日,我写下了《 让我们一起奔跑,去追求卓越而不是平庸一生!》。让我们继续奔跑,不是为了追赶别人,而是为了跑向那个属于我们的时代。

原文来自于:https://mp.weixin.qq.com/s/ZtbiaR43wHWbo8qbnUvvPw(爱倒腾的程序员)