一起奔跑，奔赴下一站：构建AI时代的工业数据基座

Jeff Tao

2026-03-09 / 爱倒腾的程序员

就在一周前，TDengine TSDB 时序数据库在全球安装实例数超过一百万，遍布全球60多个国家和地区，这是一个相当令人兴奋的数字。2016年底，我看到物联网、工业互联网的高速发展，市场需要有一款高性能、具有水平扩展能力的时序数据库，因此开始人生的第三次创业，带着团队开发出TDengine TSDB, 并在2019年7月将其开源。这个一百万是团队努力、用户信任、开源社区支持、创业窗口把握得当的结果。

但兴奋的背后，内心仍然焦虑，因为与九年前相比，全球IT格局已经完全改变。从2022年底ChatGPT发布起，人类迎来了一场新的工业革命，AI浪潮席卷全球，各种大模型不停迭代，推理能力也越来越强，训练、推理成本也越来越低。2024年起，AI Agent开始流行，一个简单的对话框就颠覆了很多传统的IT系统，以前需要耗费很多人力开发的软件，现在可以及时生成。大家发现，程序员的价值大幅缩水，甚至可以不需要了。以我们涛思数据为例，人事部门的周子衿就用AI生成了年会抽奖程序，开发出了招聘AI Agent，公司任何人都可以写出自动化测试脚本，这在以前是不可想象的。

作为一家2B软件公司，在AI时代我们何去何从？涛思数据是否还有价值？TDengine TSDB是否已经走到尽头？过去一年多，我一直在思考这个问题。我的结论越来越清晰：TDengine 的旅程，才刚刚开始。我们真正要打造的，不只是一个时序数据库，而是构建一个AI时代的工业数据基座 (Building Industrial Data Foundation for AI Era)。而实现这件事的关键，就是：TSDB + IDMP。

AI 时代稀缺的不是功能，而是面向 AI 的数据基座

很多人认为 AI 会吞噬所有软件，这是一种误解。更准确的判断是：AI 不会让软件产品消失，AI 会让“低壁垒的功能产品”失去存在价值。AI Agent 的核心能力是：把“一个功能”变成“按需生成的能力”。

过去的软件形态是：功能 → 产品，现在变成：需求 → AI即时完成。例如活动的抽奖程序，会议记录，产品的自动化测试例，现在就可以由AI即时生成。

这些软件的共同特点是：单一功能、规则清晰、不依赖复杂数据、不涉及关键业务流程、不需要长期积累。换句话说：一个聪明的 Prompt 就可以替代它们。因此，最先被冲击的，是“功能型软件”。

当 AI 能够即时生成你需要的功能时，企业真正需要的，不再是一个软件工具，而是：能够承载数据、流程、上下文和决策的系统，也就是一个AI时代的数据基座。

一个企业不会因为 AI 能写报表、回答各种问题，就不需要数据采集系统、不需要数据库、不需要资产模型、生产监控以及可靠的数据基础设施了。AI 可以生成洞察，但无法替代数据的来源和结构。就像：AI 可以分析发动机数据，但不会替代发动机本身。

这也是为什么，我们决定把 TDengine 从一个时序数据库，发展成为一个面向AI 的工业数据基座。

工业领域是AI时代最难被颠覆的行业之一

在消费互联网领域，AI 可以迅速替代很多工具。但在工业领域，情况完全不同。工业数据具有几个关键特征：

强实时性：毫秒级采集、秒级分析
强上下文：每个数据点都与设备、工艺、班次、订单相关
数据源类型多：不同设备的数据接口不一致、数据标准不一致
高可靠性要求：错误可能导致停产甚至事故
数据规模巨大：数万到数千万时间序列

AI 不可能处理海量的实时数据，更无法处理无上下文，没有统一标准的数据。这些特征决定，我们必须建立强大的工业数据基座，而且向AI开放接口，让其能轻易获取具有上下文、业务语义的数据，构建出各种工业应用，获得实时的业务洞察。AI无法取代这样的工业数据基座，而是完全依赖它。

为什么需要 IDMP工业数据管理平台

时序数据库负责把采集的工业数据存储起来，但是规模稍微大一点的企业，动辄就是几十万甚至数千万的时间线（测点），我们的一个新能源客户，测点数就超过三千万。怎么找到一个测点，以及测点之间的关联关系，我们必须有一个数据目录，或是数据地图，否则依赖AI去找，消耗的资源太大，而且不可靠。

工业上，有各种各样的数据源，有SCADA, DCS, Controller 等，每种数据源有自己接口和标准，计量单位不一致，命名不一致，因此我们必须要有数据的标准化。否则在AI读到一个数220的时候，这是电压，还是温度，都难以区分。Dianya, Voltage、DY几个词是否都表示电压，只会让 AI 幻觉严重。

另一方面，数据的采集是持续不断的，只有附上批次、订单、班次等信息后，才有真正的业务价值。不同订单的工艺配置是完全不一样的，数据特征会不一样，如果不标注出来，只会让AI的幻觉雪上加霜，因此数据的情景化是必须的，离开情景化，数据就是孤零零的一个浮点数、状态量，不具备任何业务含义。

因此任何工业数据基座，都必须有一个管理平台，这个平台负责数据目录、数据标准化和数据情景化。有了这样的一个平台，AI 才能真正的发挥作用，这个平台就是 IDMP 工业数据管理平台 (Industrial Data Management Platform) 。

幸运的是，我从2017年起就关注PI System，三年前，又开始仔细研究它的产品。PI Asset Framework 较为完美的解决了数据目录、标准化和情景化的问题。2024年中旬，看到AI的兴起，我下定决心开发IDMP，调动公司的研发资源，进行开发。2025年初 DeepSeek 的爆火，加速了AI发展的进程，也迫使我全身心的投入到IDMP的开发中。

然而，仅仅把数据组织好、管理好还远远不够。工业数据平台的最终目标，并不是存储数据，而是帮助用户展示数据、理解数据、发现问题并做出决策。如果数据只能被查询，却无法被洞察，那么再好的数据平台，其价值仍然是有限的。因此，在 IDMP 的设计之初，我还在思考一个问题：在 AI 时代，工业数据可视化到底应该扮演什么角色？

一起奔跑，奔赴下一站：构建AI时代的工业数据基座 - TDengine Database 时序数据库

TDengine 工业数据基座架构图

可视化正在从“展示数据”走向“洞察数据”

在传统工业软件中，可视化的核心功能非常简单：展示当前状态和历史趋势。无论是SCADA系统、传统数据采集系统，还是后来的工业互联网平台，可视化通常意味着几种固定的形式：实时数值、趋势曲线、简单报表，以及各种状态灯和仪表盘。中国很多工业互联网平台甚至把重点放在炫酷的大屏展示上，大量3D效果、动画效果和现代的界面设计，看上去非常震撼，但本质上仍然只是对当前状态的一种视觉呈现。

这种可视化方式在过去是合理的，因为传统软件的能力主要集中在数据采集和数据展示上，系统能够做到的事情也只是把数据展示出来，让人去理解、分析并做出决策。可视化的目标是“看见数据”，而不是“理解数据”。但在AI时代，可视化的意义应该发生根本变化。

因此在设计IDMP的可视化时，我们就不想让它成为传统意义上的图表系统，而是一个围绕“数据洞察”的分析平台。它不仅能够展示数据，还能够帮助用户理解数据的变化规律，发现隐藏在数据背后的模式，并把复杂的数据分析结果以直观的方式呈现出来，让它成为数据分析与决策支持的重要入口。

例如，在工业生产中，事件（Event）是非常重要的分析对象。设备的异常、工艺的变化、生产批次的差异，往往都体现在一系列事件之中。传统系统只能把这些事件记录下来，但很难进行系统化分析。而在IDMP中，用户可以很方便地对不同事件进行对比分析，例如对比不同批次生产过程中的温度、压力、能耗曲线，从中找出影响产品质量或能耗效率的关键因素。

在此基础上，IDMP还可以利用时间序列分析与AI算法，对未来数据进行预测，对缺失数据进行补全，对异常数据进行自动检测，并在检测到异常后生成事件分析报告。系统不仅能够告诉用户“发生了什么”，还能够进一步分析“为什么会发生”，并生成初步的根因分析报告。这些分析结果并不是以复杂的算法输出形式呈现，而是通过可视化方式，让用户能够快速理解和判断。

因此，IDMP的可视化与传统工业软件的可视化有着本质区别。传统可视化关注的是“展示”，而IDMP关注的是“洞察”；传统可视化的目标是让用户看到数据，而IDMP的目标是让用户理解数据，并基于数据做出更好的决策。

开放的系统才能让AI真正发挥作用

AI 时代的软件有一个最重要的特征：生态在快速变化。新的模型、新的 Agent、新的工具每天都在出现。如果一个系统是封闭的，它很快就会被时代淘汰。因此，AI时代的数据基座必须是开放的系统。

TDengine 在设计时就坚持这一点。首先，我们提供 MCP 接口，让 AI Agent 可以直接访问 TDengine 中的数据。其次，TDengine 支持将数据实时发布到Kafka，MQTT Broker和其他各种消息队列。而且从TDengine发布的第一个版本起，我们就允许应用直接订阅 TDengine 的数据流。工业数据不只是被查询，还可以被实时消费。

MCP，发布、订阅这些接口的支持，意味着 TDengine 不只是一个数据库，而是一个数据基座。AI Agent、工业应用、数字孪生系统，都可以围绕这个基座构建。

开放的好处不用多言，但工业场景的数据安全与隐私，给开放系统带来了巨大的挑战。设计之初，我们就充分考虑了这个因素。我们的解决方式是通过基于角色的权限管理，基于数据资产的树状结构目录，让一个用户只能访问到它可以访问的数据。资产模型和数据目录的价值得到了充分的体现。

我坚信，只有开放的系统，才能真正成为 AI 时代的工业数据基座。

TDengine IDMP 能比较多个事件，可对齐开始时间、归一化，做批次分析

TSDB + IDMP 的组合是一完美的AI时代的工业数据基座

工业数据平台实际上有三层核心能力。第一层是数据基础设施：实时采集、高速写入、海量存储与高性能查询，这正是 TSDB 的能力。工业现场的数据具有高频率、高并发和长期积累的特点，如果没有高性能的时序数据库作为底座，再好的数据分析和AI能力都无法落地。TSDB解决的是工业数据最基础、也是最困难的问题：如何稳定、高效、长期地保存海量工业数据，并能够在毫秒级完成查询和分析。

第二层是数据语义层：数据目录、数据标准化、数据情景化，这正是 IDMP 的能力。工业数据并不是简单的数字集合，而是与设备、工艺、订单、班次等业务上下文紧密关联的数据体系。如果没有语义层的支撑，AI看到的只是孤立的时间序列，而不是具有业务含义的工业数据。IDMP通过资产模型、数据目录和情景化机制，把这些数据组织成一个具有业务语义的数据体系，使AI能够真正理解工业现场发生了什么。

第三层是数据分析与洞察层：基于采集的数据进行预测、异常检测、事件分析以及根因分析，并通过可视化方式把这些结果呈现出来，从而帮助用户理解生产过程并形成决策依据。这一层并不是简单的报表系统，而是围绕数据洞察构建的分析能力，它使工业数据从“被记录的数据”转变为“能够产生价值的数据”。

当 TSDB 与 IDMP 结合在一起时，就形成了一个完整的工业数据基座：TSDB 提供高性能的数据基础设施，IDMP 提供数据语义与业务上下文，并在此基础上提供分析与洞察能力。数据不再只是被存储和查询，而是被组织、理解和利用。

对于 AI 来说，这一点尤为重要。AI需要的从来不是孤立的数据点，而是带语义、带上下文、实时更新的数据体系。如果缺少语义层，AI只能看到一条条时间序列，很难理解设备之间的关系，也无法理解生产过程中的业务逻辑。而通过 IDMP，TSDB 中的时间序列数据被组织成完整的工业数据模型，使 AI 可以在这个模型之上进行分析、推理和决策。

正因为如此，TSDB + IDMP 的组合，并不是简单的产品叠加，而让 TDengine 成为一个AI时代的工业数据基座，实现涛思数据的使命：Make Industrial Data Accessible, Affordable and Valuable。

未来的软件形态：Agent Interface + 数据基座

过去的软件结构是：用户 → UI → 应用系统 → 数据库。未来的软件结构将变成：用户 / Agent → Agent Interface → 数据基座。软件界面会越来越薄，很多操作将通过对话、AI Agent甚至自动生成的应用来完成。

真正的核心，将是底层的数据基座。未来很多工业软件，不再会是传统意义上的应用，而是运行在工业数据基座之上的 AI Agent。

传统的工业可视化软件，配置复杂，界面陈旧，完全可以由AI Agent生成，而且完全可以根据个人喜爱、关注的对象，由 AI 个性化生成。AI 时代的今天，你可以仅仅说一句 “请对比一下过去24小时每台设备的能耗”，AI就自动的生成了一个柱状图来做对比。

传统的工业软件的预警设置，是一复杂的规则引擎，配置复杂，而且需要了解业务逻辑，没有几年的经验积累，是难以驾驭的。AI 时代的今天，你可以仅仅说一句 “这台设备有任何问题，请发短信通知我”，不再有任何使用门槛。

我上面的两个例子，都已经在TDengine IDMP里实现。当我春节期间在ProveIt会上给来自全球的工业软件用户展示这样的功能时，他们都是惊叹不已，没想到AI已经真正落地在工业领域了。

我们推出的无问智推、智能问数、面板数据洞察等功能，只是IDMP内置的AI Agent完成的。但通过TDengine 的开放接口，会有大量大家意想不到的AI Agent开发出来，满足各种需求，包括极其小众的需求。2B包括工业软件一直有个性化开发的压力，在AI时代，不复存在。

谁掌握工业数据基座，谁就掌握未来工业软件的生态。

TDengine无问智推: AI自动生成面板、分析

一起奔跑

对于软件行业，AI 时代的真正分水岭，不是有没有 AI，而是：你是“被 AI 使用的系统”，还是“被 AI 替代的工具”。在我看来，未来工业软件的竞争，将围绕数据、上下文、实时性、AI融合展开，因为AI Native的工业数据基座，将成为一家企业最核心的资产。

真正改变世界的软件，是从一群工程师的长期坚持中诞生的。数据库是这样诞生的，Linux 是这样诞生的，云计算也是这样诞生的。它们的共同特点是：在很长一段时间里，只有少数人真正相信它们的重要性。我9年前研发时序数据库时，几乎没人相信，工业软件的未来也是一样。今天，很多人在谈 AI，很多人在谈 Agent，但很少有人在真正解决一个更基础的问题：AI 时代的工业数据基座 (Industrial Data Foundation for AI Era)。

没有数据基座，AI只是演示；没有数据语义，AI只会产生幻觉；没有实时数据平台，AI就无法进入工业现场。未来十年，工业世界一定会诞生新的基础设施公司。就像过去二十年里诞生的：数据库公司、云计算公司、开源基础设施公司。

而今天，我们正站在这样一个历史窗口前，工业 AI 的时代正在到来。问题不再是这个时代会不会到来，而是：当这个时代真正到来的时候，世界使用的工业数据基座是谁构建的。我希望那个名字是：TDengine。

九年前，涛思数据成立之日，我写下了《让我们一起奔跑，去追求卓越而不是平庸一生！》。让我们继续奔跑，不是为了追赶别人，而是为了跑向那个属于我们的时代。

原文来自于：https://mp.weixin.qq.com/s/ZtbiaR43wHWbo8qbnUvvPw（爱倒腾的程序员）