在时序数据库领域,AI驱动的数据分析能力正成为企业智能化转型的关键。TDgpt作为与TDengine主进程taosd适配的外置式时序数据分析智能体,能够将时序数据分析服务无缝集成在数据库的查询执行流程中,为用户提供从经典统计到深度学习的全栈分析能力。
TDgpt架构概述
TDgpt采用无状态平台设计,由若干无状态分析节点(Anode)构成。这种架构带来两个显著优势:一是可按需水平扩展,根据业务负载动态调整节点数量;二是可根据算法特点部署在合适的硬件环境上,例如将需要GPU加速的深度学习模型部署在GPU节点上,而统计分析模型则可以运行在普通CPU节点上。
作为外置式智能体,TDgpt与数据库主进程之间通过标准化接口通信,不侵入核心逻辑,保证了系统的稳定性和可维护性。无状态的设计也意味着任意节点的故障不会影响整体服务的可用性,运维人员可以灵活地进行节点扩缩容。
四大功能模块
TDgpt的能力体系由四个核心模块组成,覆盖了从经典统计到前沿大模型的完整技术栈。
1. 内置分析库
TDgpt内置了多个经典的时序数据分析库,包括:
- statsmodels:提供丰富的统计模型,如ARIMA、季节性分解、假设检验等,适用于趋势分析和周期性检测
- pyculiarity:基于Twitter开源的异常检测算法,适用于时序数据中的异常点识别
- pmdarima:自动化的ARIMA参数选择与拟合工具,降低了时间序列建模的门槛
这些经典分析库适用于大多数常见的时序数据分析场景,无需额外安装依赖即可直接使用。对于工业数据管理平台而言,这些内置库能够覆盖设备监控、质量分析等基础需求。
2. 内置机器学习库
对于更复杂的分析需求,TDgpt内嵌了主流的机器学习和深度学习框架:
- PyTorch:灵活的深度学习框架,适合构建自定义神经网络模型
- Keras:高层次的深度学习API,支持快速原型开发
- scikit-learn:丰富的传统机器学习算法库,包括回归、分类、聚类等
用户可以利用这些框架,结合存储在海量时序数据库中的历史数据,训练和部署定制化的分析模型。例如,在预测性维护场景中,可以利用PyTorch构建LSTM模型,对设备振动数据进行趋势预测。
3. 通用大语言模型请求适配模块
TDgpt提供了对主流大语言模型(LLM)的请求适配能力,支持向DeepSeek、LlaMa等MaaS(模型即服务)平台发起请求。这一模块使得用户可以通过SQL直接调用大语言模型的能力,将自然语言理解、文本生成等AI能力融入时序数据分析流程。
在实际应用中,该模块可以用于生成分析报告的自然语言描述、解释异常检测结果的业务含义等场景,极大地提升了数据分析结果的可读性和可理解性。
4. 时序数据模型适配器
在时序数据专用模型方面,TDgpt通过请求转发和适配方式,支持以下模型:
- Time-MoE:基于混合专家架构的时序预测模型
- TDtsfm:自研的时序数据基础大模型
- TimeGPT:首个针对时间序列的通用预训练模型
其中,TDtsfm是专门为时序数据场景设计的基础大模型,能够更好地理解时序数据的周期性、趋势性和季节性特征。通过适配器模式,用户无需关心底层模型的调用细节,只需通过统一的SQL接口即可使用不同模型的能力。
时序数据分析服务
TDgpt将复杂的分析能力封装为简洁的SQL函数接口,用户无需编写额外的代码即可调用强大的分析功能。
异常检测
异常检测是工业物联网场景中最常见的需求之一。TDgpt通过ANOMALY_WINDOW函数实现异常检测功能,用户只需定义异常(状态)窗口,系统即可自动识别数据中的异常模式。
例如,在设备监控场景中,可以定义温度超过阈值的持续时间窗口为异常状态,TDgpt会自动检测并标记所有符合条件的异常区间。这种方式比传统的固定阈值告警更加智能,能够识别渐进式的异常趋势。
预测分析
预测分析通过FORECAST函数提供,支持基于历史数据的趋势预测。用户可以指定预测的时间范围和置信区间,系统会自动选择合适的模型进行预测计算。在能源管理、供应链优化等场景中,预测分析能够帮助决策者提前规划资源分配。
数据补全
在实际业务中,由于设备故障、网络中断等原因,时序数据经常出现缺失。TDgpt的数据补全功能能够自动检测缺失的数据点,并利用插值、预测等方法进行补齐,保证数据的完整性。对于实时数据库而言,数据完整性直接影响后续分析的准确性,因此数据补全是数据质量保障的重要环节。
数据分类
数据分类功能目前处于研发测试阶段,未来将支持对时序数据进行自动分类,例如识别设备的运行模式、工作状态等。这一功能的推出将进一步丰富时序数据库的智能化分析能力。
自定义算法扩展
除了内置的分析能力,TDgpt还支持用户自定义分析算法。用户只需遵循开发者指南,即可添加自己的分析算法,并通过SQL直接调用。需要注意的是,TDgpt目前只支持Python语言开发的分析算法。
这一扩展机制为用户提供了极大的灵活性,可以根据特定业务场景的需求,开发专有的分析模型和算法。例如,某些行业可能需要结合领域知识构建特殊的异常检测规则,通过自定义算法机制可以轻松实现。
模型评估工具
企业版提供了针对多种算法模型有效性的综合评估工具。该工具可以基于TDengine中的时序数据,对不同算法模型的预测分析和异常检测结果进行对比评估,帮助用户选择最适合业务场景的模型。
评估工具覆盖了准确率、召回率、F1值等多个评估维度,为模型选型提供数据支撑。用户可以在同一份数据集上对比不同模型的表现,从而做出科学的模型选择决策。
总结
TDgpt作为时序数据库领域的AI分析智能体,通过四大功能模块和标准化的SQL接口,为用户提供了从经典统计到深度学习、从异常检测到预测分析的完整能力矩阵。其无状态架构设计保证了系统的可扩展性和高可用性,自定义算法扩展机制则满足了用户的个性化需求。无论是工业物联网的异常检测,还是能源领域的负荷预测,TDgpt都能与TDengine无缝协作,为业务决策提供智能化的数据洞察。

























