TDengine时序数据库运行监控实战:Grafana、TDinsight与taosKeeper配置指南

小T

2026-05-09 /

保障TDengine集群稳定运行是运维工作的核心任务。本文详细介绍TDengine的监控体系架构,以及如何配置和使用Grafana、TDinsight等可视化工具实现全面的运行监控。

一、TDengine监控架构

TDengine采用统一的监控架构,核心组件包括:

┌─────────────────────────────────────────┐
│           TDengine集群                   │
│  ┌─────────┐  ┌─────────┐              │
│  │  taosd  │  │  taosX  │              │
│  └────┬────┘  └────┬────┘              │
│       │            │                    │
│       └──────┬─────┘                    │
│              ▼                          │
│       ┌──────────────┐                  │
│       │ taosKeeper   │                  │
│       └──────┬───────┘                  │
└──────────────┼──────────────────────────┘
               │
               ▼
       ┌──────────────┐
       │ TDengine实例 │
       │ (监控数据)   │
       └──────────────┘
               │
               ▼
       ┌──────────────┐
       │   Grafana    │
       │  (可视化)    │
       └──────────────┘

二、配置taosKeeper

taosKeeper是TDengine监控数据的收集和导出组件。

2.1 配置文件位置

/etc/taos/taoskeeper.toml

2.2 关键配置项

[monitor]
# taosKeeper服务的FQDN
fqdn = "localhost"

# taosKeeper服务端口,默认6043
port = 6043

# 监控数据存储的数据库
database = "log"

三、部署TDinsight监控面板

TDinsight是TDengine官方提供的Grafana插件,可直观展示集群状态。

3.1 前置条件

  • TDengine已安装并运行
  • taosAdapter已安装
  • taosKeeper已安装
  • Grafana已安装

3.2 安装TDengine数据源插件

grafana-cli plugins install tdengine-datasource

3.3 配置数据源

在Grafana中添加TDengine数据源:

  • URL: http://your-taosadapter:6041
  • 输入用户名和密码

3.4 导入TDinsight仪表盘

两种导入方式:

  1. Dashboard ID: 18180
  2. Dashboard URL: https://grafana.com/grafana/dashboards/18180-tdinsight-for-3-x/

四、监控指标详解

4.1 taosd监控指标

指标类别说明
系统指标CPU、内存、磁盘使用率
查询指标QPS、响应时间、错误率
写入指标写入速度、积压队列长度
连接指标当前连接数、最大连接数

4.2 taosX监控指标

taosX的监控包括:

  • 进程状态
  • Agent进程
  • 连接器子进程
  • 数据写入任务

五、配置告警规则

在Grafana中配置告警规则:

alert: TDengineHighCPU
expr: taosd_cpu_usage > 80
for: 5m
labels:
  severity: critical
annotations:
  summary: "TDengine节点CPU使用率过高"

六、可视化管理集成

taosExplorer支持集成Grafana仪表盘,实现统一的监控视图。

6.1 配置Grafana

[server]
root_url = http://ip:3000/grafana
serve_from_sub_path = true

[security]

allow_embedding = true

6.2 配置Explorer

[grafana.dashboards]
TDengine3 = "http://ip:3000/d/000000001/tdengine3"
taosX = "http://ip:3000/d/000000002/taosx"

七、集群监控概览

通过taosExplorer的”概览”页面可以查看:

  • 集群中各服务组件数量
  • dnode主机信息
  • 各服务组件状态

总结

完善的监控体系是保障TDengine集群稳定运行的基础。建议:

  1. 部署taosKeeper统一收集监控数据
  2. 使用TDinsight实现可视化监控
  3. 配置合理的告警规则
  4. 定期检查监控数据发现潜在问题
  5. 集成到现有运维体系中

通过本文介绍的方法,您可以构建完整的TDengine监控体系,确保集群健康运行。