近两年,时序数据库逐渐成为流行度最高的数据库之一,在过去的 10 年里,至少有 20 个新的时序数据库发布。那我们如何选择时序数据库?本文列出了优秀时序数据库应该具备的十大标准,给你参考。
开源
马克·安德森说过,软件吞噬世界,而开源则在吞噬软件。和封闭系统不同,开源软件有着“低成本”“自由”“透明”的优势,除此之外,开源软件还拥有更开放、更强壮的生态,以及更友好的开发者社区。
高性能
时序数据库是基于时序数据的特点以及应用的特点进行优化和设计的,这类专业的数据库使时序数据的处理变得更加高效,性能也比通用数据库更好。但一些时序数据库在基数较低时表现良好,但是随着基数的增加,其性能也会变差;此外,一些时序数据库在查询历史数据时,延迟太高,性能不够,这都给数据库管理员带来了很大的挑战。因此,我们一定要选择无论数据集大小,性能表现都非常好的时序数据库。
可扩展性
时序数据积累得非常快,好的时序数据库应具备超强的水平扩展能力。这是当前许多时序数据库的弱点,甚至最流行的时序数据库 InfluxDB 也只有企业版具有可扩展性。
支持 SQL
SQL 仍然是数据库中最流行的查询语言,它功能强大、速度快,为众多程序员所喜爱。但诸如 InfluxDB、Prometheus、OpenTSDB 等众多时序数据库,都设置了自己的查询语言,并没有使用 SQL,这就增加了学习门槛和应用程序迁移成本。不同的是,TDengine 和 TimescaleDB 都保留了 SQL 作为查询语言,因此这一类时序数据库也更易上手。
丰富的生态系统
为了便于用户快速开发自己的应用,优秀的时序数据库应该提供丰富的生态接口,除了提供符合 RESTful 设计标准的 API 外,还应该提供主流编程语言的连接器,并支持各种可视化软件和 BI 工具的无缝集成。
云原生
云是未来,数据库也一定会走向云原生(Cloud Native)。云原生数据库提供了按照实际使用资源量来计费的能力,以降低运营成本。此外,它提供了快速开发原型、研发、测试以及部署新的应用的能力,可以大大缩短新的应用从设计开发到进入市场的时间。因此,一定要选择云原生,而不只是能在云上运行的数据库。
极简
时序数据处理需要的不仅仅是存储和分析。在典型的时序数据处理平台中,TSDB 总是与流处理、缓存、数据订阅和其他工具集成在一起,这使得系统设计复杂且难以维护。此外,它还需要消耗更多的计算和存储资源。因此,我们需要选择一款构建了自己的缓存、流计算和数据订阅功能的极简时序数据处理平台,来降低系统的复杂度和成本。
能够处理乱序数据
一些时序数据库无法处理乱序数据,只能丢弃,比如 Prometheus。如果你有需要处理乱序数据的场景(比如网络波动或弱网条件下,数据插入请求会有所延迟,又或者需要批量补入数据),这就需要选择能解决乱序写入的时序数据库。
轻量级
在有些情况下,在边缘侧,你可能无法部署大型系统,这时就需要选择一个轻量级、极简的时序数据库解决方案。
可观测性
在诸多行业的物联网、大数据场景下,数据监控都有着极其重要的作用,通过数据指标我们可以对业务进行监督和控制,以便实现准确的监控报警和业务预测。因此,优秀的时序数据库解决方案应具备可观测性,并能与 Grafana、Promethues、Telegraf 等流行的工具集成。
从上述十大标准出发,加上模拟业务环境进行一番调研测试,一定能选出适合您业务场景数据处理需求的时序数据库。
TDengine 是一款开源、高性能、云原生的时序数据库,且针对物联网、车联网、工业互联网、金融、IT 运维等场景进行了设计优化和技术创新。TDengine 的代码,包括集群功能,都已经在 GNU AGPL v3.0 下进行了开源。除核心的时序数据库功能外,其还提供缓存、数据订阅、流式计算等其他功能以降低系统复杂度及研发和运维成本。
TDengine 的部署极其简单,为方便使用,标准的服务端安装包包含了 taosd、taosAdapter、taosc、taos、taosdump、taosBenchmark、TDinsight 安装脚本和示例代码。您可以免费、轻松地部署及运行。
如果您想立即免费试用 TDengine,请点击「快速开始」,立即使用。