您的位置: 首页 >互联网 >

为什么时间序列数据库受欢迎程度爆炸

2019-07-02 11:40:15 编辑: 来源:
导读 就在几年前,时间序列数据库本质上是一个利基市场。当然,如果您在金融服务公司内运行交易应用程序,那么您就专注于您的kdb +(专有)数据库

就在几年前,时间序列数据库本质上是一个利基市场。当然,如果您在金融服务公司内运行交易应用程序,那么您就专注于您的kdb +(专有)数据库,但对于大多数其他人来说,通用关系或NoSQL数据库是必需的。不再。原因?世界越来越多地要求企业能够实时查询,分析和报告流数据,而不是批处理模式。

根据DB-Engines的数据,在过去的两年里,TimescaleDB和InfluxDB等时间序列数据库的普及程度越来越高,AWS也在2018年底通过其亚马逊时间流数据库进入市场。这样做是一个悬而未决的问题。所有数据库开始看起来像时间序列数据库,如果这样,“小众”成为主流的数据库,如TimescaleDB,InfluxDB和亚马逊Timestream成为未来的MySQLs和PostgreSQLs。

虽然上面的图表跟踪相对增长的流行程度(例如MySQL等关系数据库和像MongoDB这样的文档数据库已经很成熟),但它仍然表明行业中发生了重要的事情。时间序列数据库帮助我们了解世界随时间的变化。更加周到,正如Timescale首席执行官Ajay Kulkarni所说:

[T] ime系列数据集跟踪整个系统的更改为INSERT,而不是UPDATE。

这种将系统的每一个变化记录为一个新的不同行的做法使得时间序列数据如此强大。它允许我们衡量变化:分析过去的变化情况,监控当前情况的变化,预测未来变化。

[所以]这就是我喜欢定义时间序列数据的方式:共同表示系统/流程/行为如何随时间变化的数据。

这听起来像所有数据库应该做的那样可疑,但这些老式数据库缺乏有效存储和访问大量数据的能力。关系数据库和NoSQL数据库可以用于时间序列数据,但可以说开发人员将从专用的时间序列数据库中获得更好的性能,而不是尝试将一个适合所有人的数据库应用于特定的工作负载。正如AWS的Shawn Bice曾向我解释过的那样,开发人员希望找到合适工具的合适工具,即使这意味着使用多种工具来完成多方面的工作。

但是,如果您可以拥有已知数据库的舒适度以及专用时间序列数据库的性能,该怎么办?

这就是Timescale团队正在使用TimescaleDB做的事情,公司创始人Ajay Kulkarni和迈克尔弗里德曼本周接受采访时解释道。与MongoDB最初作为PaaS开始但最终确定其PaaS的数据库部分的方式类似,Timescale最初是为了提供物联网平台。该公司尝试使用InfluxDB,MongoDB和其他现有数据库系统,但最终选择构建自己的数据库系统。

也就是说,TimescaleDB是流行的PostgreSQL数据库的扩展或覆盖。为什么这很重要?首先,他们解释说,它为他们奠定了坚实的基础。然而,不仅如此,它还为公司提供了PostgreSQL工具生态系统的舒适性,正如Freedman告诉The Next Platform的Timothy Prickett Morgan:

我们不了解数据如何存储在磁盘上,因此我们继承了PostgreSQL的所有可靠性。我们还强制使用相同的PostgreSQL接口,因此该数据库的所有工具都可以与TimescaleDB一起使用。中间部分是我们已经弄清楚如何扩展PostgreSQL的时间序列数据,我们在插入时比PostgreSQL快20倍。而且我们比Cassandra快10倍,与Cassandra不同,我们也支持完整的SQL。

所有PostgreSQL的优点,但增加了时间序列数据的性能(例如,快速摄取)。开发人员可以利用她的SQL经验并本地查询SQL。但是因为Timescale团队已经构建在PostgreSQL之上作为覆盖(或扩展,如果你愿意),它的开发轨道独立于主PostgreSQL数据库运行。对于客户和公司来说,这是两全其美的。

对于越来越有趣的数据库类型来说,这是一种有趣的方法。随着世界继续向实时迈进,时间序列数据库将继续普及。真正的问题是它们的效用是否存在自然界限。根据Kulkarni的说法,答案是强调“否”:“所有数据都是时间序列数据。”


免责声明:本文由用户上传,如有侵权请联系删除!

精彩推荐

图文推荐

点击排行

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082   备案号:闽ICP备19027007号-6

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。