Part01
导语
1.1
场景切入
世界正在朝着信息化飞速前进,科学技术的蓬勃发展,预示着我们的世界正以指数级变化,我们捕获和解析的数据比以往更多,速度比以往更快。
试想一下这些场景:身边的智能家居、路上的无人汽车、山上的巨型风机、股市的自动交易算法、工厂中的自动化生产线,它们都有哪些共同点?
如果仔细观察你会发现,这些应用场景的系统都需要一种特殊的数据:
?智能家居系统持续监控房屋内的变化,调整温度,识别侵入者,对于使用者总是有求必应;
?无人驾驶汽车持续收集所处环境中的变化数据,指挥汽车安全行驶;
?风场无人化值守,持续收集设备运行状况、气象数据、电气数据,做出综合诊断;
?自动交易系统持续收集市场的变化数据,支持交易算法运算;
?生产系统持续收集各个机器人的变化数据,指挥生产线高速运转。
这些应用程序均依赖一种衡量事物随时间的变化的数据形式,这里的时间不只是一个度量标准,而是一个坐标的主坐标轴。同时,其输出信息、分析结果也要求及时,越及时则价值越大,随着时间延迟其价值会衰减。
1.2
发现本质
这些数据,本质上是大量的传感器,通过不断的观察、感知物理世界,用采集到的离散数据,构建还原出一个数字世界,在这个数字世界我们可以自由地做任何实验,并在恰当的时间窗口内获得满意的结果,再作用于物理世界。物理世界的一大规律就是:万事万物随着时间推移而状态不断发生变化。
1.3
归纳概念
传感器对物理世界的观察所产生的数据,就是时间序列数据,简称时序数据。然后还要参考其是否具备及时性,进一步分为实时数据和历史数据,前者具备及时性,有高价值,能实时反馈于物理世界;后者不具备及时性,但仍然有价值,海量历史数据的分析挖掘可以发现更多有价值信息。
1.4
发展趋势
随着技术水平的提高,我们有了更强大的吞吐能力、计算能力、存储能力、分析能力,时序数据渐渐在我们的世界中发挥更大的作用。
截止到当前(年1月),在过去的24个月中,专门处理时间序列数据的数据库已经成为增长最快的类别:
数据来源:DB-Engines,年1月.