logo

时间序列特征

王哲峰 / 2024-04-24


目录

简单的统计描述

依据时间序列数据计算得到的特征数都可用于描述该时间序列,如平均值、最小值或最大值。

ACF 特征

一个序列的所有自相关都可以视为该序列的特征。还可以总结自相关以产生新特征。 例如,总和前 10 个自相关系数的平方是一个有用的总结,说明一个序列中有多少自相关,而不管滞后。

还可以计算周期之间序列变化的自相关。也就是说,我们对数据进行“差分”, 并创建一个由连续观察值之间的差分组成的新时间序列。 然后我们可以计算这个新的差分序列的自相关。有时再次应用相同的差分运算是有用的, 所以我们计算差分的差分。这个双差序列的自相关可以提供有用的信息。

另一种相关方法是计算系列的季节性差分。例如,如果我们有月度数据, 我们将计算连续一月、连续二月等之间的差分。 这使我们能够查看该系列在几年之间而不是几个月之间如何变化。 同样,季节性差分序列的自相关可能会提供有用的信息。

常用的 ACF 特征有:

STL 特征

时间序列分解可以用来衡量时间序列中趋势和季节性的强度。时间序列分解可以被写成:

$$y_{t} = T_{t} + S_{t} + R_{t}$$

其中:

下面介绍趋势性强度和季节性强度,这些度量可能很有用, 例如,当您拥有大量时间序列时,您需要找到最具趋势或最具季节性的序列。

趋势强度

对于强趋势数据,季节性调整后的数据($T_{t} + R_{t}$)应该比剩余部分有更多的变化。 因此 $Var(R_{t})/Var(T_{t} + R_{t})$ 应该比较小。 但对于几乎没有趋势的数据,这两个方差应该大致相同。所以我们定义趋势的强度为:

$$F_{T} = \max\Big(0, 1- \frac{Var(R_{t})}{Var(T_{t} + R_{t})}\Big)$$

这将在 0 和 1 之间给出趋势强度的度量。因为余数的方差有时甚至可能大于季节性调整数据的方差, 将 $F_{T}$ 的最小可能值设置为零。

季节强度

季节性强度的定义于趋势强度类似,但相对于去趋势数据而不是季节性数据:

$$F_{S} = \max\Big(0, 1- \frac{Var(R_{t})}{Var(S_{t} + R_{t})}\Big)$$

季节强度 $F_{S}$ 接近 0 的序列几乎没有季节性,而且有强季节性的序列 $F_{S}$ 接近 1, 因为 $Var(R_{t})$ 将远小于 $Var(S_{t} + R_{t})$

其他特征