logo

时间序列统计性时域分析

wangzf / 2023-03-03


目录

统计性时域分析

统计性时域分析主要是横向挖掘时序的内生相关关系,其中,描述时序内生相关关系的两个重要统计指标是:

cov(Xt1,Xt2)=E[(Xt1μt1)(Xt2μt2)]

ρ(Xt1,Xt2)=cov(Xt1,Xt2)σt1σt2=E[(Xt1μt1)(Xt2μt2)](Xt1μt1)2(Xt2μt2)2

时间序列自回归

统计性时域时间序列回归的问题,并不是普通的回归问题,而是自回归。

一般回归

一般的回归问题,比如最简单的线性回归模型:

Y=aX1+bX2+ε

讨论的是因变量 Y 关于两个自变量 X1X2 的线性关系, 目的是找出最优系数 ab, 使得预测值 y=aX1+bX2 逼近真实值 Y

自回归

自回归模型中,自变量 X1X2 都为 Y 本身,也就是说, 现在的 Y 值由过去的 Y 值决定,自变量和因变量都为自身,因此这种回归叫自回归。

Yt=aYt1+bYt2+ε

其中:

自回归模型都有着严格理论基础,讲究时间的平稳性,需要对时间序列进行分析才能判断是否能使用此类模型。 这些模型对质量良好的时间序列有比较高的精度。传统的自回归模型有:

时间序列统计模型

统计模型

传统时间序列预测模型,通常指用于时间序列分析/预测的统计学模型, 比如常用的有 AR、MA、ARMA、ARIMA、指数平滑预测法(ES)等。 传统的参数预测方法可以分为两种:

这类方法比较适用于小规模,单变量的预测,比如某门店的销量预测等。 这类方法一般是统计或者金融出身的人用的比较多,对统计学或者随机过程知识的要求比较高。 而在数据挖掘的场景中比较难适用,因为需要大量的参数化建模。 比如有一个连锁门店的销售数据,要预测每个门店的未来销量, 用这类方法的话就需要对每个门店都建立模型,这样就很难操作了。

建模方法

总的来说,基于此类方法的建模步骤是:

img

优缺点及意义

优点:

缺点:

传统时间序列预测模型也有其重要的意义,比如:

时间序列分析总结

传统统计时域分析是围绕着 ARMA 模型不断调整。因为 ARMA 模型的使用前提是平稳非随机序列, 因此传统时序要做三点检验:

如果序列非平稳(包括非方差齐性),可以透过对时序自身的转换

或改进 ARMA 模型,例如:

而无论是残差序列还是方差序列,本质上也是时间序列,只要存在自相关性, 那么 ARMA 模型就可以用,于是出现了残差自回归模型和自回归条件异方差模型。

ARMA 模型适用于单条时序自身训练和预测的任务,人工成本是必要的。 虽然只有一条序列,但恰恰因为只有单条序列,想要挖掘出内部有价值的信息是令人头疼的, ARMA 从时序内生关系出发,对序列进行统计学上的建模,在今天也是具有参考意义的。