平稳时间序列分析授课课件
本章结构方法性工具ARMA模型平稳序列建模序列预测
2.1方法性工具差分运算延迟算子线性差分方程
差分运算一阶差分阶差分步差分
延迟算子延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻记B为延迟算子,有
延迟算子的性质,其中
2.2ARMA模型的性质AR模型(AutoRegressionModel)MA模型(MovingAverageModel)ARMA模型(AutoRegressionMovingAveragemodel)
AR模型的定义具有如下结构的模型称为阶自回归模型,简记为特别当时,称为中心化模型
AR(P)序列中心化变换称为的中心化序列,令
自回归系数多项式引进延迟算子,中心化模型又可以简记为自回归系数多项式
AR模型平稳性判别判别原因AR模型是常用的平稳序列的拟合模型之一,但并非所有的AR模型都是平稳的判别方法单位根判别法平稳域判别法
平稳AR模型的统计性质均值方差协方差自相关系数偏自相关系数
均值如果AR(p)模型满足平稳性条件,则有根据平稳序列均值为常数,且为白噪声序列,有推导出
AR模型自相关系数的性质拖尾性呈复指数衰减
例2.5:考察如下AR模型的自相关图
例2.5—自相关系数按复指数单调收敛到零
例2.5:—
例2.5:—自相关系数呈现出“伪周期”性
例2.5:—自相关系数不规则衰减
偏自相关系数定义对于平稳AR(p)序列,所谓滞后k偏自相关系数就是指在给定中间k-1个随机变量的条件下,或者说,在剔除了中间k-1个随机变量的干扰之后,对影响的相关度量。用数学语言描述就是
偏自相关系数的计算滞后k偏自相关系数实际上就等于k阶自回归模型第个k回归系数的值。
偏自相关系数的截尾性AR(p)模型偏自相关系数P阶截尾
例2.5续:考察如下AR模型的偏自相关图
例2.5—理论偏自相关系数样本偏自相关图
例2.5:—理论偏自相关系数样本偏自相关图
例2.5:—理论偏自相关系数样本偏自相关图
例2.5:—理论偏自相关系数样本偏自相关系数图
MA模型的定义具有如下结构的模型称为阶自回归模型,简记为特别当时,称为中心化模型
移动平均系数多项式引进延迟算子,中心化模型又可以简记为阶移动平均系数多项式
MA模型的统计性质常数均值常数方差
MA模型的统计性质偏自相关系数拖尾
例2.6:考察如下MA模型的相关性质
MA模型的自相关系数截尾
MA模型的自相关系数截尾
MA模型的偏自相关系数拖尾
MA模型的偏自相关系数拖尾
MA模型的可逆性MA模型自相关系数的不唯一性例2.6中不同的MA模型具有完全相同的自相关系数和偏自相关系数
可逆的定义可逆MA模型定义若一个MA模型能够表示称为收敛的AR模型形式,那么该MA模型称为可逆MA模型可逆概念的重要性一个自相关系数列唯一对应一个可逆MA模型。
可逆MA(1)模型
MA模型的可逆条件MA(q)模型的可逆条件是:MA(q)模型的特征根都在单位圆内等价条件是移动平滑系数多项式的根都在单位圆外
ARMA模型的定义具有如下结构的模型称为自回归移动平均模型,简记为特别当时,称为中心化模型
系数多项式引进延迟算子,中心化模型又可以简记为阶自回归系数多项式阶移动平均系数多项式
平稳条件与可逆条件ARMA(p,q)模型的平稳条件P阶自回归系数多项式的根都在单位圆外即ARMA(p,q)模型的平稳性完全由其自回归部分的平稳性决定ARMA(p,q)模型的可逆条件q阶移动平均系数多项式的根都在单位圆外即ARMA(p,q)模型的可逆性完全由其移动平滑部分的可逆性决定
ARMA(p,q)模型的统计性质均值协方差自相关系数
ARMA模型的相关性自相关系数拖尾偏自相关系数拖尾
例2.7:考察ARMA模型的相关性拟合模型ARMA(1,1):并直观地考察该模型自相关系数和偏自相关系数的性质。
自相关系数和偏自相关系数拖尾性样本自相关图样本偏自相关图
ARMA模型相关性特征模型自相关系数偏自相关系数AR(P)拖尾P阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾
2.3平稳序列建模建模步骤模型识别参数估计模型检验模型优化序列预测
建模步骤平稳非白噪声序列计算样本相关系数模型识别参数估计模型检验模型优化序列预测YN
计算样本相关系数样本自相关系数样本偏自相关系数
模型识别基本原则选择模型拖尾P阶截尾AR(P)q阶截尾拖尾MA(q)拖尾拖尾ARMA(p,q)
模型定阶的困难因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的或仍会呈现出小值振荡的情况由于平稳时间序列通常都具有短期相关性,随着延迟阶数,与都会衰减至零值附近作小值波动?当或在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?
样本相关系数的近似分布BarlettQuenouille
模型定阶经验方法95%的置信区间模型定阶的经验方法如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,通常视为(偏)自相关系数截尾。截尾阶数为d。
例2.5续选择合适的模型ARMA拟合1950年——1998年北京市城乡居民定期储蓄比例序列。
序列自相关图
序列偏自相关图
拟合模型识别自相关图显示延迟3阶之后,自相关系数全部衰减到2倍标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾偏自相关图显示除了延迟1阶的偏自相关系数显著大于2倍标准差之外,其它的偏自相关系数都在2倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾所以可以考虑拟合模型为AR(1)
例2.8美国科罗拉多州某一加油站连续57天的OVERSHORT序列
序列自相关图
序列偏自相关图
拟合模型识别自相关图显示除了延迟1阶的自相关系数在2倍标准差范围之外,其它阶数的自相关系数都在2倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列自相关系数1阶截尾偏自相关系数显示出典型非截尾的性质。综合该序列自相关系数和偏自相关系数的性质,为拟合模型定阶为MA(1)
例2.91880-1985全球气表平均温度改变值差分序列
序列自相关图
序列偏自相关图
拟合模型识别自相关系数显示出不截尾的性质偏自相关系数也显示出不截尾的性质综合该序列自相关系数和偏自相关系数的性质,可以尝试使用ARMA(1,1)模型拟合该序列
参数估计待估参数个未知参数常用估计方法矩估计极大似然估计最小二乘估计
例2.5续确定1950年——1998年北京市城乡居民定期储蓄比例序列拟合模型的口径拟合模型:AR(1)估计方法:极大似然估计模型口径
例2.8续确定美国科罗拉多州某一加油站连续57天的OVERSHORTS序列拟合模型的口径拟合模型:MA(1)估计方法:条件最小二乘估计模型口径
例2.9续确定1880-1985全球气表平均温度改变值差分序列拟合模型的口径拟合模型:ARMA(1,1)估计方法:条件最小二乘估计模型口径
模型检验模型的显著性检验整个模型对信息的提取是否充分参数的显著性检验模型结构是否最简
模型的显著性检验目的检验模型的有效性(对信息的提取是否充分)检验对象残差序列判定原则一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效
假设条件原假设:残差序列为白噪声序列备择假设:残差序列为非白噪声序列
检验统计量LB统计量
例2.5续检验1950年——1998年北京市城乡居民定期储蓄比例序列拟合模型的显著性残差白噪声序列检验结果延迟阶数LB统计量P值检验结论65.830.3229拟合模型显著有效1210.280.50501811.380.8361
参数显著性检验目的检验每一个未知参数是否显著非零。删除不显著参数使模型结构最精简假设条件检验统计量
例2.5续检验1950年——1998年北京市城乡居民定期储蓄比例序列极大似然估计模型的参数是否显著参数检验结果检验参数t统计量P值结论均值46.12<0.0001显著6.72<0.0001显著
例2.8续:对OVERSHORTS序列的拟合模型进行检验残差白噪声检验参数显著性检验检验参数t统计量P值结论均值-2.75<0.0004显著10.60<0.0001显著延迟阶数LB统计量P值结论62.150.6772模型显著有效129.050.6171
例2.9续:对1880-1985全球气表平均温度改变值差分序列拟合模型进行检验残差白噪声检验参数显著性检验检验参数t统计量P值结论16.34<0.0001显著2.50.0007显著延迟阶数LB统计量P值结论65.280.2595模型显著有效1210.300.4247
模型优化问题提出当一个拟合模型通过了检验,说明在一定的置信水平下,该模型能有效地拟合观察值序列的波动,但这种有效模型并不是唯一的。优化的目的选择相对最优模型
例2.13:拟合某一化学序列
序列自相关图
序列偏自相关图
拟合模型一根据自相关系数2阶截尾,拟合MA(2)模型参数估计模型检验模型显著有效三参数均显著
拟合模型二根据偏自相关系数1阶截尾,拟合MA(1)模型参数估计模型检验模型显著有效两参数均显著
问题同一个序列可以构造两个拟合模型,两个模型都显著有效,那么到底该选择哪个模型用于统计推断呢?解决办法确定适当的比较准则,构造适当的统计量,确定相对最优
AIC准则最小信息量准则(AnInformationCriterion)指导思想似然函数值越大越好未知参数的个数越少越好AIC统计量
SBC准则AIC准则的缺陷在样本容量趋于无穷大时,由AIC准则选择的模型不收敛于真实模型,它通常比真实模型所含的未知参数个数要多SBC统计量
例2.13续用AIC准则和SBC准则评判例2.13中两个拟合模型的相对优劣结果AR(1)优于MA(2)模型AICSBCMA(2)536.4556542.2011AR(1)535.7896540.2866
序列预测线性预测函数预测方差最小原则
例2.5:北京市城乡居民定期储蓄比例序列拟合与预测图