时间序列分析r语言实验报告
一、时间序列剖析导论图:
处置赏罚方式:
? ? ? 1.对于原始数据举行季节性处置赏罚和差分,以形成平稳序列;时代若是遇到了随机序列,则阻止时间序列建模
? ? ? 2.对于给定的序枚举行自相关函数和偏自相关函数剖析(在差异的滞后k值下的值),绘制自相关函数图和偏自相关函数图,看是否是AR、MA或ARMA模子
? ? ? AR(p)模子对应的偏自相关函数是以p步截尾的,对应的自相关函数
是拖尾的,呈正弦波(或指数衰减)并趋于0
? ? ? MA(q)模子对应的自相关函数是以q步截尾的,对应的偏自相关函数
是拖尾的,呈正弦波(或指数衰减)并趋于0
? ? ? ARMA(p,q)模子对应的自相关函数和偏自相关函数
都是截尾的
? ? ? 3.判断好AR、MA或ARMA模子后,去寻找p和q值
二、时间序列基本看法:
? ? ? 时间序列:对于一个变量Y在差异时间点上的取值Y1、Y2……YT的一个序列,它的索引是等间距的时间点序列
? ? ? 随机历程:由一种随机机制(和确定性机制相反)所发生的一个随机变量的序列
? ? ? 时间步骤:当我们说道时间步骤t时,就是指的,在已有的时间序列和它的等间距时间差之间,凭证这个时间差第t个时间索引所对应的变量值
三、时间序列的摘要函数:
? ? ? 首先,我们将时间序列中时间里的每个点视作一个随机变量,且该时间序列在某个时间索引t上的值是Yt
均值函数:某个时间序列在某个时间索引t上的期望值:
协方差:形貌两个变量转变的相似水平。
? ?你变大,同时我也变大,说明两个变量是同向转变的,这时协方差就是正的。
? ?你变大,同时我变小,说明两个变量是反向转变的,这时协方差就是负的。
? ?协方差的数值越大,两个变量同向水平也就越大。反之亦然。
? ? ? ?许多时间X,Y的运动是不纪律的,好比:
? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ?
? ? ?这时,很可能某一时刻的值与的
值乘积为正,另外一个时刻
的值与
的值乘积为负。
? ? ?将每一时刻与
的乘积加在一起,其中的正负项就会抵消掉,最后求平均得出的值就是协方差,通过
? ? ?协方差的数值巨细,就可以判断这两个变量同向或反向的水平了。
相关系数:一种剔除了两个变量量纲影响、尺度化后的特殊协方差
反映两个变量转变时是同向照旧反向,若是同向转变就为正,反向转变就为负。
它消除了两个变量转变幅度的影响,而只是单纯反映两个变量每单元转变时的相似水平。
反映的就是两个变量每单元转变时的情形。
只能在+1到-1之间转变
当变量X与Y的相关系数为1时,说明两个变量转变时的正向相似度最大,即,你变大一倍,我也变大一倍;你变小一倍,我也变小一倍。也即是完全正相关,呈线性关系
当变量X与Y的相关系数为0时,两个变量的转变历程没有任何相似度,也即两个变量无关。
当变量X与Y的相关系数为-1时,说明两个变量转变的反向相似度最大,即,你变大一倍,我变小一倍;你变小一倍,我变大一倍。也即是完全负相关,呈线性关系
尺度差:——形貌了变量在整体转变历程中偏离均值的幅度
? ? ?每一时刻变量值与变量均值之差再平方,求得一个数值,再将每一时刻这个数值相加后求平均,再开方。其中是偏离均值的幅度;做平方的缘故原由是由于有时间变量值与均值是反向偏离的(见下图),
是个负数,平方后,就可以把负号消除了。这样在后面求平均时,每一项数值才不会被正负抵消掉,最后求出的平均值才气更好的体现出每次转变偏离均值的情形;最后又开平方的缘故原由是由于适才为了消除负号影响,取了一次平方,最后一定要把求出的均值开方,将这个偏离均值的幅度还原回原来的量级。
自协方差函数:——权衡时间序列中的随机变量在差异时间点上相互的线性依赖性?
?
? ? ? ?当两个时间索引相同时,自协方差函数就是方差:
?
单元是原始时间序列的随机变量的平方,而且自协方差函数是对称的,转换t1和t2的位置其值稳固
自相关函数(ACF函数)——权衡时间序列中的随机变量在差异时间点上相互的线性依赖性
?
自相关函数是对称的,转换t1和t2的位置其值稳固;无单元,取值在-1到+1之间,+1和-1时为完全线性依赖,0时为在这两个时间索引下的变量值无关
当用在两个相等的时间索引对应变量上时,值为1
三、基本的时间序列
1.白噪声
? ? ? 白噪声(离散白噪声):在一个白噪声时间序列中,发生出来的随机变量都是具有均值0和有限且相等的方差,而且差异时间步骤的随机变量是相互之间不相关的。同时也要求自力同漫衍(IID)
? ? ? IID(自力同漫衍):要求每个随机变量来自于完全相同的漫衍,例如某个均值和尺度差都相同的正态漫衍;要求来自差异时间序列步骤的两个变量不仅相互不相关,而且照旧自力的。
? ? ? ps:两个相互自力的变量一定不相关,可是两个不相关的变量纷歧定相互自力
? ? ? 高斯白噪声:从正态漫衍中抽取的白噪声时间序列
? ? ? 构建白噪声时间序列模子要害变量:方差
? ? ? 白噪声时间序列的显著性磨练:
? ? ? 运用R语言中acf()函数绘制相关图,本要领是对于步长为k的时间步骤的配对举行估算。其中效果的横轴为k(延迟)的差异值,纵轴为ACF函数的值,虚线为在给定的例如95%置信区间下,对应的ACF值最大值(凌驾这个就以为是显著了,没有发现凌驾的话,则以为不具有统计显著性),效果中所有的k=0时都市对应一个ACF值,为1(相当于对于一个k=n而言,会取原点的变量值和与它相隔n个时间距离的变量值去求ACF函数值)。由于抽样的偏误性,ACF函数在差异的k值上应该不会正好为0.
2.随机闲步
? ? ? 随机闲步的时间序列:指某一个时间序列的某一变量在一连时间点之间的差异是白噪声
? ? ? 条件条件:
? ? ? 划定递归关系:
首先,递归关系是指这个时间序列中,每一个时间步骤上的某个变量值都市被界说为这个时间序列上之前的时间步骤上这个变量的值和某个增量的函数(如第一个函数);其次,划定一个该时间序列第一个项的初始状态值
这里,第一个方程划定了在指定的时间步骤为t的某个变量的值上,通过加入项,来跟他往后措一个时间步骤的这个变量的值发生联动;第二个方程划定了该随机闲步时间序列的起始条件(即第一个项)是一个白噪声序列的第一个项。
凭证一个并行的白噪声序列发生的每一个单个的正或负的数值(即白噪声时间序列中的项)对于它自己的当前值举行调整的一种序列
在时间步骤t,随机闲步的对应项现实就是t个均值为0,方差都为自力同漫衍变量之和,这些变量都是白噪声序列的项。可以推断随机闲步(不带有漂移的随机闲步序列)的均值函数对于所有的时间点都是0,方差是t
得出,故方差会随着时间序列的增添而变大
? ? ? 结构随机闲步:
? ? ? 对一个白噪声随机序枚举行累计求和,使用R语言cumsum()函数来做
? ? ? 拟合随机闲步:
? ? ? 盘算所给的时间序列的一连差值,用R语言的diff()函数;再用白噪声检测去磨练,只要切合白噪声序列就可以推断为随机闲步。
? ? ? 带有漂移的随机闲步序列:
? ? ? 在Yt和Yt-1的差值上,给序列中的每个点加上了一个常数项a,这个常数项a被称作为漂移。若我们先获得一个随机闲步,把它改作一个带有漂移项的随机闲步,那么改变后的序列的方差和改变之前是相同的,可是改变之后的序列的均值是实时转变的,为t*a五、平稳性假设
? ? ? 1.几个概率的区分:
? ? ? 团结概率:在多元的概率漫衍中多个随机变量划分知足各自条件的概率。假设X和Y都听从正态漫衍,那么P{X<4,Y<0}就是一个团结概率,体现X<4,Y<0两个条件同时建设的概率。体现两个事务配合发生的概率。A与B的团结概率体现为 P(AB) 或者P(A,B),或者P(A∩B)。
? ? ? 边缘概率:是某个事务发生的概率,而与其它事务无关。
? ? ? 条件概率:指事务A在另外一个事务B已经发生条件下的发生概率。条件概率体现为:P(A|B),读作“在B条件下A的概率”。
? ? ? 2.时间序列展望建模假设:
? ? ? 平稳性假设:一个时间序列的概率体现不会随着时间的流逝而改变,即对时间平移的稳固性做了假设——主要但有限制性的假设(即对统一个小的时间段内,不能时间往后推移了,这个小的时间段的转变就泛起天壤之别)
? ? ? 严酷平稳(强平稳):(即在一个时间长河中,对于统一个小的时间段,它的转变幅度需要一模一样,不管这个时间段巨细怎样)
? ? ? 从时间t起始的一个点序列的团结概率漫衍和从时间T起始的另一个点时间列
的团结概率漫衍相同,其中T=t+k。在这里,我们的n指的是所有可能的一个时间距离;k指的是时间延迟,说明在整个时间推移上这个纪律都是通用的。
? ? ? 当我们选择极端情形n=1时,说明序列中每个点的概率漫衍都是相同的(单变量概率),证实晰在一个严酷平稳的时间序列中,均值函数是不随时间转变的常数,方差也是不随时间转变的常数。
? ? ? 但这个在现实中很难实现,欠好验证。
? ? ? 弱平衡:(平稳随机历程、平稳时间序列)(即在一个时间长河中,对于统一个小的时间段,它的转变幅度总体是趋向一个尺度的,可是允许对于差异的时间段泛起差异的颠簸)
? ? ? 均值函数是常数函数,不随时间转变;协方差函数仅与时间差相关,依赖于序列中两点之间的时间延迟。体现为,其中
体现为时间步骤为t+k与时间步骤为t所形成的时间段的转变幅度。
? ? ? 说白了,不管是严酷平衡照旧弱平衡都要求对于指定的时间段,在时间长河上的这个段内的差异体现(均值)是相同的,只不外严酷平衡还要求不管这个时间段取多大,他们所体现出来的协方差还要相同(统一的);而弱平衡只要求每个详细的时间段在时间长河上所体现的方差是相同的就好,意味着差异的时间段k体现出的协方差可以是差异的
3.平稳时间序列
? ? ? 平稳时间序列的均值函数、自协方差和自相关性如下:
? ? ? 其中延迟为0的自协方差(即
)就是方差。
? ? ? 白噪声是一个平稳历程(强平稳),他的均值是一个常数,方差也是一个常数;随机闲步的均值是常数(带有漂移的随机闲步并不是)可是方差是随着时间的转变而差异的,它是不平稳的
六、平稳时间序列模子
1.移动平均模子MA
模子建设
? ? ? 移动平均MA历程是一个随机历程,其中在时间步骤t的随机变量是一个白噪声历程的(时间上)最近的项(详细到最近的哪几项这个值为q)的线性组合,体现如下,其中q是这个时间步骤t能用前面的几项来形貌,为系数(常数值):
或者是
,其中
相当于是线性关系中的常数项,加不加都行,且e体现的各项是均值为0、方差为
的白噪声随机变量。
? ? ? 对上一个式子举行刷新,以用这个量去体现时间步骤t的变量值,引入后算因子这个看法,当后算因子用于一个随机历程中在时间t的随机变量时,会发生前一个时间步骤t-1的随机变量,如下:
? ? ? 通过这样,可以通过一连用后算因子来获得时间更早的随机变量,我们可以看出,代表运用后移算子两次即后移了两个时间步骤。最终以用
这个量去体现时间步骤t的变量值,刷新成:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(这里默认了
为1)
? ? ? 这个包罗了一个后移算子B的 q阶多项式称作MA历程的特征多项式,如下:
? ? ? 这里我们首先将后移算子B换成了x,不管MA历程的系数或者阶数q怎样选择,他都市是平稳的(由于e是一个白噪声序列)。回到特征多项式
上,对于这个多项式的根,若是绝对值大于1,那么这个MA历程称作是可逆的,一个ACF图对应的可逆MA历程是唯一的,可是这个ACF图对应的不行逆MA历程则不是唯一的。
统计学性子:
? ? ? 由于每个e项都是一个白噪声随机变量,以是MA历程的均值恒为0,方差如下(是一个常数),我们界说为1(这么做纯粹是为了写出后面的求和公式)(这个公式也说明,向前推q个历程的q不影响整个时间序列的均值,可是印象它的方差)
? ? ? 由于MA历程的阶数是通过自相关函数求的,于是将自相关函数给出如下:
? ? ? 焦点是MA历程的ACF(自相关函数)对于小于该历程的阶数q的延迟是非0值,之后就都即是0(这里涉及到一个显著性问题,以是在图上若是都在虚线内就以为是0了)(用人话来讲,就是先做出MA历程关于延迟的ACF函数,找到在某个k值之前的ACF函数值都是非0值可是之后的都是0值的,这个k值就是q的取值)这个历程用于判别MA历程(画ACF看看到底能不能用MA模子)而且估算MA历程的阶数(确定MA模子之后看它的阶数q是几多是有用的),在这里,我们把具有统计学显著性的非0值得最大延迟数作为它的阶数
? ? ? R语言中经常用arima.sim()函数模拟MA(和其他历程)历程,指定n参数为序列的长度(时间区间的长度),model参数为要模拟的序列的参数(包罗ma属性中设置了系数的取值,是一个向量,sd属性中设置了白噪声项的尺度差(即e的尺度差))。这个函数的返回值中ts(一个特殊的时间序列工具)包罗了模拟效果,用来追踪一个时间序列的某些基本信息和支持专门用于时间序列剖析的绘图。
2.自回归模子AR
模子建设
? ? ? 自回归模子AR源自让一个简朴的模子凭证已往有限窗口时间里(也就是说,我们站在时间步骤t上,看看之前的窗口(若是是p)内包罗的p个时间步骤的值,怎样去诠释现在时间步骤t的值)诠释某个时间序列当前值的想法。一个p阶AR模子的方程是:
或
,其中
可以看做是线性关系中的常数项。
? ? ? 再次引入后移算子这个工具,酿成用这个量去体现时间步骤t的变量值,获得:
或
?(这里默认了
为1)
? ? ? 与MA差异,AR纷歧定总是平稳的,先看AR的特征方程(其中照旧用x换掉了B):
或
? ? ? 当且仅当方程的根都大于1,AR历程才是平稳的。方程的根都大于1的须要(非充实条件)为:
? ? ? 这个AR的特征方程经常用来发现非平稳的AR历程,例如随机闲步就是非平稳的,由于第一个系数就是1
统计学性子
? ? ? AR没有像MA历程里的那种所有大于MA历程阶数q的延迟值对应的ACF都是0的分段性子,它的ACF更体现出一种指数型衰减(不像MA那种一下掉下来(显著性为0的带子里)),以是我们改用偏自相关函数PACF图去看。时间延迟k的偏自相关界说为在消除了小于k的延迟中存在的任何相关性影响下所发生的相关性,即p阶AR历程仅仅依赖于已往恰恰p个单元时间的历程的值。
? ? ? 判断要领:对于所有大于p的延迟,PACF图会泛起0值,把PACF延迟项k泛起了统计学显著性(非0值)的最大时间延迟数(即在这个最大的k值前不泛起统计学显著性非0值)当做AR历程的阶数。
3.自回归移动平均模子ARMA
? ? ? 把移动平均和自回归模子合并成一个兼具移动平均历程和自回归模子的元素的模子,界说为移动平均自回归ARMA模子。一个ARMA(p,q)历程(具有p阶自回归项和q阶移动平均项的ARMA历程)的一样平常方程如下:
? ? ? 其中我们默认了和
这种常数项就不思量了。
? ? ? 一个纯移动平均历程MA(q)可以写成ARMA历程ARMA(0,q)
? ? ? 一个纯自回归历程AR(p)可以写成ARMA历程ARMA(p,0)
? ? ? ARMA历程平稳的条件是在它的AR因素的特征方程(即
)存在绝对值大于1的根
? ? ? ARMA历程是可逆的条件是在它的MA因素特征方程(即
)存在绝对值大于1的根
? ? ? ARMA历程是唯一的条件是MA和AR因素的特征方程没有配合的因式,由于配合的因式会相互抵消,让我们获得一个相等的但更低阶的ARMA历程
4.ARMA、AR、MA历程的处置赏罚历程(以ARMA为例):
? ? ? 第一,通过找出p和q来判别ARMA历程的阶数
? ? ? 第二,实验估算AR和MA因素的系数值(即和
)——可以通过视察到的序列和估算的序列之间误差平方和最小化去卡这个系数值,或者通过AIC去判断
八、非平稳时间序列模子
? ? ? 解决的方案要不就是从原始数据上派生出一个平稳模子,要不就是对它的非平稳体现举行建模
1.基础看法:
? ? ? 差值序列:对于原始序列而言,通过求解一连点Yt和Yt+1之间的差DYt,组成了一个新的时间序列模子
? ? ? 二阶差值序列:对于差值序列,再次对于它的一连点取差值,获得的谁人序列叫做二阶一连差值
? ? ? d阶差值:通过重复d次盘算一连项的差值,从某个原始序列Yt获得一个新的点序列Wt,方程为:
2.ARIMA模子:
? ? ? ARIMA模子(整合自回归移动平均历程):组成这个时间序列的项是d阶差值Wt,这个d阶差值是一个平稳的ARMA历程。一个ARIMA(p,d,q)历程要求d阶差值,具有q阶的MA因素,以及p阶的AR因素。一个通俗的ARMA(p,q)历程就即是一个ARIMA(p,0,q)历程
? ? ? 拟合历程:
? ? ? 第一步,确定适当的d值,即我们需要取差值的次数
平稳性磨练——平稳即代表没有显着趋势且颠簸规模有限
? ?磨练要领:
?
时序图磨练:凭证平稳时间序列的均值和方差都为常数的性子,平稳序列的时序图显示该序列值始终在一个常数周围随机颠簸,而且颠簸的规模有界;若是有显着的趋势性或者周期性,那它通常不是平稳序列(直接把数据画在图上,看看他是不是平稳在某个值周围而且颠簸是有限的)
自相关图磨练:平稳序列具有短期相关性,这个性子批注对平稳序列而言通常只有近期的序列值对现时值得影响较量显着,距离越远的已往值对现时值得影响越小。随着延迟期数k的增添,平稳序列的自相关系数会较量快的衰减趋向于零,并在零周围随机颠簸,而非平稳序列的自相关系数衰减的速率较量慢。(对于一个平稳序列而言,其k值较小时ACF图的值可以很大,可是随着k值变大,ACF图的值应该是迅速减小并衰减至0)
单元根磨练。指的是是否存在单元根,若是存在单元根,即为非平稳时间序列
? ? ? ? ? ? ? ? 用的最多的就是扩展Dickey-Fuller(ADF)磨练,建设的回归模子如下:
? ? ?
? ? ? ? ? ? ? ? 其中,k代表模子中能允许的最大时间延迟数目,第一项来自于AR模子,最后一项来自于MA模子。
? ? ? ? ? ? ? ? ADF的零假设(原假设)是:当前时间序列是非平稳的——回归模子展望一个近似于0的系数
? ? ? ? ? ? ? ? 当拒绝原假设时:当前时间序列是平稳的——回归模子展望的系数就会小于0
? ? ? ? ? ? ? ? R语言中挪用adf.test()函数,这个函数会默认k值(由于拿到一个数据时间,不知道数据所建设的模子能允许的最大时间延迟数目是几多)即是不凌驾待检
? ? ? ? ? ? ? ? 验时间序列长度的立方根的最大整数。返回的效果是一个p值,默认的置信度下,它的阈值是0.05,即小于0.05批注被磨练的时间序列是平稳的,大于0.05
? ? ? ? ? ? ? ? 体现被磨练的时间序列是不平稳的
? ? ? ? ? ? ? ? 附:单元根磨练要领及方式:
? ? ? ? ? ? ? ? 扩展Dickey-Fuller磨练(ADF)——原假设为时间序列非平稳,p值小于0.05时时间序列被证实是平稳的,大于0.05为非平稳
? ? ? ?Philips-Perron磨练(Philips-Perrontest)——原假设为时间序列非平稳,p值小于0.05时时间序列被证实是平稳的,大于0.05为非平稳
? ? ? ?Kwiatkowski-Phillips-Schmidt-Shin磨练(KPSS)——原假设为时间序列平稳,p值小于0.05时时间序列被证实是非平稳的,大于0.05为平稳
? ? ? 第二步,重复ARMA模子处置赏罚历程
3.ARCH模子
? ? ? 当通过季节性转变和查分后,还不能用ARIMA模子诠释时,这样的非平稳时间序列建模可以通过做出一个假设:假设数据非平稳的缘故原由是该模子的方差会以一种可预见的方式随时间转变。基于这个假设,我们可以对方差随时间的转变建模为一个自回归历程(AR),这种模子也被称为自回归条件异方差(ARCH)。异方差性是形貌常熟方差的同方差性的反义词。
? ? ? p阶ARCH模子的方程为:
? ? ? 序列项的均值为0,其方差盘算方式如下;
为白噪声序列项(在这里我们假设白噪声历程
的方差为1,均值为0,为了强调该历程是自回归历程;若是
方差不是1,只会在效果中引入一个常数的乘数因子,可是不会改变模子的自回归本质):
?
? ? ? 可以看出ARCH模子在对于序列项在时间步骤t的方差是离它最近的已往的p个时间步骤所对应的方差的线性加权和。通过这样的历程,我们获得了一个可是此外p阶AR历程。
4.GARCH模子
? ? ? GARCH模子称作广义自回归条件异方差模子,即是一个ARCH模子增添了移动平均方差因素,ARCH(p)等价于? GARCH(p,0)
? ? ? GARCH(p,q)历程的一样平常形式如下:
