视频字幕
单位根是时间序列分析中的重要概念。当自回归模型AR(1)中的系数ρ等于1时,我们称该序列存在单位根。此时序列变为随机游走过程,具有非平稳性特征。单位根序列的方差会随时间无限增长,且任何冲击的影响都是永久性的。图中红色线条展示了典型的单位根序列,可以看出其明显的趋势性和非平稳特征,而蓝色线条则是平稳序列,围绕均值波动。
增广迪基-福勒检验,简称ADF检验,是检测时间序列单位根最常用的方法。ADF检验的基本思想是在迪基-福勒检验基础上,增加滞后差分项来控制序列的自相关性。检验的原假设是序列存在单位根,备择假设是序列平稳。检验统计量为估计系数与其标准误的比值。判断时,如果ADF统计量小于临界值或p值小于显著性水平,则拒绝原假设,认为序列是平稳的。
在实际应用中,使用ADF检验需要遵循一定的步骤。首先进行数据预处理,检查缺失值并确定合适的检验类型。其次选择检验形式,可以选择无常数项和趋势项、含常数项、或含常数项和趋势项三种形式。然后确定滞后阶数,通常使用AIC或BIC信息准则自动选择。最后执行检验并解读结果。在Python中,可以使用statsmodels库的adfuller函数方便地进行ADF检验。
ADF检验结果的解读需要综合考虑多个指标。首先看ADF统计量,数值越小(越负)越倾向于拒绝原假设。其次看p值,小于0.05表示在5%显著性水平下可以拒绝原假设,认为序列平稳。此外还要参考临界值,ADF统计量小于临界值时拒绝原假设。表格中展示了四个典型案例:案例1和案例2都拒绝原假设,序列平稳;案例3处于临界状态;案例4明显存在单位根。在实际应用中,还需要结合经济理论和数据的实际特征进行综合判断。
通过本次学习,我们全面了解了增广迪基-福勒检验。ADF检验是时间序列分析中检测单位根的重要工具,通过检验可以判断序列是否平稳。检验基于自回归模型,通过增加滞后差分项来控制序列的自相关性。在实际使用中,需要进行数据预处理、选择合适的检验形式、确定滞后阶数,然后执行检验。结果解读时要综合考虑ADF统计量、p值和临界值,并结合经济理论进行分析。需要注意的是,ADF检验只是平稳性检验的一种方法,在实际应用中建议结合其他检验方法以获得更可靠的结论。
ADF检验的原理基于对传统迪基-福勒检验的扩展。我们从基本的AR(1)模型开始,通过差分变换将其转化为检验单位根的形式。当ρ等于1时,γ等于0,这就是我们要检验的原假设。ADF检验在此基础上增加了常数项、趋势项和滞后差分项,形成了三种检验形式。最基本的形式只包含滞后水平项,带常数项的形式考虑了序列的均值,而完整形式还包含了时间趋势。通过这种设计,ADF检验能够更好地控制序列的自相关性,提高检验的准确性。
ADF检验的实施需要遵循系统性的步骤。首先进行数据预处理,检查数据的完整性,处理异常值和缺失值,并绘制时间序列图观察数据特征。接下来选择合适的检验形式,根据序列是否有截距和趋势选择三种模型之一。第三步确定滞后阶数,通常使用AIC或BIC信息准则,选择使信息准则最小的滞后期数。然后执行检验,估计回归方程并计算ADF统计量。最后解读结果,将统计量与临界值比较,或根据p值判断是否拒绝原假设。每个步骤都很重要,需要仔细执行以确保检验结果的可靠性。
ADF统计量的计算是检验过程的核心环节。首先通过最小二乘法估计回归方程,获得γ参数的估计值和标准误。然后计算t统计量形式的ADF统计量,等于参数估计值除以标准误。需要注意的是,ADF统计量不服从标准t分布,而是服从特殊的Dickey-Fuller分布,这是一个左偏分布,临界值都是负数。在不同显著性水平下有不同的临界值,1%水平约为负3.43,5%水平约为负2.86,10%水平约为负2.57。通过计算示例可以看到,当ADF统计量为负2.78时,大于5%水平的临界值负2.86,因此在5%显著性水平下不拒绝原假设。
ADF检验结果的正确解读是关键环节。我们需要关注四个主要指标:ADF统计量值、p值、不同显著性水平的临界值,以及选择的滞后阶数。判断规则很明确:当统计量小于临界值或p值小于显著性水平时,拒绝原假设,认为序列平稳。通过三个典型案例可以看出不同情况的处理方法。案例1中统计量为负4.52,p值极小,强烈拒绝原假设。案例2处于边界情况,需要谨慎解读。案例3统计量为负1.45,p值很大,明显不拒绝原假设。在实际应用中,还要考虑经济意义,检查模型假设,必要时结合其他平稳性检验方法。