计量复习笔记 (IV):时间趋势与收敛速率

Info

本系列是2023年春季学期《应用计量经济学》期末复习笔记,仅涵盖时间序列部分,对应 Hansen (2022) Econometrics 第14和16章的内容。

内容提要 

介绍了含时间趋势回归中 OLS 估计量的渐进分布,揭示了收敛速率的差异。

时间趋势回归 

考虑线性回归模型

$$ Y_t = \beta_0 + \beta_1 t + e_t $$

其中 $\{e_t\}$ 是平稳遍历的鞅差分,方差为 $\sigma^2$。

假设我们有 $t=1,\dots,n$ 的样本,OLS 估计量(的偏误)就是

$$ \begin{pmatrix} \hat{\beta}_0-\beta_0 \\ \hat{\beta}_1-\beta_1 \end{pmatrix} = \begin{pmatrix} n & \sum_{t=1}^n t \\ \sum_{t=1}^n t & \sum_{t=1}^n t^2 \end{pmatrix}^{-1} \begin{pmatrix} \sum_{t=1}^n e_t \\ \sum_{t=1}^n te_t \end{pmatrix} $$

很显然,$\frac1n\bm{X}'\bm{X}$ 是不收敛的,因为 $\sum_{t=1}^n t = O(n^2)$,$\sum_{t=1}^n t^2 = O(n^3)$。不过,我们可以做一些 rescaling 凑出收敛。

首先将 $\bm{X}'\bm{X}$ 统一调成 $O(1)$,这意味着放缩因子是

$$ \begin{pmatrix} 1 & \frac{1}{n^2} \\ \frac{1}{n^2} & \frac{1}{n^3} \end{pmatrix} $$

能起到缩放作用的是对角矩阵,左乘一个对角矩阵意味着逐行放缩,右乘一个对角矩阵意味着逐列放缩。假设我们对 $\bm{X}'\bm{X}$ 左乘和右乘相同的矩阵 $\bm{D}_n^{-1} = \text{diag}\{a,b\}$,则必定有

$$ a^2=\frac1n,\quad ab = \frac1{n^2},\quad b^2 = \frac{1}{n^3} $$

解当然不唯一,但我们取正值,也就是 $a = 1/\sqrt{n}$ 和 $b = n^{-3/2}$。

于是,通过缩放,我们得到

$$ \begin{align*} \bm{D_n} \begin{pmatrix} \hat{\beta}_0-\beta_0 \\ \hat{\beta}_1-\beta_1 \end{pmatrix} &= (\bm{D_n}^{-1}\bm{X}'\bm{X}\bm{D_n}^{-1})^{-1}\bm{D_n}^{-1} \begin{pmatrix} \sum_{t=1}^n e_t \\ \sum_{t=1}^n te_t \end{pmatrix} \\ &=\begin{pmatrix} 1 & \frac{1}{n^2}\sum t \\ \frac{1}{n^2}\sum t & \frac{1}{n^3}\sum t^2 \end{pmatrix}^{-1} \frac{1}{\sqrt{n}}\sum_{t=1}^n \begin{pmatrix} 1 \\ \frac{t}{n} \end{pmatrix} e_t \end{align*} $$

可以证明 $\frac{1}{n^2}\sum t\to\frac12$,$\frac{1}{n^3}\sum t^2\to\frac13$,因此

$$ \bm{D_n}^{-1}\bm{X}'\bm{X}\bm{D_n}^{-1} \to \begin{pmatrix} 1 & \frac12 \\ \frac12 & \frac13 \end{pmatrix} $$

Note

事实上,对任意 $r>0$,都有

$$ \lim_{n\to\infty}\frac{1}{n^{1+r}}\sum_{t=1}^n t^r = \lim_{n\to\infty}\sum_{t=1}^n \left(\frac{t}{n}\right)^r\cdot\frac1n = \int_0^1 x^r\\,dr = \frac{1}{1+r} $$

这里利用了 Riemann 积分的定义。

接下来,我们要考察第二个部分的渐进分布。前一讲的鞅差分 CLT 不足以用来证明,因为每一项的方差是变化的,需要回到 Davidson (1994) 定理24.3。不论如何,在 $e_t$ 是平稳遍历鞅差分的条件下,我们总可以使用中心极限定理,于是有

$$ \frac{1}{\sqrt{n}}\sum_{t=1}^n \begin{pmatrix} 1 \\ \frac{t}{n} \end{pmatrix} e_t \to_d N(\bm{0},\bm{\Sigma}) $$

其中渐进方差 $\bm{\Sigma}$ 就是

$$ \bm{\Sigma} = \lim_{n\to\infty} \sum_{t=1}^n\mathbb{E}\left[\begin{pmatrix} 1 \\ t/n \end{pmatrix}(1,t/n)e_t^2\right] = \begin{pmatrix} 1 & 1/2 \\\ 1/2 & 1/3 \end{pmatrix}\sigma^2 $$

因此,$\bm{D_n}(\hat{\bm{\beta}}-\beta)$ 的渐进分布

$$ \bm{D_n}(\hat{\bm{\beta}}-\beta) \to_d N(\bm{0},\bm{V}) \quad\text{where } \bm{V} = \sigma^2\begin{pmatrix} 1 & 1/2 \\\ 1/2 & 1/3 \end{pmatrix}^{-1} $$

可以看到,$\hat{\beta}_1-\beta_1 = O_p(n^{-3/2})$,比 $\beta_0$ 有更快的收敛速度。这本质上是因为,$X_t = t$ 是一个非平稳的(尽管是确定性的)时间序列,非平稳性意味着序列失去均值回归的性质,因而大数定律失效,欲得到回归或者收敛性,必须使用更高阶的平均。

参考 

Davidson, James (1994). Stochastic Limit Theory: An Introduction for Econometricians. Oxford University Press.

Hansen, Bruce (2022). Econometrics. Princeton University Press.


最后修改于 2024-09-04