回归交互项的解读

回归交互项的解读

文章简单阐述了交互项的解读,以及其与机制、异质性、调节和分组回归的差异与联系

1 交互项的方程设定 —— 一个例子

在机制或异质性分析中,交互项通常扮演着重要作用,即通过交互项的系数解读其经济含义。然而,我发现许多人对于如何解读交互项的数学统计含义都存有困难,更别说经济意义了,尤其是遇到双重差分的交互项(三重差分)时。更是一头雾水。因此,特撰此文以供讨论。

首先,我们以数字化转型 $DT$ 与企业融资约束 $FC$ 为例,构建如下基准模型:
$$
FC_{it} = \alpha + \beta DT_{it} + \gamma’CONTROLS_{it} + \delta_i + \lambda_t + \varepsilon_{it}
$$
如果不出意外的话,系数 $\beta$ 应该显著为负,因为数字化转型能够降低企业所面临的融资约束问题,不妨假设系数 $\beta = -0.1$。

接下来,我们假设信息不对称程度 $ASY$ 是数字化转型 $DT$ 降低企业融资约束 $FC$ 的机制变量(这里特别提一嘴,不再建议使用三步中介效应模型),那么在设定上,我们采用如下方程:
$$
FC_{it} = \alpha + \theta DT_{it} \times ASY_{it} + \beta DT_{it} + \psi ASY_{it} + \gamma’CONTROLS_{it} + \delta_i + \lambda_t + \varepsilon_{it}
$$
在一般情况下,我们不能简单地将 $DT$ 与 $ASY$ 直接相乘(尽管不少文献是这么做的),更一般的,我们要将机制变量,也就是 $ASY$ 按照某种规则进行分组处理(例如全样本、行业-年份、城市-年份中位数等),从而生成一个 0-1 虚拟变量 $DASY$。$DASY = 0$ 代表信息不对称程度较低的那组,反之,则代表信息不对称较高的那组。上述模型即可改写为:
$$
FC_{it} = \alpha + \theta DT_{it} \times DASY_{it} + \phi DT_{it} + \psi DASY_{it} + \gamma’CONTROLS_{it} + \delta_i + \lambda_t + \varepsilon_{it}
$$
那么,当信息不对称程度较高时,$DT$ 对 $FC$ 的边际效应为:
$$
{\frac{\partial\mathbb{E}[FC_{it} | DASY_{it} = 1]}{\partial DT_{it}}} = \theta + \phi
$$
类似的,信息不对称程度较低时,有
$$
{\frac{\partial\mathbb{E}[FC_{it} | DASY_{it} = 0]}{\partial DT_{it}}} = \phi
$$
在本质上,交乘和分组时没区别的(当然,你想调节显著性的话还是有点区别的),比较上述两组边际效应可知,在信息不对称程度较高的一组,其边际效应比低组多 $\theta$。

根据正常思路,数字化转型应当通过降低信息不对称程度,来缓解企业所面临的融资约束。因此,在信息不对称更高的一组,降低的效果应该更强,即 $\theta$ 应当显著为负。只有这样,边际效应 $\theta + \phi$ 的绝对值才能大于边际效应 $\phi$。

需要注意的是,如果数据是合理的,应该还要观察到系数(如果显著的话),$\phi < 0$,$\psi > 0$,因为数字化转型与融资约束的关系应当为负,信息不对称与融资约束关系应当为正。

2 机制的交互项解读 —— 更一般的规律

通过上述分析,我们可以总结出更一般的规律,对于如下基准模型和交互模型:
$$
y_{it} = \alpha + \beta x_{it} + \gamma’ controls_{it} + \varepsilon_{it}
$$

$$
{y_{it} = \alpha + \theta x_{it} \times Dm_{it} + \phi x_{it} + \psi Dm_{it} + \gamma’ controls_{it} + \varepsilon_{it}}
$$

其中,$Dm$ 为机制变量所对应的 0-1 虚拟变量,$Dm = 1$ 为 $m$ 更高的那组。若 $m$ 为 $x$ 可影响的变量,且 $y$ 也受到 $m$ 影响,那么有如下关系(当然前提是符合理论逻辑,且系数显著):

$\beta$ $\theta$ 关系
- - $x$ 通过降低 $m$ 来降低 $y$
- + $x$ 通过增加 $m$ 来降低 $y$
+ + $x$ 通过增加 $m$ 来增加 $y$
+ - $x$ 通过降低 $m$ 来增加 $y$

注意,这里提到 $m$ 必须是 $x$ 可影响的变量且可影响 $y$ 的变量才能用如上的方式进行解读。难道 $m$ 不能被 $x$ 影响就不能作为机制了吗?显然不是(但大多数情况是的)。例如“寻租效应”可以通过“是否国企($SOE$)”和“是否政治关联($PR$)”来生成交互变量,如果观察到国企或具有政治关联的企业有更强的效应,那么即可验证“寻租效应”是研究的一条机制(当然前提还是符合理论逻辑)。

3 机制和异质性的区别 —— 越来越模糊?

现在一些文章不会刻意强调进行的交乘回归或者分组回归到底是机制还是异质性,只因二者的模型和方法过于相似,曾经我还见到过声称“交乘做机制,分组做异质性”、“机制和异质性只是分组方法不同”等评论,但事实上,所研究的到底是机制还是分组,更重要的是变量的选取和理论逻辑的合理性

例如,在数字化转型和融资约束的研究中,学者们通常会探究企业规模、东西部地区、产权性质等对异质性作用。但是会有人把这些变量当作机制吗?显然不会,因为这类变量对于研究为什么数字化转型会降低融资约束只能起到一个拓展性的作用,无法解释其中的影响渠道。那么现在论文中关于机制、异质性、调节、分组、交乘等等究竟是什么关系呢?个人之见如下:

  • 机制:探究“为什么 $x$ 会影响 $y$”这一问题,可以采用交乘、分组或直接对 $m$ 回归的方法进行检验(还有不建议的中介效应模型)
  • 异质性:拓展 $x$ 对 $y$ 经济效应的研究,但无法解释为什么 $x$ 会影响 $y$,可以采用交乘和分组方法进行检验
  • 调节:交乘和分组方法的统称,所谓调节效应就是类似于前文中提到的,两个边际效应的差值 $\theta$
  • 交乘:通过设定类似于模型 ${y_{it} = \alpha + \theta x_{it} \times Dm_{it} + \phi x_{it} + \psi Dm_{it} + \gamma’ controls_{it} + \varepsilon_{it}}$ 的方法对机制或异质性进行分组,观察交互项系数与基准回归系数得出结论
  • 分组:通过一定的规则区分样本,然后分别对基准模型进行回归,比较两组系数差异得出结论

4 交乘的交乘 —— 还是建议分组吧

如果想要通过交乘方法检验交互基准模型的机制,以数字化转型为例,我们探究规模交互下,信息不对称的机制作用
$$
\begin{aligned}
FC_{it} &= \alpha + \sigma DT_{it} \times DSMALL_{it} + \phi_1 DT_{it} + \phi_2 DSMALL_{it} + \gamma’CONTROLS_{it} + \delta_i + \lambda_t + \varepsilon_{it}
\end{aligned}
$$

$$
\begin{aligned}
FC_{it} &= \alpha + \theta DT_{it} \times DSMALL_{it} \times DASY_{it}\
&+ \beta_1 DT_{it} \times DSMALL_{it} + \beta_2 DT_{it} \times DASY_{it} + \beta_3 DASY_{it} \times DSMALL_{it}\
&+ \psi_1 DT_{it} + \psi_2 DSMALL_{it} + \psi_3 DASY_{it} + \gamma’CONTROLS_{it} + \delta_i + \lambda_t + \varepsilon_{it}
\end{aligned}
$$

其中,$DSMALL = 1$ 代表企业规模低于中位数的企业。

是不是已经开始眼花缭乱了?有人会质疑,那些单项有必要放吗?只放第一项 $DT_{it} \times DSMALL_{it} \times DASY_{it}$ 难道不可以?很遗憾,从计量的角度来看,这样操作会导致严重的遗漏变量问题,因为模型没有把 $DT$、$DASY$ 等作用从交互项中剥离出来,所估计的系数必然有偏。

那么如何解读呢?事实上还是关注交互项系数就好。首先看基准回归,数字化转型对于中小企业的作用应当更大,所以系数 $\sigma$ 应该显著为负,系数 $\phi_1$ 也显著为负。

来到交互模型这里,如果想要验证数字化转型通过降低中小企业的信息不对称程度来实现缓解融资约束,那么交互项 $DT_{it} \times DSMALL_{it} \times DASY_{it}$ 的系数 $\theta$ 应该显著为负,因为在信息不对称更高的一组($DASY = 1$),这种效应将会更强。

但,言归正传,模型设定上太过复杂,这种情况下可能分组会更好理解一些。

作者

CodeFox

发布于

2024-07-06

更新于

2024-07-06

许可协议

评论