新闻资讯
看你所看,想你所想

分段线性回归

分段线性回归

分段线性回归

分段线性回归是指当y对x的回归在x的某一範围的服从某种线性关係,在其他範围内又服从斜率不同的线性关係时适用的一种回归估计方法。这种方法使用指示变数对各段(即不同範围的)数据同时拟合统—的回归模型。

基本介绍

  • 中文名:分段线性回归
  • 外文名:piecewise linear regression
  • 所属学科:数学(统计学)
  • 相关概念:虚拟变数,解释变数,回归方程等

基本介绍

虚拟变数可以代表质的因素,有些情况下,虚拟变数也可以代表数量因素。分段线性回归就是类似情形中常见的一种。
在经济关係中常有这样的情况:当解释变数
的值达到某一水平
之前,与被解释变数
之间存在某种线性关係;当解释变数
的值达到或超过
以后,与被解释变数的关係就会发生变化。此时,如果已知
的转折点
。我们就可以用虚拟变数来估计每一段的斜率。这就是所谓的分段线性回归

模型分析

分段线性回归模型由两条直线组成,但在折点处曲线仍是连续的。考虑以下的基本模型:
假定因变数
和解释变数
均呈现随时间稳定增长的趋势,在时间
处反映两者之间关係的曲线出现转折,使得两段曲线的截距和斜率都发生变化,但
的变化具有连续性。我们设定以下形式的虚拟变数:
然后将待估计的分段线性回归模型写成
由式(1) 可以看出,当
处于不同时间段时,
的期望值分别为
时,有
时,有
时,有
即在
处曲线为连续的,图1反映出这一情况。
图1 分段线性回归模型图1 分段线性回归模型

举例分析

在研究实际经济问题时,有些经济变数之间的因果关係会在解释变数达到某个临界值时发生突变,为了区分这种变化,可以利用虚拟变数进行分段线性回归。
例如,根据消费理论,消费水平
主要取决于收入水平
;假设高收入与低收入人群的消费倾向存在差异,则这种消费倾向的差异可通过在收入的係数中引入虚拟变数来考察,建立如下消费模型:
其中,
为收入水平,
为划分高收入与低收入的临界值,
为消费水平,
为虚拟变数,
为随机扰动项。
若模型(2)的随机扰动项满足经典线性回归模型的基本假设,则可以得到:
低收入人群
高收入人群
式(3)和式(4)分别表示低收入人群和高收入人群的消费函式;不同收入人群的消费行为是否存在显着差异,可以通过
的统计显着性检验进行判断。
如图2所示,模型(2)实际上是将两段回归合併进行,这两段回归不仅截距不同,而且斜率不同。分两段线性回归引入了一个虚拟变数;容易推广,分
段线性回归应引入了
个虚拟变数。
图2 不同收入人群的消费差异图2 不同收入人群的消费差异

相关推荐

声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:yongganaa@126.com