新闻资讯
看你所看,想你所想

曲线估计

曲线估计

曲线估计

线性回归不能解决所有的问题。儘管有可能通过一些函式的转换,在一定範围内将因、自变数之间的关係转换为线性关係,但这种转换有可能导致更为複杂的计算或失真。SPSS提供了11种不同的曲线回归模型中。如果线性模型不能确定哪一种为最佳模型,可以尝试选择曲线拟合的方法建立一个简单而又比较合适的模型。

基本介绍

  • 中文名:曲线估计
  • 外文名:curve estimation
  • 所属学科:数学
  • 相关概念:线性模型、非线性关係等

曲线估计的概念

线性回归可以满足许多数据分析,然而线性回归不会对所有的问题都适用,有时被解释变数与解释变数是通过一个已知或未知的非线性函式关係相联繫的。变数之间的非线性关係可以划分为本质线性关係非本质线性关係。所谓本质线性关係是指变数关係形式上虽然是非线性关係,但可通过变数变换化为线性关係,并可最终进行线性回归分析建立线性模型;非本质线性关係是指变数关係不仅形式上呈非线性关係,而且也无法通过变数变换化为线性关係,最终无法进行线性回归分析建立线性模型。而曲线估计是解决本质线性关係问题的。

11种常用模型

用户如果不能马上根据专业知识或是观测量数据本身的特点确定一种最佳模型,也可以利用曲线估计在11种不同的回归模型中选择建立一个简单而又比较适合的模型。SPSS可完成表1中有关曲线拟合的功能。
表1 不同模型的表示
模型名
回归方程
变数变换后的线性方程
二次曲线(Quadratic)
複合曲线(Compound)
增长曲线(Growth)
对数曲线(Logarithmic)
三次曲线(Cubic)
S曲线(S)
指数曲线(Exponential)
逆函式(Inverse)
幂函式(Power)
逻辑函式(Logistic)
在SPSS曲线估计中,首先,在不能明确究竟哪种模型更接近样本数据时可在多种可选择的模型中选择几种模型;然后,SPSS自动完成模型的参数估计,并输出回归方程显着性检验的F值和相伴机率p值、判定係数R2等统计量;最后,以判定係数为主要依据选择其中的最优模型,并进行预测分析等。另外,SPSS曲线估计还可以以时间为解释变数,实现时间序列的简单回归分析和趋势外推分析。

曲线估计的步骤

在实际问题中,当不能确定哪种曲线模型最接近样本数据时,可以运用曲线估计、曲线估计过程可以用于拟合许多常用的曲线,原则上只要两个变数之间存在某种可以被它所描述的数量关係,就可以用曲线估计过程来分析,曲线估计的基本步骤是:
(1)根据实际问题本身特点,选择几种常见的曲线模型;
(2)运用最小二乘法来完成每一种曲线模型的参数估计,并显示R方、F检验值、相伴机率值以及模型的相关係数等统计量;
(3)对参数估计的相关统计量进行检验,看其是否通过显着性检验;
(4)预测。选择R方统计量值最大的模型作为首选的曲线模型。

曲线估计的数据要求

(1)解释变数与被解释变数应该是数值型变数。如果在解释变数中选择了时间选项,要求被解释变数是以一定的时间量度的变数。在进行时间分析时,要求数据档案中的每一个观测量所使用的时间间隔和长度单位是完全统一的;
(2)模型的残差应该是任意且呈现常态分配的。如果选择了线性模型,被解释变数必须是常态分配的,且所有的观测值应该是独立的。

曲线估计在SPSS中的实现

1.打开注对话框
建立或打开数据档案后,按Analyze
Regression
Curve Estimation的顺序打开主对话框。
2.选择被解释变数
在源变数框中选择一个或多个被解释变数,送人Dependent(s)框中。
3.选择解释变数
在源变数框中选择解释变数,送人Independent框中,或者直接指定时间选项(time)作为解释变数。如果选择了时间作为解释变数,那幺被解释变数应该是用时间量度的变数。
4.选择观测量
在左侧源变数框中选择标示观测量的变数放入Case Labels框中。
5.选择拟合模型
在Models栏中选择一个或多个拟合模型,各模型解释见表1。
6.选择相关选项
(1)Include constant in equation:方程包含常数项,系统默认值。
(2)Plot models:绘製曲线拟合图,系统默认值。
(3)Display ANOVA Table:结果中显示方差分析表。
7.打开Save对话框
单击“Save”变数储存按钮,激活变数储存对话框。
(1)Save Variables选项:保存变数。点击一个或全部选项,可将相应的数值以新变数形式储存到资料库中,这些变数的定义将在结果中显示。其中,Predicted Values代表被解释变数的预测值;Residuals代表残差(观察值与预测值之差)选项;Prediction Intervals代表预测值区间(上下限)选项;Confidence Interval代表可信区间选项。
(2)Predict Case选项:预测观测量。如果解释变数为时间变数,可以在该栏中指定一种超出当前数据时间序列範围的预测周期。
①Predict from estimation period through last case选项:使用预先设定好的估计周期中的数据,求出所有观测量的预测值。要完成这一步,必须先通过Data选单中Select Cases选项中的Select
Base on time or case range定义估计周期,当前的估计周期显示在对话框的底部。如果没有预先设定估计周期,计算时使用所有的观测量。
②Predict through选项:根据预先设定的周期,使预测值通过特定的数据、时间或者特定的观测量。如果预测值的範围超出了时间序列的範围,应该选择该选项,并在随后的Observation框中输入一个预测周期的末端值。
8.单击OK按钮提交运行
在大多数情况下,对变数之间关係的认识往往模糊不清,需要先绘製散点图。
根据数据分布的特点,确定应採用的模型。可以多指定几个模型进行拟合检验,根据输出的统计量,例如R2值,结合图形综合考虑,确定最佳图形。

相关推荐

声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:yongganaa@126.com