
非线性数据拟合
实际的数据拟合问题研究中一般分为线性数据拟合和非线性数据拟合。其中,线性数据拟合通常是採用一组简单的、线性无关的基函式来逼近试验数据。而对于非线性数据拟合问题,通常分为两种情形进行处理,一种是利用变数代换,将其转为线性问题再求解。另一种是不能线性化的问题,处理起来比较麻烦,可以用MATLAB等程式来实现。
基本介绍
- 中文名:非线性数据拟合
- 外文名:nonlinear data-fitting
- 分类:计算机 数学
- 方法:最小二乘法
- 工具:MATLAB等
- 功能:比较拟合结果
简介
在科学技术的各领域中,不同变数之间的相互关係通常用函式描述。有些函式关係可由经典理论分析推导得出,不仅为进一步的分析研究工作提供理论基础,也可以方便的解决实际工程问题。但是,很多工程问题难以直接推导出变数之间的函式表达式,或者即使能得出表达式,公式也十分複杂,不利于进一步的分析与计算。由于研究需要,希望能得到这些变数之间的函式关係,这时就可以利用曲线拟合方法,用已知的实验数据结合数学方法得到变数之间的近似函式表达式。而在处理实验数据时,常用的是最小二乘法。
在实际的数据拟合问题研究中一般分为线性数据拟合和非线性数据拟合。其中,线性数据拟合通常是採用一组简单的、线性无关的基函式来逼近试验数据。而对于非线性数据拟合问题,通常分为两种情形进行处理,一种是利用变数代换,将其转为线性问题再求解。另一种是不能线性化的问题,处理起来比较麻烦,可以用MATLAB等程式来实现。
定义
设有实验数据(
),(i=1,2,3....n),寻找函式
,使得函式在点
处的观测值与观测数据偏差的平方和达到最小。解决此类问题,有以下几个步骤:首先做出散点图,确定函式类别;根据已知数据确定待定函式的初始值,用MATLAB软体计算最佳参数;根据可决係数u,比较拟合结果。



方法
为了实现非线性数据拟合,首先要定义函式,通常採用inline定义的函式用于曲线拟合、数值计算。
步骤:1、建立M档案;
2、fun=inline('f(x)','参变数','x').
在实际问题中,有时散点图做出后未必是多项式的图形,可能像其他的曲线,这是可以猜测曲线类型,然后利用如下命令:
[beta,r,J]=nlinfit(x,y,fun,beta0)
其中,x y为原始数据,fun是在M档案中定义的函式,beta0是函式中参数的初始值;beta为函式的最优值,r是各点处的拟合残差,J为雅克比矩阵的数值。
MATLAB实现
LSQNONLIN 解决非线性最小二乘法问题,包括非线性数据拟合问题;LSQCURVEFIT 解决非线性数据拟合问题,下面给出利用这两个函式的例子。
LSQNONLIN
下面的例子说明利用LSQNONLIN函式用下面的函式进行拟合:
f = A + B exp(C*x)+D*exp(E*x)
对数据集x与y进行拟合,其中y是在给定x的情况下的期望输出(可以是方程给出数组,也可以是单独数据组成的数组)。
为了解决这个问题,先建立下面的名为 fit_simp.m的函式,它利用数据x与y,将他们作为最佳化输入参数传递给LSQNONLIN。利用给定的数据x计算f的值,再与原始数据y进行比较。经验值与实际计算出的值之间的差异作为输出值返回。LSQNOLIN函式就是最小化这些差的平方和。
function diff = fit_simp(x,X,Y)
A = x(1);B = x(2);C = x(3);D = x(4);E = x(5);
diff = A + B.*exp(C.*X)+D.*exp(E.*X)-Y;
下面的脚本是利用上面定义的fit_simp.m函式的一个例子:
>> X=0:.01:.5;
>> Y=2.0.*exp(5.0.*X)+3.0.*exp(2.5.*X)+1.5.*rand(size(X));
>> X0=[1 1 1 1 1]';
>> options=optimset('Largescale','off');
>> x=lsqnonlin(@fit_simp,X0,[],[],options,X,Y);
Optimization terminated successfully:
Gradient in the search direction less than tolFun
Gradient less than 10*(tolFun+tolX)
>> Y_new=x(1)+x(2).*exp(x(3).*X)+x(4).*exp(x(5).*X);
>> plot(X,Y,'+r',X,Y_new,'b');
注意:LSQNONLIN 只可以处理实数变数。在处理包括複数变数的实例的拟合的时候,数据集应该被切分成实数与虚数部分。
下面给出一个例子演示如何对複数参数进行最小二乘拟合。
为了拟合複数变数,你需要将複数分解为实数部分与虚数部分,然后把他们传递到函式中去,这个函式被LEASTSQ作为单个输入调用。首先,将複数分解为实部与虚部两个向量。其次,将这两个向量理解成诸如第一部分是实部、第二部分是虚部。在MATLAB函式中,重新装配複数数据,并用你想拟合的複数方程计算。将输出向量分解实部与虚部,将这两部分连线为一个单一的输出向量传递迴LEASTSQ。
下面,给出一个例子演示如何根据两个複数指数拟合实数X与Y。
建立方程:
function zero = fit2(x,X,Y)
cmpx = x(1:4)+i.*x(5:8);
zerocomp = cmpx(1).*exp(cmpx(2).*X) +
cmpx(3).* exp(cmpx(4).*X)-Y;
numx = length(X);
zero=real(zerocomp);
zero(numx+1:2*numx)=imag(zerocomp);
Y = a*exp(b*X)+c*exp(d*X);
>> X=0:.1:5;
>> Y=sin(X);
>> Y=Y+.1*rand(size(Y))-.05;
>> cmpx0=[1 i 2 2*i];
>> x0(1:4)=real(cmpx0);
>> x0(5:8)=imag(cmpx0);
>> x=leastsq(@fit2,x0,[],[],X,Y);
>> cmpx=x(1:4)+i.*x(5:8);
>> Y1=real(cmpx(1).*exp(cmpx(2).*X)+cmpx(3).*exp(cmpx(4).*X));
>> plot(X,Y1,'r');
>> hold on
>> plot(X,Y,'+');
LSQCURVEFIT
利用此函式可以在最小二乘意义上解决非线性曲线拟合(数据拟合)问题。也就是说,给定输入数据xdata,以及观测的输出数据ydata,找到係数x,使得函式F(x,xdata)能够最好的拟合向量值。LSQCURVEFIT利用与LSQNONLIN相同的算法。它的目的在于专门为数据拟合问题提供一个接口。在拟合的时候,2维、3维或者N维参数拟合是没有什幺差别的。
下面给出一个3维参数拟合的例子。待拟合函式是:
z = a1*y.*x..^2+a2*sin(x)+a3*y.^3;
function F = myfun(a, data);
x = data(1,:);
y = data(2,:);
F= a(1)*y.*x.^2+a(2)*sin(x)+a(3)*y.^3;
下面的脚本展示了这幺利用上面的函式:
>> xdata= [3.6 7.7 9.3 4.1 8.6 2.8 1.3 7.9 10.0 5.4];
>> ydata= [16.5 150.6 263.1 24.7 208.5 9.9 2.7 163.9 325.0 54.3];
>> zdata= [95.09 23.11 60.63 48.59 89.12 76.97 45.68 1.84 82.17 44.47];
>> data=[xdata; ydata];
>> a0= [10, 10, 10];
>> [a, resnorm] = lsqcurvefit(@myfun,a0,data,zdata)
Maximum number of function evaluations exceeded;
increase options.MaxFunEvals
a = 0.0088 -34.2886 -0.0000
resnorm = 2.2636e+004
>> format long
>> a
a = 0.00881645527493 -34.28862491919983 -0.00000655131499
>> option=optimset('MaxFunEvals',800);
>> option=optimset('MaxFunEvals',800);
>> [a, resnorm] = lsqcurvefit(@myfun,a0, data, zdata, [], [], option)
Optimization terminated successfully:
Relative function value changing by less than OPTIONS.TolFun
a = 0.00740965259653 -20.21201417111138 -0.00000502014964
resnorm = 2.195886958305428e+004