ANUSPLIN41用户指南 下载本文

ANUSPLIN41用户指南

ANUSPLIN是提供实用的转换分析和对多变量数据采用薄 盘光滑样条插值进行插值的工具。它提供了完整的统计分析、数据诊断以及空间分布标准误。同样也支持多种数据输入和表面查询功能。

薄盘光滑样条表面拟合法最早由Wahba提 出(1979),然后 由Bates和Wahba(1982),Elden(1984),Hutchinson(1984)和de Hoog(1985)对其进行了改进以适用于大数据集。Bates et al.(1987)将其扩展为局部样条法,这样就可以把参数线性亚模 型(或协变量)添加插值中,而不像以前只能考虑独立样条变量(即自变量)。这为这些因变量提供由这些自因变量决定的参数form提供了一种极好的方式。在没有独立样条变量的情况下 (当前不允许),将进行简单的多变量线性回归。

薄盘光滑样条插值事实上可以被看作广义的标准多变量线性回归,但是参数模型由一个适用的光滑非参数函数所替代。拟合函数的光滑度,或者与之相对的复杂度通常 会根据数据拟合表面的最小预测误差通过GCV(广 义交叉验证)自动计算。GCV对 数据模拟结果的验证由Craven和Wahba(1979)年提出并完成。

Wahba(1990)对薄盘光滑样条技术各种模块进行了全面介绍。

Hutchinson(1991a)对月平均气象要素空间插值的基本理论和应用进行 了简要的概述,Hutchinson (1993)和HutchinsonGessler(1994)对运算和相关 的统计分析进行了更全面的讨论和与Kriging进 行了对比。Hutchinson(1995,1998ab)对该方法运用到了年和日降水数据的插值上。

同时模拟多个表面非常方便,尤其是对气象数据而言。ANUSPLIN现 在允许任意多的这样的表面和“表面独立变量”,以便独立变量在各表面间做系统地改变。ANUSPLIN允许系统查询这些表面及其标准误,点文件或者grid文件都行。ANUSPLIN同样允许对独立变量和依从变量进行转换。

下边将对ANUSPLIN的9个组件进行简要概述。

SPLINA:适用于<2000个要素的点文件。允许一个或多个独立变量的任 意数量

的(局部)薄盘光滑样条函数。光滑系数通常由GCV决 定。 SPLINB:与SPLINA大致相同,但是它允许<10000个要素的点文件,可以用

selnot/delnot模块先从大数据集中设置<2000个knots,同时还可用addnot对knots进行编辑。

AVGCVA:根据一系列不同的光滑系数,计算出由SPLINA生成的各表面与光滑系

数对应的GCV和平均GCV值,计算结果将写成一个文件为进一步的制图服务。

AVGCVB:为SPLINB服务,功能与AVGCVA类似。

LAPPNT:进行局部薄盘光滑样条表面估值并计算贝叶斯标准 误,并生成一个点文件。

LAPGRD:功能与LAPPNT类似,只是最后结果将是一个规则的矩形栅格文件。 -----------------------------------

这个程序最好通过一个command-line shell(即cmd文件)提取.。在Unix系统,使用终端仿真窗口显示一个shell prompt。在微软的Windows系统中,启动一个MS-DOS shell,如输入: Splinajob.log

其中,job.cmd是一个输入的命令文件,而job.log则是程序执行后将输出的日志文件。

程序需录入项:(program inputs)

包括独立样条变量和协变量的个数,每个独立变量的上下限,每个变量的可选的转换试方式以及最低样条次数(决定不同的函数式),要模拟的表面数,以及各表面用以计算光滑系数的方法。输入输出文件的指定,在SPLINB中还包括knots

索引文件名。位于独立变量界限外的点数据将予以排除。这个界限有利于在不用切割点文件的情况下指定模拟的表面的范围。界限值(相当于mask)允许留出一定的边距便于各表面间有重叠部分,对于极大的数据集来说可能需要这样做。用户指定的界 限将会对指定的数据格式和独立变量的样条次数进行了简单的检查。如果选择的点数过少会出现错误提示。

通过与标准Fortran90的结合,ANUSPLIN4。1可以为更多的数据和数组动态分配内存。同时,SPLINA和SPLINB都适用以任意点数来模拟任意数量的表面。然而,最好还是不要让SPLINA的点数>2000,SPLINB的点数>10000.SPLIN适用于设置的knot少 于2000的情况。

SPLINA的主要存储空间是点文件所含的点数的平方,处理时间则是点数量的立方。SPLINB则与knot相 关。

需要注意的是,SPLINA目前(4。1版式本)并不允许点文件中出现坐标重叠的点。SPLINB中可以出现重坐标的点,但不允许有重坐标的knot。 -----------------------------------

计算函数略.大致为:Zi=f(xi)+bTyi+ei(i=1....N)

其中Zi为预估值,xi是一个d维的样条独立变量矩阵,f()是xi的未知光滑函数,yi是一个p维的协变量矩阵,b是yi的未知p维系数矩 阵,ei是各独立变量,均值为0,.........(其中涉及到多个讨厌的参数,不想写了,)上式中T为b的上标.

1):当P=0时,即没有协变量时,该函数式就是一个普通的薄盘样条模型,即简单的多变量线性回归.而如果f(xi)为0,即没有独立样条变量 时,ANUSPLIN不可用.

2):光滑参数P(不是P,应该是密度那个符号)是一个正数.它越趋近于0,则拟合函数越接近精确值,反之,若越趋向无穷,则拟合函数越接近最小二 乘多项式

(理解得有点怪),其阶数由d和xi及m的阶数决定.光滑参数通常根据GCV计算拟合表面的最小预测误差决定.(即可自动计算) --------------- 依从变量(因变量)转换

ANUSPLIN目前允许对自变量进行开平方或者求自然对数转换.在用SPLIN或SPLINB进行拟合前,可选用其中任意一种方式对变量进行转换.变量转换可以使其更符合正态分布,前提是变量的值是正数或非负数.该转换会自动传达给拟合表面的系数,因而LAPPNT和LAPGRD可以选择性的输出转换后的表面值或不经转换的表面值.不经转换的表面估值可用依从变量的逆转换(求平方值或者指数)得到.Hutchinson(1998a) 指出,在用薄盘光滑样条法进行拟合前,对依从变量日降水数据进行开平方转换,可减少近10%的插值误差.

如果选择输出未经转换的表面估值,LAPPNT和LAPGRD将同时计算其标准差.开平方转换公式的 适用性由Hutchinson(1998a)进行了求证...(以下是一大堆公式,略去) 拟合气候表面

最早的拟合程序通常需要至少两个独立样条变量,(即f(xi)中i为2维矩阵),通常 是经度、纬度,以度为单位。但是在拟合温度或降水量时,可增加第三个独立变量,即海平面以上的高程(海拔)。在把海拔作为第三个独立样条变量时,可以把它的单位转换为千米,即海拔值除以1000。稍稍把海拔值缩放一下(此处指转换单位由米到千米)可略微改进拟合结果。该改动最初由Hutchinson和 Bischof(1983)提出,并由Hutchinson(1995,1998b)对此进行了论证.

在某些区域(restricted areas),把海拔作为协变量而非独立样条变量时,拟合效果更佳。

在拟合一个温度表面时,作为协变量的海拔的系数将被作为一个先验的温度递减 率(Hutchinson,1991a)看待。其它 影响气象变量的因素,如地形效应

(topographic effects)而非海拔,可以作为 额外的协变量引入,如果可以求算出合适的参数并且相关数据可用的前提下.Hutchinson et al.(1984ab,1996a)和Hutchinson(1989am1991ab)对其它的气象插值软件进行了介绍.Hutchinson et al.(1992,1996b)介绍了以样条法拟合气象表面应用于农业气象分类以及生物多样性评估的其它软件.

在拟合多变量气象表面时,只需要知道样点处的独立变量的值就可以了.因此,气象站 点的坐标和海拔信息必须准确.坐标错误的点会在输出的最大残差日志里反映出来,即以降序 排列的残差文件中,排在首位的几个极大的残差值对应的站点.最近又出 了可检验引入由不同水平分辨率的DEM求算海拔,坡度和坡向进行插值的效用的软件(Hutchinson 1995,1998b).

LAPGRD可用来估算气象要素和标准误,并生成一个规则的栅格图.provided a regular grid of values of each independent variable, additional to longitude and latitude,is supplied.也就是说通常 一个规 则/标准的DEM栅格数据(是说DEM数据必须是一个规则的栅格?并且以什么投影呢?)是必须 的.Hutchinson(1988,1989b,1996,1997)介绍了DEM的获取方法. SPLINA和SPLINB用户指定项:

双击SPLINA.exe,打开一个基于DOS的界面框,根据屏幕的提示操作,解说如下: title of fitted surfaces:

(最大可输入60个字符):surfaces文件的头信息,即对要输出的栅格表面命名

surface value units(输入0-8间的数字):

拟合变量的单位,如降水为mm,温度为degree,输入对应的数字即可, number of independent spline variables:

(输入非负整数)独立样条变量的个数。不可以大于指定的数量(当前可输入最大数为10)

number of independent covariates:

(输入非负整数)独立协变量的个数。受样条自变量个数的限制. number of surface independent spline variables:

(输入非负整数)表面独立样条变量的个数。为各拟合表面输入不同的独立变量时需要填写,若所有表面采用的独立变量都相同,则该项输入0. number of surface independent covariates:

同上,是各表面的各自的协变量个数.

independent variable lower and upper limits,transformation code, units code, optional margins:

(输入2个实数,两个非负整(0-8),各独立变量的两个实数.)独立变量的上下界限,转换代码,单位代码,可选边界 (margins).(上下界相当于mask,输入的范围可与DEM的范围一致.为左上角,右下角的XY读值,有四个数,以空格隔开)先输入下端界限值,再输入上端界限值,位于上下界范围之外的点,虽然在边界内,也会被忽略掉.一到两个,边界可能会被遗漏掉(data points outside these limits,augmented by margins,are ignored. one or both margins may be omitted. if one margin is supplied it is used as the common lower and upper margin.if both margins are omitted the transformation code and units code may also be omitted. units code as for surface value units code.)[这段里边,由 于对margin的理解不通,整段翻译出错]如果两个margins被 遗漏,则转换码和单位码将同时被忽略.单位码与表面值的单位一致. transformation parameters:

(输入一到两个实数)转换参数.根据提示选择需要的转换类型.

dependent variable transformation:

(输入0-2之 间的数)因变量转换。0--即不转换,1--拟合表面值以自然对数转换(所有的点数据值都必须是正数) 2-拟合表面以开平方转换,(点数值需要非0) order of spline:

(输入正整数):样条次数,通常为2。lower limit specified by the program(该程序不允许更低的次数) number of surfaces:

(正整数),拟合的表面个数.可以是任意正整数. number of relative error variances: (非负整数):相对误差方差的数量.

0--拟合各表面所用的点数据已经统一加权过(data points uniformly weighted for each surface,即没有相对误差方差)

1--各表面用同样的加权法(1个相对误差方差值?)如果输入的数值与拟合表面个数一致,代 表各表面采用了不同的加权方式. optimization directive:(0-3)优化参数. 0--所有表面共用一个光滑参数.

1-所有表面所用的光滑参数的阶数一样,默认) 3-各表面的光滑参数的阶数不同.

smoothing directive for each surface:(0-3)各表面的光滑次数. 0-固定光滑参数,自定义数值.)

1--最小GCV(默认)

2--根据提供的估计标准误差求算最小真实平均平方误差(minimise true mean square error using supplied error standard deviation estimate) 3--固定自由度-提供数值. data file name

(最多输入255个字符) 点数据文件名,必填项,注意输入文件的全名,即带上扩展名. 如:tmay.dat,存放各变量的文件名。 maximum number of data points:

(正整数)点文件包含的最大点数。用以分配程序运行时可调用的内存.因此推荐输入的数值比点文件中包含的点数再多一点. number of characters in site label

number of characters in site label

(0-20):站点标签的字符个数(即台站号或者台站名所占的字符数.)如果可以的话,最好提供各站点的名称,以拼音字母标记,这些标签将会在输出的list和大残差文件中显示. data file format

(最多可输入255个字符)数据文件格式(尤为重要,输错将无法继续)以fortran语言输写。文件格式如下:台站标签(如果有的话),独立变量(样条变量位于协变量前),表面独立变量(样条变量先于协变量),依据前边的设置不同,输入样点值和相对方差项可能有所不同。如果指定的是各点数据使用统一权重(即1)则相对方差为0。如果格式为空,文件将自由地以标准格式读入(if the format is blank,the data file is read in list directed free format in the same order as for formatted reads),

knot index file

(255个字符最多,只有SPLINB才用)被选中作为knot的点的索引文件。由selnot生成.记得文件名称写全. maximum number of knots

(255个字符):(正整数,只有SPLINB才需要)用以为knots分配内存 output large residual file name

(给残差文件命名,最多255个字符):输出的大残差文件的名字。如果不想输出该文件请留空.该文件用以检查数据误差。可以直接用addnot读写以添加knots到一个已有的knot文件中. output optimisation parameters file:

最优参数文件(给最优参数文件命名,最多255个字符):不需要则留空。该输出文件包含用以计算最优光滑参数的参数.可通过AVGCVA和AVGCVB两个模块生成光滑参数的GCV函数的图表. ouput surface coefficients file:

表面系数文件.(给表面系数文件命名,最多255个字符) 通常需要填写,如果不需要表面系数文件留空也可。包含了界定拟合表面的系数。该文件是LAPPNT和LAPGRD生成表面文件的必需文件 output data list file name:

(给数据信息文件命名,最多255个字符)可以留空.更出数据和估计值,贝叶斯估计标准误.可用于检查数据误差. output error covariance file name

(协变量误差文件,255)只SPLINA有该项.拟合表面系数的协变量误差阵.以供LAPPNT和LAPGRD计算拟合表面估计的空间分布标准误 validation data file name:

(验证数据文件名,225个 字符最多)可以留空.若是非空,则将计算拟合表面的验证数据的残差,以及统计概要信息. maximum number of validation data points:

(验证数据集的最大点数,正整数):用以分配内存,如果验证文件名处为空则无此项.

number of characters in validation site label

(0-20)验证站点字符数.即标签的长度 validation data format

(验证数据格式,255)跟点数据文件的格式一样,但是没有相对方差项. ouput validation data list file name

(验证数据信息文件名,255个字符)若非空则将以标准格式输出验证数据和表面值的信息.

---------------------不想翻译了,要吐血了------------------------ AVGCVA

AVGCVA 可用以计算由SPLINA生成的表面的GCV值.GCV值以光滑参数的对数函数制成列表写成一个输出文件.每列对应一个表面,这样利于常见的制图工具制图。如不只一个表面的话,将会求算这多个表面的平均GCV值. optimisation parameters file name:

(最优参数文件名,255个字符):即输入由SPLINA生成的*.opt文件. output GCV file name: (输出GCV文件名,255)

AVGCVA 只有这两个需要用户指定的项,极好办.(AVGCVB与它同,略过) --------------- LAPGRD

LAPGRD可以计算由(局部)薄盘光滑样条法生成的规则的2维栅格表面的值及其空间分布误差.LAPGRD程序需要用户提供一个.asc格式的文件读取局部样条表面的系数值.表面系数的协变量误差矩阵从另一二进制文件里读取.

如果需要更多的独立变量的值来定义样条,可以用户指定一个常数或者从用户指定的栅格文件里读取,但是这个栅格文件需要与LAPGRD要生成的栅格的行列数一致.

用户提供的栅格必须是多行的格式(in rows format),因为它是一次读取一行以节省存储空间.所有的栅格的读写都是以这种格式(从最大的Y写到最小的Y值的.)

栅格点位置可以是单元格的角上或者中心点上.常用的软件,包括arc/info ,grass和idrisi,读写单元格的中间位置为点的位置.在较老的系统中使用角点计算点位置的较多. ------------- LAPGRD 用户指定项: surface file

(255个字符最多)输入表面文件名,由SPLINA生成

surface numbers:

(非负整数)要拟合的表面的个数(surface numbers to be calculated in increasing order)如果输入0,表示计算表面系数文件里记录的所有表面. type of surface calculation

(输入0或1)0-只计算统计信息 1-拟合表面值 transform surface and error values

(输入0或1)如果表面不需要转换将不用填写该项.0-表面值不转换,1-表面值进行转换

error covariance file name

(协变量误差文件名)可以留空如果没有协变量文件或者不估算误差的话 type of error calculation

(输入0-4)0-只计算表面值均值的标准误;1-计算模型的标准误;2-计算预测标准误;3-计算模型95%置信区间;4-计算 95%预测置信区间 maximum standard errors

(留空或者允许的所有选中的要素的最大标准误)如果标准误超出该值时,将不估算表面值和误差值.

ANUSPLIN USER GUIDE 4.1实例结果分析翻译 2010年03月03日 星期三 16:08

该例中样条次数为2,获得了最小曲率光滑样条;(a minimum curvature

smoothing spline)。对于单变量(uni-variate)案例,该样条函数是一个三次多项式(a piece-wise cubic polynomial)。但ANUSPLIN不提供该类表达式,因为它最初是为多变量数据设计的。光滑的单变量数据的有效三次“样条次数”,使用a piece-wise三次表达式,可由CUBGCV产品(Hutchinson and de Hoog 1985,Hutchinson 1986)获得。

数据光滑度在本例中由最小GCV(广义交叉验证)决定。输出的log文件中显示其拟合样条的自由度(Signal)为 8.4,或者称有效参数为8.4,是由与拟合样条相关的影响矩阵的trace决定(Wahba 1990)。剩余自由度(degrees of freedom of the residual,Error)为92.6。二者的和为101,即样点数。该光滑分析的信噪比(the signal to nosie ratio,SNR)为8.4/92.6=0.09,即Signal/Error。而Signal 远小于样点数的一半,该点与Hutchinson(1993)和Hutchinson and Gessler(1994)提到的建议相符,相当于(Equivalently),SNR要小于1.0(即 Signal

RTMSE(root mean square error estimate,误差估计均方根)为0.0504,是从 RTGCV中剔除噪音效应后对拟合函数的误差估计(RTGCV~RTMSE+真实误差标准差??可相应理解 为回归分析时的总的偏差平方和(GCV)=回归平方和(?)+残差平方和(MSE),则回归平方和所占比率越大越好,即MSE越小于GCV越好。)。该 值适当地与真实曲线的问题 RTMSR0.0432(root mean square residual,这个不是上述提到的RTMSR)相近(可以计算验证数据的RMS获得,即在用splina时要求输入.val验证数 据),上两句话是说RTMSR(样条残差均方根)要约等于RMS(真值验证残差均方根)。该 例中拟合样条的误差方差(the variance of the error)由噪音方差支配。在多数应 用案例中,如降水插值(Hutchinson 1995)。估计误差方差很大部分是样条本身的误差。这种情况下,the error estimate (RTMSE) would be optimistic.(效果不错)(即,RTGCV和RTMSE的差 值大些,真实误差占RTGCV的主要部分时,拟合效果较好,跟上述的GCV,MSE的解释类似)。总的来说(In general),拟合样条的真实误差的标准差在RTMSE和RTGCV之间(lie between,在...之间),由噪音误差和拟合样条误差的相对量级决定。

使用AVGCVA计算GCV值(光滑参数的lg 值的函数)。AVGCVA使用优化参数,由SPLINA计算所得(.opt),并输出GCV值表格,记录在.gcv文件中。通常GCV值应该是由唯一的局部最低值,本例中的最低值对应的光参的对数值为4.4。而

相应的最低GCV 可在SPLINA输出的log文件中查看,即RHO值,为0.255E+5。如果有多个局部最低GCV值, 则表明数据有显著错误或样条模型应用不规范(misspecification)。当有多个局部最低值时,SPLINA会尝试寻找最光滑的 局部最低值,以选出有效参数数量最少的模型。(in order to choose the model with the least number of effective parameters.)

LAPPNT计算拟合样条值和相应的贝叶斯标准误估计。输入数据 为.val(验证数据,也是真实值)(提供表面系数)和.cov. 对于样条系数的.cov的计算方法Hutchinson(1993)提到过。样条值和标准误(standard errors)在输出文件中(.out)。[该命令出图用] -------------------------- 例2:

本例用SPLINA拟合局部薄盘光滑样格,引入海拔线性关系,对最大气温的月均值进行拟合(tmax)有两个点在 limit外。由于对所有表面都用了统一权重,因此可以用SPLINA同时对12个表面进行拟合。

输出的log文件包含了分 析的统计信息,参与拟合的样点数,各表面的GCV值,各表面tmax值的海拔递减率的标准误,最大残差值。输出的.sur 和.cov文件都是以二进制格式存储的,不可在DOS和Unix平台通用。

各月间的 Signal应该有月间的平稳过渡。本例中6月的Signal偏高,表明光参选择时有一定的不稳定性,有可能是数据错误引起。

GCV(RTGCV) 在0.74(6月)到1.2(2月)间。这是对整个标准预测误差的保守估计,因为它包含了数据错误(data error)。

RTMSE(模 型误差均方根)是剔除了估值误差后的估计标准误,类似于参数模型(如回归模型)的估计标准 值。可看作某种程度的表面误差有效估计。通常对各月的tmax进行样条拟合时其标准误差估计多小于0.5(此外是表明说RTMSE也以小于0.5为宜?)

亚 模型的系娄,可以解释为温度的递减率。本例中在tmax的递减率在8度/1km左右,而tmin会小于这个数(Hutchinson 1991a)。海拔作为第三自变量,单位转换成了以km为单位。

ANUSPLINのSPLINA(B)所需cmd及dat数据格式例 2010年03月03日 星期三 18:07

---------------------------------------------------------------------------------------------------by yishuiyaoyao 首先,在SPSS中把数据处理成如下格式:

code为站点的label(其要求是字符型,长度小于20即可,上图中其长度为6,在fortan语言中可用a6表示)

X,Y为投影坐标系以米为单位的坐标值,浮点型,在fortan 语言中用f表示,即f14.6,说明是带6位小数总长度为14. ELEV:海拔.单位为米

接下来是各月的变量值.本图中变量为t_mean值.

把上图中的类型,宽度,小数三项设置好后,将该数据另存为\固定ASCii格式\后缀为了.dat.

这样,SPLINA所需要的确.dat数据准备完成.

接下来,写cmd.新建一个记事本文件,写入把下述内容,另存为*.cmd tmean22 5 2 2

0 0

-576125.28 644174.72 0 1 2853173.57 3767773.57 0 1 -7.0 7143.0 1 1 1000.0

-1 359.96 0 5 0 2 12 0 1 1

tmean12.dat 80 6

(a6,2f14.6,f6.1,f6.4,12f6.2) tmean22.res tmean22.opt tmean22.sur tmean22.lis tmean22.cov tmean22val.dat

其中,在有验证数据的情况下才输入*.val项,没有的话留空行,直接回车.上述几个文件的顺序是凭记忆输的,可以双击splina.exe一一对照看有无错误. 第一行,tmean22,是对该项文件命名,可自定义,但两个cmd文件的命名不可重复;

5,代表tmean 的单位是度 2,代表两个自变量(X,Y)

2,代表两个样条协变量(ELEV,ASPECT) 0,代表无表面变量

0,无表现协变量

-57*********0 1,代表每一个自变量的上下限,有无转换,单位是什么.本例中该项为拟合区域的X的最大最小坐标,即最左边界和最右边界的X读值.0代表不转换,1代表单位为米.

28********0 1 与上同.代表的是Y值上下限,即最高最低处值.(记住X的最大值=最小值+cellsize*rows,Y最大值=最小值+cellsize*colums,不满足该公式就会出错,单元格和行列数可从DEM栅格属性上读取)

-7.0********1 1,代表ELEV的上下限,1 1代表用ELEV进行X/A的转换,即把单位由米转换成千米,后边的1代表原单位是米. 1000.0,代表上述的A值等于1000.0 -1*****0 5,代表ASPECT,5说明单位为度

(切记,上表中的X,Y,ELEV,ASPECT的顺序必须与这里的一致,不要弄错.即label, 自变量,协变量,因变量) 0,这个忘了代表什么了 2,样条次数为2

12,表面个数为12,因为有12个月,每个月一个表面,如果只对一个月进行拟合,则输入1

0,所有的表面用相同的权重.(选1则代表用不同的权重,接下来就会需要对各表面所用权重进行设置,本例中为0,所以不需设置) 1,这个1代表用最小GCV值进行验证 1,这个1代表什么忘了,它提示说通常选1 tmean12.dat,即第一步所保存的.dat文件的全名

80,代表样点个数.本例中样点数为73,输入一个比73稍大的整数为宜 6,本例中label的长度

(a6**********f6.2)本例中各变量的格式,类型,宽度,小数位数的描述.记住,如果要协变量只用ELEV的话,可以把ASPECT空出来,则其表述形式

为:(a6,2f14.6,f6.1,6x,12f6.2)其中的6x就表示ASPECT所占的6个长度,视为空值,不予考虑

tmean22.res:输出的残差文件,记录估计与实值的误差

tmean22.opt:输出的最优参数文件,可在AVGCVA..exe中计算有最小曲率的GCV值

tmean22.sur:输出的记录了表面系数的文件,记拟合结果的系数,可引入LAPGRD.exe中,以输出表面栅格.(重要) tmean22.lis:列出各项所需信息 tmean22.cov:输出协变量误差信息.

tmean22val.dat:输入存放了验证数据的dat文件. -----

解释完毕.对一个变量进行拟合时,要选出最佳的拟合函数则需要测试不同的自变量,协变量组合,及样条次数的搭配,相应的修改上述cmd文件中的相应项即可.在做测试时可不输出上述从.res到.cov几个文件,在格式行(a6******f6.2)后回车8下,空出8行即可,切记,一定要空出8行,不然cmd文件会出错.此时,可进行如下步骤来获取函数验证信息:

1)开始菜单中,在\运行\项中输入cmd 回车,把cmd运行程序打开

2)用cd命令进入anusplin所在的文件夹.切记,anusplin的安装文件和.dat和.cmd文件都要放在同一个文件夹中,路径必须一致.

例:如果放在L:\\data\\anusplin文件夹下,则先输入L:回车,把当前盘符由C盘转到L:

然后输入cd data\\anusplin命令,以进入该文件夹.

3)输入splinatmean22.log 回车.将获得一个tmean22.log的文件,里边记录了该cmd的拟合信息.此处的tmean22.cmd即上述所说的cmd文件. 4)比照tmean22.log中提供的信息进行筛选.判断标准见本空间另一篇文章.即无*标示.Signal小于样点数的一半,Signal/Error最小,RTGCV,RTMSR,RTMSE最小,其中RTGCV和RTMSE的差值越大,可间接说明模型的解释率越高.