CN108428038A - 基于gam模型的土壤锌含量影响因素分析方法 - Google Patents
基于gam模型的土壤锌含量影响因素分析方法 Download PDFInfo
- Publication number
- CN108428038A CN108428038A CN201810061877.XA CN201810061877A CN108428038A CN 108428038 A CN108428038 A CN 108428038A CN 201810061877 A CN201810061877 A CN 201810061877A CN 108428038 A CN108428038 A CN 108428038A
- Authority
- CN
- China
- Prior art keywords
- model
- soil
- gam
- influence
- variables
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011701 zinc Substances 0.000 title claims abstract description 130
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 title claims abstract description 82
- 229910052725 zinc Inorganic materials 0.000 title claims abstract description 82
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000004856 soil analysis Methods 0.000 title abstract 2
- 239000002689 soil Substances 0.000 claims abstract description 78
- 238000000556 factor analysis Methods 0.000 claims abstract description 35
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 235000015097 nutrients Nutrition 0.000 claims abstract description 19
- 230000004044 response Effects 0.000 claims abstract description 18
- 238000005070 sampling Methods 0.000 claims abstract description 15
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 61
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 claims description 60
- 239000011591 potassium Substances 0.000 claims description 58
- 229910052700 potassium Inorganic materials 0.000 claims description 52
- 238000009499 grossing Methods 0.000 claims description 49
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 33
- 239000011574 phosphorus Substances 0.000 claims description 33
- 229910052698 phosphorus Inorganic materials 0.000 claims description 30
- 229910052757 nitrogen Inorganic materials 0.000 claims description 29
- 230000000694 effects Effects 0.000 claims description 21
- 229910001385 heavy metal Inorganic materials 0.000 claims description 21
- 238000012360 testing method Methods 0.000 claims description 18
- 239000005416 organic matter Substances 0.000 claims description 13
- 238000003745 diagnosis Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 9
- 230000003993 interaction Effects 0.000 claims description 9
- 238000012482 interaction analysis Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 5
- 239000004016 soil organic matter Substances 0.000 claims description 4
- 239000006185 dispersion Substances 0.000 claims description 3
- 230000007062 hydrolysis Effects 0.000 claims description 3
- 238000006460 hydrolysis reaction Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen(.) Chemical compound [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 230000007547 defect Effects 0.000 abstract description 2
- 239000000654 additive Substances 0.000 description 12
- 230000000996 additive effect Effects 0.000 description 12
- 229910052751 metal Inorganic materials 0.000 description 10
- 239000002184 metal Substances 0.000 description 10
- 238000011160 research Methods 0.000 description 9
- 206010048259 Zinc deficiency Diseases 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- JBQYATWDVHIOAR-UHFFFAOYSA-N tellanylidenegermanium Chemical compound [Te]=[Ge] JBQYATWDVHIOAR-UHFFFAOYSA-N 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Agronomy & Crop Science (AREA)
- Primary Health Care (AREA)
- Mining & Mineral Resources (AREA)
- Animal Husbandry (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Marine Sciences & Fisheries (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Investigation Of Foundation Soil And Reinforcement Of Foundation Soil By Compacting Or Drainage (AREA)
Abstract
本发明涉及基于GAM模型的土壤锌含量影响因素分析方法,与现有技术相比解决了难以找到土壤中影响锌含量因素的缺陷。本发明包括以下步骤:采样点数据的获取;采样点数据预处理;GAM模型的建立;锌含量影响因素的分析,将单因素分析的变量纳入GAM模型进行多因素分析。本发明将锌含量作为响应变量,养分和空间经纬度作为解释变量,利用GAM模型适用于多种分布类型、复杂非线性关系的分析及模型不需要预先设定参数模型的优点,来研究养分及经纬度对土壤Zn含量的影响。
Description
技术领域
本发明涉及数据分析技术领域,具体来说是基于GAM模型的土壤锌含量影响因素分析方法。
背景技术
锌是植物必需的微量元素之一,当作物缺锌时茎和芽中的生长素含量减少,生长处于停滞状态,植株矮小;同时锌有助于光合作用,增强植物的抗逆性。但受土壤有机质和其它元素之间相互作用等因子的影响,会使锌的溶解度很快降低。增加供磷会加剧植物缺锌,而土壤磷有效性高会诱导缺锌。空间因素也起着影响作用。现有技术中,虽有针对土壤Zn含量的大量研究,但是这些研究都没有分析土壤养分与土壤重金属元素间的关系,也没有分析多种因素与重金属间的关系。
广义可加模型(GAM模型)能直接处理响应变量与多个解释变量之间的非线性关系,有研究表明广义可加模型方法可以实现使用一般的中型计算机来处理大数据集。目前,广义可加模型多应用于医疗研究、金融研究、环境对鱼类研究、环境气候等研究。采用广义可加模型研究气候因子能对单木胸径生长的影响及不同树种的响应差异,同时广义可加模型在其它方面的研究都显示了广义可加模型的优点。
那么,如何利用广义可加模型的特性,找到土壤养分、空间经纬度与土壤锌含量之间的微妙关系已经成为急需解决的技术问题。
发明内容
本发明的目的是为了解决现有技术中难以找到土壤中影响锌含量因素的缺陷,提供一种基于GAM模型的土壤锌含量影响因素分析方法来解决上述问题。
为了实现上述目的,本发明的技术方案如下:
基于GAM模型的土壤锌含量影响因素分析方法,包括以下步骤:
采样点数据的获取,获取若干个采样点数据,采样点数据包括样本点的空间因子和土壤养分因子,样本点的空间因子为样本点的经纬度,土壤养分因子包括样本点土壤的有机质、水解氮、有效磷、缓效钾、速效钾及重金属锌的含量;
采样点数据预处理,对样本点的空间因子和土壤养分因子进行平滑处理,获得经度的平滑函数f1(X1)、纬度的平滑函数f2(X2)、有机质的平滑函数f3(X3)、水解氮的平滑函数f4(X4)、有效磷的平滑函数f5(X5)、缓效钾的平滑函数f6(X6)、速效钾的平滑函数f7(X7);
GAM模型的建立,建立GAM模型,并对GAM模型进行平滑化处理;
锌含量影响因素的分析,将单因素分析的变量纳入GAM模型进行多因素分析。
所述GAM模型的建立包括以下步骤:
建立GAM模型,其表达式如下:
其中,μ=E(Y/X1,X2,…,Xp),
g(μ)为连接函数,为截距,f1、f2、…、fp为连接解释变量的平滑函数,Xp为解释变量,fp(Xp)为Xp的非指定类别的非参数函数;
其中,为截距,fi(Xi)(i=1,2,…,p)为平滑函数,是针对每个解释变量的任意单变量函数;
设定GAM模型利用样条平滑法进行平滑化处理,其表达式如下:
其中,log(μ)为连接函数,为常数截距项,f1(X1)为经度的平滑函数,f2(X2)为纬度的平滑函数,f3(X3)为有机质的平滑函数,f4(X4)为水解氮的平滑函数,f5(X5)为有效磷的平滑函数,f6(X6)为缓效钾的平滑函数,f7(X7)为速效钾的平滑函数,fij(Xij)为变量间交互作用的平滑函数。
所述锌含量影响因素的分析包括以下步骤:
设定经纬度和土壤有机质、水解氮、有效磷、缓效钾、速效钾为解释变量,重金属锌的含量为响应变量;
影响因素的分析,基于GAM模型对锌含量影响进行单影响因素分析、多影响因素分析、共曲线性诊断分析或交互作用分析。
所述基于GAM模型对锌含量影响进行单影响因素分析包括以下步骤:
将经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量分别输入响度变量为重金属锌含量的GAM模型,获得基于GAM模型的每个解释变量对响应变量的影响显著性及模型的拟合度;
判定7个解释变量所产生的显著性概率P,若P>0.05,则将其对应的解释变量舍弃;
分析7个解释变量对响应变量所生成的模型解释率,找出模型解释率最高的两个解释变量,将这两个解释变量作为对影响土壤锌含量的主要因素。
所述基于GAM模型对锌含量影响进行多影响因素分析包括以下步骤:
设定模型检验AIC分值,其表达式如下:
其中,D为偏差;df为有效自由度;为离差参数;
将经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量逐步加入到响度变量为重金属锌含量的GAM模型进行拟合,分析每个解释变量加入GAM模型拟合后的AIC分值、影响显著性变化;
判定7个解释变量所产生的显著性概率P,若P>0.05,则将其对应的解释变量舍弃;
若AIC分值逐步减小,说明解释变量的影响在增大;若AIC分值逐步增大,说明该解释变量的影响对锌含量影响小。
所述基于GAM模型对锌含量影响进行共曲线性诊断分析包括以下步骤:
利用经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量对响度变量为重金属锌含量的GAM模型进行共曲线性检验,获得共曲线性检验的指标值,其为最大估计值、实际观测值和估计值;
将共曲线性检验的指标值大于或接近0.5的解释变量剔除;
对剔除后的解释变量重新对GAM模型进行拟合,得到影响因素对锌含量影响的效应图。
所述基于GAM模型对锌含量影响进行交互作用分析包括以下步骤:
从经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量中任意选取2个解释变量,利用这2个解释变量对响度变量为重金属锌含量的GAM模型进行拟合,获得其影响显著性及模型的拟合度;
若P>0.05,则将其对应的解释变量舍弃;
对通过显著性检验的GAM模型进行可视化绘图,得到这2个解释变量对锌含量的交互作用效应图。
有益效果
本发明的基于GAM模型的土壤锌含量影响因素分析方法,与现有技术相比将锌含量作为响应变量、养分和空间经纬度作为解释变量,利用GAM模型适用于多种分布类型、复杂非线性关系的分析及模型不需要预先设定参数模型的优点,来研究养分及经纬度对土壤Zn含量的影响,为研究人员有限度可行地调节土壤锌含量提供了技术指导。
附图说明
图1为本发明的方法顺序图;
图2为本发明中基于GAM模型对锌含量影响进行共曲线性诊断分析步骤中经度、纬度、有机质、水解氮、有效磷、速效钾对锌含量影响的效应图。
具体实施方式
为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:
如图1所示,本发明所述的基于GAM模型的土壤锌含量影响因素分析方法,包括以下步骤:
第一步,采样点数据的获取。获取若干个采样点数据,采样点数据包括样本点的空间因子和土壤养分因子,样本点的空间因子为样本点的经纬度,土壤养分因子包括样本点土壤的有机质、水解氮、有效磷、缓效钾、速效钾及重金属锌的含量。
以北京市房山区为例,其位于东经115°25′—116°10′与北纬39°30′—39°50′之间,属于暖温带半湿润季风大陆性气候区,境内地貌较为复杂,山区与平原之间相对高差悬殊,气候也有明显的差异。其采样点可设有1497个样本点,样本点数据包括样本点的空间因子,即经度(longitude)和纬度(latitude);土壤养分,即有机质(OM)(gkg-1)、水解氮(HN)(mgkg-1)、有效磷(AP)(mgkg-1)、缓效钾(SAK)(mgkg-1)、速效钾(AK)(mgkg-1)的含量及重金属锌(Zn)(mgkg-1)的含量。通过空间因子、土壤养分等指标对土壤重金属元素Zn的含量影响作用关系进行数据分析。
第二步,采样点数据预处理。对样本点的空间因子和土壤养分因子按现有技术传统方式进行平滑处理,获得为经度的平滑函数f1(X1)、纬度的平滑函数f2(X2)、有机质的平滑函数f3(X3)、水解氮的平滑函数f4(X4)、有效磷的平滑函数f5(X5)、缓效钾的平滑函数f6(X6)、速效钾的平滑函数f7(X7),以便于模型分析使用。
第三步,GAM模型的建立。建立GAM模型,并对GAM模型进行平滑化处理。广义可加模型(GAM模型)不仅能捕捉到土壤养分等影响因素与土壤金属Zn含量的非线性关系,而且该模型适用面更广,即使在因变量的分布不易判定或不符合正太假设的情况下,该模型依然适用。同时,该模型也避免了一般非参数回归中当维数过多时容易出现的维灾难问题。基于土壤中的Zn含量与土壤养分、空间经纬度等影响因素构成一个复杂的非线性关系,而广义可加模型则可以用一个连接函数来建立变量的期望与非参数形式预测变量之间的关系。GAM模型建立的具体步骤如下:
(1)建立GAM模型,其表达式如下:
其中,μ=E(Y/X1,X2,…,Xp),
g(μ)为连接函数,为截距,f1、f2、…、fp为连接解释变量的平滑函数,Xp为解释变量,fp(Xp)为Xp的非指定类别的非参数函数,其估计方法有局部加权回归,平滑样条法,薄板平滑样条等方法。在该模型中,响应变量的分布有正态分布,二项分布等。
其中,为截距,fi(Xi)(i=1,2,…,p)为平滑函数,是针对每个解释变量的任意单变量函数,满足Efi(Xi)=0等。
(2)设定GAM模型利用样条平滑法进行平滑化处理,其表达式如下:
其中,log(μ)为连接函数,为常数截距项,f1(X1)为经度的平滑函数,f2(X2)为纬度的平滑函数,f3(X3)为有机质的平滑函数,f4(X4)为水解氮的平滑函数,f5(X5)为有效磷的平滑函数,f6(X6)为缓效钾的平滑函数,f7(X7)为速效钾的平滑函数,fij(Xij)为变量间交互作用的平滑函数。
针对响应变量,即土壤中的Zn金属元素含量进行分析,显然,Zn含量不满足二项分布的数据要求,用Shapiro-Wilk,.统计量对其进行正态性检验,5%的显著水平下拒绝了正态分布的原始假设,因此土壤元素Zn含量数据不服从正态分布,因此选择Log函数作为模型的连接函数。
在此,光滑函数可以选择现有技术的MQ拟插值进行函数的拟合。
插值的思想:找f(x);
如已知三个点(x1,f(x1))、(x2,f(x2))、(x3,f(x3))可以通过这三点求出形如f(x)=a+bx+cx2的函数式。
MQ拟插值:Qf=∑fiψj(x)
其中c取值为样点的密度。
采取LD拟插值算子:
其中,
第四步,锌含量影响因素的分析,将单因素分析的变量纳入GAM模型进行多因素分析。以经纬度和土壤有机质、水解氮、有效磷、缓效钾、速效钾为解释变量,土壤Zn含量为响应变量,将单因素分析有意义的变量纳入广义可加模型进行多因素分析,其中多因素分析包括单影响因素分析、多影响因素分析、共曲线性诊断分析或交互作用分析。
在此,单影响因素分析、多影响因素分析、共曲线性诊断分析或交互作用分析均可得出土壤锌含量的影响因素,只是基于的条件不同,其供研究人员应用的环境也不同。例如,单影响因素分析用于研究人员对影响土壤锌含量的单独因子进行考量;多影响因素分析用于研究人员对逐步提升因子含量对土壤锌含量的影响分析;共曲线性诊断分析用于生成锌含量影响效应图的分析;交互作用分析用于某两个影响因子组合对土壤锌含量的影响分析。
其具体步骤如下:
(1)设定经纬度和土壤有机质、水解氮、有效磷、缓效钾、速效钾为解释变量,重金属锌的含量为响应变量;
(2)影响因素的分析,基于GAM模型对锌含量影响进行单影响因素分析、多影响因素分析、共曲线性诊断分析或交互作用分析。
作为本发明的第一种实施方式,基于GAM模型对锌含量影响进行单影响因素分析包括以下步骤:
A、将经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量分别输入GAM模型,获得基于GAM模型的每个解释变量对响应变量的影响显著性及模型的拟合度。在此,对土壤金属元素Zn含量变化影响显著,用于分析7个影响因素单独作为土壤金属元素Zn含量的解释变量是否具有分析意义。
B、判定7个解释变量所产生的显著性概率P,若P>0.05,则将其对应的解释变量舍弃,说明其单独作为土壤金属元素Zn含量的解释变量没有分析意义。
C、分析7个解释变量对响应变量所生成的模型解释率,找出模型解释率最高的两个解释变量,将这两个解释变量作为对影响土壤锌含量的主要因素。在此,表示这两个解释变量单独对Zn含量变化影响的解释能力较好,且模型拟合优度较高,即单独存在条件下,这两个因子对土壤锌含量影响最大;同理,另五个解释变量单独对Zn含量变化影响的解释能力较差,且模型拟合优度较低,即单独存在条件下,这五个因子对土壤锌含量影响相对较小。
作为本发明的第二种实施方式,基于GAM模型对锌含量影响进行多影响因素分析,同样,7个影响因素作为解释变量,土壤中金属元素Zn含量作为响应变量,逐步加入影响因素与Zn含量间的广义可加模型构建拟合,采用AIC得分值进行检验,模型同样采用Log函数作为连接函数,平滑函数采用样条函数估计。其包括以下步骤:
A、设定模型检验AIC分值,其表达式如下:
其中,D为偏差;df为有效自由度;为离差参数。
在此利用AIC(Akaike Information Criteriion)逐步加入因子后模型的拟合程度,其得分越小,表明模型的拟合效果越好。
B、将经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量逐步加入到响度变量为重金属锌含量的GAM模型进行拟合,分析每个解释变量加入GAM模型拟合后的AIC分值、影响显著性变化。
判定7个解释变量所产生的显著性概率P,若P>0.05,则将其对应的解释变量舍弃,说明其对于土壤金属元素Zn含量的解释变量没有分析意义。
若AIC分值逐步减小,说明解释变量的影响在增大;若AIC分值逐步增大,说明该解释变量的影响对锌含量影响小。
作为本发明的第三种实施方式,基于GAM模型对锌含量影响进行共曲线性诊断分析。考虑到经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量之间可能存在共曲线性。类似于共线性对多重线性回归模型的影响,GAM模型中共曲线性的存在不仅会增大系数的方差,而且会使系数的标准差产生偏离,从而导致置信区间变窄,对拟合的效果有所影响,因此可以对模型进行共曲线性检验。共曲线性检验结果包括三个指标,分别为最大估计值、实际观测值和估计值。一般结合三个指标的值综合判断,取值均在0—1之间,取值为0表示没有共曲线性,取值越接近于1表示共曲线性越明显。
其包括以下步骤:
A、利用经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量对响度变量为重金属锌含量的GAM模型进行共曲线性检验,获得共曲线性检验的指标值,其为最大估计值、实际观测值和估计值。
B、将共曲线性检验的指标值大于或接近0.5的解释变量剔除,说明其对于土壤金属元素Zn含量的解释变量没有分析意义。
C、对剔除后的解释变量重新对GAM模型进行拟合,得到影响因素对锌含量影响的效应图。
以北京市房山区为例,其基于GAM模型对锌含量影响进行共曲线性诊断分析时经度(longitude)、纬度(latitude)、有机质(OM)(gkg-1)、水解氮(HN)(mgkg-1)、有效磷(AP)(mgkg-1)、速效钾(AK)(mgkg-1)对锌含量影响的效应图如图2所示。
通过共曲线诊断后,重新拟合的多影响因素与Zn含量建立的广义可加模型,得到影响因素对Zn含量影响的效应图。图2中的横坐标表示各解释变量的实测值,纵坐标表示解释变量对Zn含量影响的平滑拟合值,括号里的数字表示估计自由度值,阴影部分表示可信区间,实线代表Zn含量的平滑拟合曲线。结果表明,经度与Zn含量呈现非线性关系,Zn含量随着经度的增加而增加,到39°7′时,达到一个顶峰,然后开始逐渐下降到39°8′时又开始上升。纬度也与Zn含量表现为非线性的关系。在115°8′—116°0′间达到顶峰,然后下降。Zn含量随着有机质(OM)含量的增加也增加,增加到5.5g/kg时,Zn含量增加的不是很明显。Zn含量随着水解氮(HN)的增加逐渐增加,在约175mg/kg时达到最大,之后随着水解氮含量的增加锌含量减小。Zn含量随着有效磷(AP)含量的增加一直增加,当增到200mg/kg时,保持不变。锌含量与效速钾(AK)含量也呈非线性关系,随着效速钾的增加而增加,当增加效速钾含量增加到约900mg/kg时Zn含量达到最大值,之后Zn含量会随着效速钾含量的增加而减少。
作为本发明的第四种实施方式,基于GAM模型对锌含量影响进行交互作用分析,GAM模型要求平滑函数效应是可加的,Zn含量受多种影响因素共同影响,各影响因素之间交互作用对Zn含量会产生较强的影响。通过将影响因素进行交互建立GAM模型,再分析其对Zn含量的影响,有利于更加深入地认识影响因素对Zn含量影响的作用,因此通过对解释变量间的两两交互建GAM模型。
其包括以下步骤:
A、从经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量中任意选取2个解释变量,利用这2个解释变量对响度变量为重金属锌含量的GAM模型进行拟合,获得其影响显著性及模型的拟合度。
B、若P>0.05,则将其对应的解释变量舍弃,说明其对于土壤金属元素Zn含量的解释变量没有分析意义。
C、对通过显著性检验的GAM模型进行可视化绘图,得到这2个解释变量对锌含量的交互作用效应图。
本发明运用GAM模型,对每个影响因素与土壤中金属元素Zn含量进行拟合,通过其显著性检验判定影响因素与Zn含量构建模型的方程拟合优度,模型拟合优度较高,则表明其对Zn含量有显著影响,以此找到经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量与锌含量这个响应变更之间的影响关系,即通过数据分析手段,找到影响因素与锌含量之间的非线性关系,为研究人员影响锌含量值提供了技术指导和依据。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。
Claims (7)
1.基于GAM模型的土壤锌含量影响因素分析方法,其特征在于,包括以下步骤:
11)采样点数据的获取,获取若干个采样点数据,采样点数据包括样本点的空间因子和土壤养分因子,样本点的空间因子为样本点的经纬度,土壤养分因子包括样本点土壤的有机质、水解氮、有效磷、缓效钾、速效钾及重金属锌的含量;
12)采样点数据预处理,对样本点的空间因子和土壤养分因子进行平滑处理,获得经度的平滑函数f1(X1)、纬度的平滑函数f2(X2)、有机质的平滑函数f3(X3)、水解氮的平滑函数f4(X4)、有效磷的平滑函数f5(X5)、缓效钾的平滑函数f6(X6)、速效钾的平滑函数f7(X7);
13)GAM模型的建立,建立GAM模型,并对GAM模型进行平滑化处理;
14)锌含量影响因素的分析,将单因素分析的变量纳入GAM模型进行多因素分析。
2.根据权利要求1所述的基于GAM模型的土壤锌含量影响因素分析方法,其特征在于,所述GAM模型的建立包括以下步骤:
21)建立GAM模型,其表达式如下:
其中,μ=E(Y/X1,X2,…,Xp),
g(μ)为连接函数,为截距,f1、f2、…、fp为连接解释变量的平滑函数,Xp为解释变量,fp(Xp)为Xp的非指定类别的非参数函数;
其中,为截距,fi(Xi)(i=1,2,…,p)为平滑函数,是针对每个解释变量的任意单变量函数;
22)设定GAM模型利用样条平滑法进行平滑化处理,其表达式如下:
其中,log(μ)为连接函数,为常数截距项,f1(X1)为经度的平滑函数,f2(X2)为纬度的平滑函数,f3(X3)为有机质的平滑函数,f4(X4)为水解氮的平滑函数,f5(X5)为有效磷的平滑函数,f6(X6)为缓效钾的平滑函数,f7(X7)为速效钾的平滑函数,fij(Xij)为变量间交互作用的平滑函数。
3.根据权利要求1所述的基于GAM模型的土壤锌含量影响因素分析方法,其特征在于,所述锌含量影响因素的分析包括以下步骤:
31)设定经纬度和土壤有机质、水解氮、有效磷、缓效钾、速效钾为解释变量,重金属锌的含量为响应变量;
32)影响因素的分析,基于GAM模型对锌含量影响进行单影响因素分析、多影响因素分析、共曲线性诊断分析或交互作用分析。
4.根据权利要求3所述的基于GAM模型的土壤锌含量影响因素分析方法,其特征在于,所述基于GAM模型对锌含量影响进行单影响因素分析包括以下步骤:
41)将经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量分别输入响度变量为重金属锌含量的GAM模型,获得基于GAM模型的每个解释变量对响应变量的影响显著性及模型的拟合度;
42)判定7个解释变量所产生的显著性概率P,若P>0.05,则将其对应的解释变量舍弃;
43)分析7个解释变量对响应变量所生成的模型解释率,找出模型解释率最高的两个解释变量,将这两个解释变量作为对影响土壤锌含量的主要因素。
5.根据权利要求3所述的基于GAM模型的土壤锌含量影响因素分析方法,其特征在于,所述基于GAM模型对锌含量影响进行多影响因素分析包括以下步骤:
51)设定模型检验AIC分值,其表达式如下:
其中,D为偏差;df为有效自由度;为离差参数;
52)将经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量逐步加入到响度变量为重金属锌含量的GAM模型进行拟合,分析每个解释变量加入GAM模型拟合后的AIC分值、影响显著性变化;
判定7个解释变量所产生的显著性概率P,若P>0.05,则将其对应的解释变量舍弃;
若AIC分值逐步减小,说明解释变量的影响在增大;若AIC分值逐步增大,说明该解释变量的影响对锌含量影响小。
6.根据权利要求3所述的基于GAM模型的土壤锌含量影响因素分析方法,其特征在于,所述基于GAM模型对锌含量影响进行共曲线性诊断分析包括以下步骤:
61)利用经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量对响度变量为重金属锌含量的GAM模型进行共曲线性检验,获得共曲线性检验的指标值,其为最大估计值、实际观测值和估计值;
62)将共曲线性检验的指标值大于或接近0.5的解释变量剔除;
63)对剔除后的解释变量重新对GAM模型进行拟合,得到影响因素对锌含量影响的效应图。
7.根据权利要求3所述的基于GAM模型的土壤锌含量影响因素分析方法,其特征在于,所述基于GAM模型对锌含量影响进行交互作用分析包括以下步骤:
71)从经度、纬度、土壤有机质、水解氮、有效磷、缓效钾、速效钾这7个解释变量中任意选取2个解释变量,利用这2个解释变量对响度变量为重金属锌含量的GAM模型进行拟合,获得其影响显著性及模型的拟合度;
72)若P>0.05,则将其对应的解释变量舍弃;
73)对通过显著性检验的GAM模型进行可视化绘图,得到这2个解释变量对锌含量的交互作用效应图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810061877.XA CN108428038A (zh) | 2018-01-23 | 2018-01-23 | 基于gam模型的土壤锌含量影响因素分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810061877.XA CN108428038A (zh) | 2018-01-23 | 2018-01-23 | 基于gam模型的土壤锌含量影响因素分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108428038A true CN108428038A (zh) | 2018-08-21 |
Family
ID=63156081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810061877.XA Pending CN108428038A (zh) | 2018-01-23 | 2018-01-23 | 基于gam模型的土壤锌含量影响因素分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108428038A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111967737A (zh) * | 2020-07-30 | 2020-11-20 | 华南理工大学 | 输电线路覆冰增长模型关键参数与环境因素的关联分析法 |
CN116843103A (zh) * | 2023-07-05 | 2023-10-03 | 中国科学院地理科学与资源研究所 | 基于gam模型的气候变化对河流湖泊水质影响定量评估方法 |
CN117974348A (zh) * | 2024-04-01 | 2024-05-03 | 中通服建设有限公司 | 一种智慧农业物联网监测系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105320843A (zh) * | 2015-10-30 | 2016-02-10 | 中山大学 | 一种大气污染物浓度影响要素定量分析的方法 |
CN106971026A (zh) * | 2017-03-08 | 2017-07-21 | 武汉科技大学 | 基于全局可加模型的微合金钢力学性能预报方法 |
-
2018
- 2018-01-23 CN CN201810061877.XA patent/CN108428038A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105320843A (zh) * | 2015-10-30 | 2016-02-10 | 中山大学 | 一种大气污染物浓度影响要素定量分析的方法 |
CN106971026A (zh) * | 2017-03-08 | 2017-07-21 | 武汉科技大学 | 基于全局可加模型的微合金钢力学性能预报方法 |
Non-Patent Citations (4)
Title |
---|
YEE,THOMAS W.等: "Generalized additive models in plant ecology", 《JOURNAL OF VEGETATION SCIENCE》 * |
向伟 等: "广义可加模型在出生缺陷影响因素分析中的应用及R语言实现过程", 《中国妇幼保健》 * |
贺祥 等: "基于GAM模型分析影响因素交互作用对PM2.5浓度变化的影响", 《环境科学》 * |
郭屹立 等: "喀斯特季节性雨林木本植物胸高断面积分布格局及其对地形因子的响应", 《生物多样性》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111967737A (zh) * | 2020-07-30 | 2020-11-20 | 华南理工大学 | 输电线路覆冰增长模型关键参数与环境因素的关联分析法 |
CN111967737B (zh) * | 2020-07-30 | 2024-03-26 | 华南理工大学 | 输电线路覆冰增长模型关键参数与环境因素的关联分析法 |
CN116843103A (zh) * | 2023-07-05 | 2023-10-03 | 中国科学院地理科学与资源研究所 | 基于gam模型的气候变化对河流湖泊水质影响定量评估方法 |
CN117974348A (zh) * | 2024-04-01 | 2024-05-03 | 中通服建设有限公司 | 一种智慧农业物联网监测系统 |
CN117974348B (zh) * | 2024-04-01 | 2024-06-11 | 中通服建设有限公司 | 一种智慧农业物联网监测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Automated image-processing for counting seedlings in a wheat field | |
CN111126662B (zh) | 基于大数据的灌溉决策制定方法、装置、服务器和介质 | |
Liang et al. | A real-time detection framework for on-tree mango based on SSD network | |
Hall et al. | Low‐resolution remotely sensed images of winegrape vineyards map spatial variability in planimetric canopy area instead of leaf area index | |
CN116152673B (zh) | 一种利用多时相中高分卫星影像识别再生稻的方法及装置 | |
CN110824586B (zh) | 基于改进决策树算法的降水预测方法 | |
CN108428038A (zh) | 基于gam模型的土壤锌含量影响因素分析方法 | |
Narvekar et al. | Grape leaf diseases detection & analysis using SGDM matrix method | |
CN102867115A (zh) | 一种基于模糊c均值聚类的农田划分方法 | |
Blasch et al. | Multi-temporal yield pattern analysis method for deriving yield zones in crop production systems | |
CN109754120B (zh) | 一种考虑荧光效应的干旱预警方法 | |
CN114036736A (zh) | 一种基于局部格兰杰因果分析的因果网络学习方法 | |
CN112651173B (zh) | 一种基于跨域光谱信息的农产品品质无损检测方法及可泛化系统 | |
CN106599391B (zh) | 基于三角形角度值动态加权的关联向量机软测量建模方法 | |
Victorino et al. | Comparing a New Non-Invasive Vineyard Yield Estimation Approach Based on Image Analysis with Manual Sample-Based Methods | |
CN112528726A (zh) | 一种基于光谱成像和深度学习的棉蚜虫害监测方法及系统 | |
Gul et al. | Spiking neural network (SNN) for crop yield prediction | |
Ma et al. | Target Detection for Coloring and Ripening Potted Dwarf Apple Fruits Based on Improved YOLOv7-RSES | |
Chen et al. | Preliminary research on total nitrogen content prediction of sandalwood using the error-in-variable models based on digital image processing | |
Kindred et al. | Agronōmics-an arena for synergy between the science and practice of crop production. | |
CN115147730A (zh) | 一种联合全卷积神经网络和集成学习的遥感分类方法 | |
CN116168301B (zh) | 一种基于嵌套编码器网络的农田施肥栅格检测方法 | |
CN111521568A (zh) | 一种基于光谱角的土壤含水量预测方法 | |
CN108647889A (zh) | 森林净初级生产力估计及认知方法 | |
Wang et al. | Grayscale distribution of maize canopy based on HLS-SVM method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |