[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN102650982B - 一种基于fpga的lm算法实现方法 - Google Patents

一种基于fpga的lm算法实现方法 Download PDF

Info

Publication number
CN102650982B
CN102650982B CN201210085501.5A CN201210085501A CN102650982B CN 102650982 B CN102650982 B CN 102650982B CN 201210085501 A CN201210085501 A CN 201210085501A CN 102650982 B CN102650982 B CN 102650982B
Authority
CN
China
Prior art keywords
submodule
module
algorithm
matching
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210085501.5A
Other languages
English (en)
Other versions
CN102650982A (zh
Inventor
胡春艳
申雅峰
何彦璋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Changcheng Institute of Metrology and Measurement AVIC
Original Assignee
Beijing Changcheng Institute of Metrology and Measurement AVIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Changcheng Institute of Metrology and Measurement AVIC filed Critical Beijing Changcheng Institute of Metrology and Measurement AVIC
Priority to CN201210085501.5A priority Critical patent/CN102650982B/zh
Publication of CN102650982A publication Critical patent/CN102650982A/zh
Application granted granted Critical
Publication of CN102650982B publication Critical patent/CN102650982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Design And Manufacture Of Integrated Circuits (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于FPGA的LM算法实现方法,特别涉及一种用于高斯曲线拟合的LM算法的FPGA实现技术,属于数据处理技术领域。首先对输入的串行数据流进行串并转换并进行归一化处理,之后进行LM算法迭代循环,循环中首先计算拟合变量,然后进行指数查找,进而计算迭代系数,迭代系数计算后利用延时子模块实现同步各个参数到达功能模块的时间,通过并行判断子模块对迭代系数进行修正,进而修正拟合变量。本发明提高了LM算法的处理速度,在满足高精度测量的同时,还能达到高速实时的需求,该算法模块既能计算线性模型参数,又能计算非线性模型参数,同时具有低功耗、小型化、高速等特点,可应用于实时高精度的信号处理领域。

Description

一种基于FPGA的LM算法实现方法
技术领域
本发明涉及一种基于FPGA的LM算法实现方法,特别涉及一种用于高斯曲线拟合的LM算法的FPGA实现技术,属于数据处理技术领域。
背景技术
当前测量数据处理过程中,在观测值服从正态分布的前提下,最小二乘估计是最优线性无偏估计,因而在数据处理中被广泛应用。而当测量的函数模型是非线性模型时,一般是将非线性模型利用泰勒公式近似化为线性模型,然后用最小二乘估计法处理。非线性的最小二乘法是有偏的,在需要高精度求解非线性模型参数时,计算结果精度较低,有的甚至不能线性近似,因而求得的结果实用价值不大。这时需要研究非线性模型的精确数值解法。
Levenberg-Marquard算法(常被简称为LM算法)既能计算线性模型参数,又能计算非线性模型参数,并且无论法方程是良态、病态还是秩亏,该算法都能收敛,计算结果可靠。如果函数模型是线性并且呈良态,该算法只需迭代一次便可得到精确解,呈病态时迭代几次可以收敛到稳定解。如果函数模型是非线性模型,一般只需迭代几次便可收敛,当初值偏离真值较远时,可以通过增加迭代次数来获得最优解。
然而正是由于LM算法需要多次迭代,运算量大,用通用计算机或DSP等进行计算时实时性很难保证,用高性能计算机来处理成本又非常高。FPGA芯片虽然在速度上与DSP略有差距,但能实现并行结构。最新推出的FPGA器件中,不仅集成有丰富的可配置逻辑块资源,还包括大量面向计算密集应用的DSP单元、块状RAM和高速串行通信单元。因此选择可编程的逻辑器件进行数字信号处理是当今世界的发展趋势。
发明内容
本发明的目的是为了克服上述现有技术的缺陷,能够在实现LM算法时既保证实时性又不会成本太高,提出了一种基于FPGA的LM算法实现方法,该模块全部由硬件描述语言实现,可以提升数据处理的运行速度和稳定性以及数据的计算效率,节省开发成本。
本发明的目的是通过以下技术方案实现的。
本发明的一种基于FPGA的LM算法实现方法,其实现平台为FPGA,采用硬件描述语言实现,模块输入为采用串行数据流方式的外部测量数据,LM算法模块包括以下子模块:串并转换子模块、归一化处理子模块、拟合变量计算子模块、指数计算子模块、迭代系数计算A子模块、延时A子模块、迭代系数计算B子模块、延时B子模块和并行判断子模块;首先通过串并转换子模块将输入的串行数据流转换成并行数据并送入归一化处理子模块进行归一化处理,之后进行LM算法迭代循环,也即首先进入拟合变量计算子模块计算拟合变量,然后通过指数计算子模块进行指数查找,进而通过迭代系数计算子模块计算迭代系数,迭代系数计算后利用延时子模块实现同步各个参数到达功能模块的时间,通过并行判断子模块对迭代系数进行修正,进而修正拟合变量。
上述一种基于FPGA的LM算法实现方法,其步骤如下:
1)通过串并转换子模块将本算法模块外部输入串行数据流转换为并行数据流送入归一化子模块;
2)归一化模块对步骤1)生成的并行数据进行归一化处理后送入拟合变量计算子模块;
3)拟合变量计算子模块根据步骤2)归一化处理后的数据计算拟合变量及拟合变量的初值,并将该拟合变量及拟合变量初值送入指数计算子模块;
4)指数计算子模块对步骤3)的拟合变量进行指数查找,并将指数计算值送入迭代系数计算子模块;
5)迭代系数计算A子模块对步骤4)产生的指数计算值进行计算,计算得到迭代过程中所需要修正的迭代参数,并将各迭代参数送入延时子模块;
6)利用延时A子模块同步步骤5)产生的各个迭代参数到达并行判断子模块的时间,并将处理结果送入并行判断子模块;
7)通过并行判断子模块对经步骤6)处理的各迭代参数进行修正,得出当前情况下的拟合变量值Xi
8)对拟合变量值Xi再通过迭代系数计算B子模块和延时B子模块进一步对拟合变量进行处理;
9)将经过步骤8)处理后的拟合变量送入步骤3),计算拟合变量初值,并将当前拟合变量及拟合变量初值送入步骤4),重复步骤4)~步骤9)进行LM算法迭代直到达到预先设定的迭代次数或者算法收敛。
上述指数计算子模块的指数查找过程中的指数查找表采用分段处理方式,根据指数曲线概率分布特性来确定各曲线段的查找精度,其中曲线段越陡峭,则该段的查找精度越高,这种方式不仅保证了查找表的整体精度不变,而且减少了查找表占用的资源。
上述延时子模块采用移位寄存器实现,将每个迭代参数的计算结果存储在移位寄存器中,所有参数计算结束后,同时输出到下一个功能模块并行判断子模块,避免由于时间延迟造成数据流的丢失,并实现同步各个参数到达功能模块的时间;
并行判断子模块首先对迭代参数进行判断然后采用并行处理方式,针对各迭代参数的判断结果实施三种情况下的拟合变量算法,根据对迭代参数的判断结果选择输出当前情况下的拟合变量值Xi,节约了算法的处理时间。
有益效果
本发明提出了一种基于FPGA的LM算法实现方法,提高了LM算法的处理速度,将该算法模块应用于光纤传感测量等测量领域,在满足高精度测量的同时,还能达到高速实时的需求。该算法模块既能计算线性模型参数,又能计算非线性模型参数,同时具有低功耗、小型化、高速等特点,可应用于实时高精度的信号处理领域,尤其用于高精度的高斯曲线拟合。
附图说明
图1为基于FPGA的LM算法实现方法的总体流程框图;
图2为本发明中指数计算子模块的流程框图;
图3为本发明中并行判断子模块的原理框图。
具体实施方式
下面结合附图和实施例对本发明做进一步说明。
一种基于FPGA的LM算法实现方法,其输入为采用串行数据流方式的外部测量数据,如图1所示,LM算法模块包括以下子模块:串并转换子模块、归一化处理子模块、拟合变量计算子模块、指数计算子模块、迭代系数计算A子模块、延时A子模块、迭代系数计算B子模块、延时B子模块和并行判断子模块;
首先通过串并转换子模块将输入的串行数据流转换成并行数据并送入归一化处理子模块进行归一化处理,之后进行LM算法迭代循环;
LM算法迭代循环中,首先进入拟合变量计算子模块计算拟合变量,然后通过指数计算子模块进行指数查找,进而通过迭代系数计算子模块计算迭代系数,迭代系数计算后利用延时子模块实现同步各个参数到达功能模块的时间,通过并行判断子模块对迭代系数进行修正,进而修正拟合变量。
上述一种基于FPGA的LM算法实现方法,其算法步骤如下:
1)通过串并转换子模块将本算法模块外部输入串行数据流转换为并行数据流送入归一化子模块;
2)归一化模块对步骤1)生成的并行数据进行归一化处理后送入拟合变量计算子模块;
3)拟合变量计算子模块根据步骤2)归一化处理后的数据计算拟合变量及拟合变量的初值,并将该拟合变量及拟合变量初值送入指数计算子模块;
4)指数计算子模块对步骤3)的拟合变量进行指数查找,并将指数计算值送入迭代系数计算子模块;
5)迭代系数计算A子模块对步骤4)产生的指数计算值进行计算,计算得到迭代过程中所需要修正的迭代参数,并将各迭代参数送入延时子模块;
6)利用延时A子模块同步步骤5)产生的各个迭代参数到达并行判断子模块的时间,并将处理结果送入并行判断子模块;
7)通过并行判断子模块对经步骤6)处理的各迭代参数进行修正,得出当前情况下的拟合变量值Xi
8)对拟合变量值Xi再通过迭代系数计算B子模块和延时B子模块进一步对拟合变量进行处理;
9)将经过步骤8)处理后的拟合变量送入步骤3),计算拟合变量初值,并将当前拟合变量及拟合变量初值送入步骤4),重复步骤4)~步骤9)进行LM算法迭代直到达到预先设定的迭代次数或者算法收敛。
上述指数计算子模块的指数查找过程中的指数查找表采用分段处理方式,根据指数曲线概率分布特性来确定各曲线段的查找精度,其中曲线段越陡峭则该段的查找精度越高,这种方式不仅保证了查找表的整体精度不变,而且减少了查找表占用的资源。
上述延时子模块采用移位寄存器实现,将每个参数的计算结果存储在移位寄存器中,所有参数计算结束后,同时输出到下一个功能模块,避免由于时间延迟造成数据流的丢失,并实现同步各个参数到达功能模块的时间;
并行判断子模块首先对迭代参数进行判断然后采用并行处理方式,计算三个拟合变量算法,根据对迭代参数的判断结果选择输出当前情况下的拟合变量值Xi,节约了算法的处理时间。
实施例
将上述一种基于FPGA的LM算法实现方法对该模块输入的串行数据流进行处理,串并转换子模块将输入的串行数据流转换为并行的N个数据输出Y1,Y2,...YN,归一化子模块对所有数据进行归一化处理输出,首先查找N个数据其中的最大值Ymax,经过归一化模块后输出为(Y1/Ymax),(Y2/Ymax),...,(Ymax/Ymax),...,(YN/Ymax);
得到归一化数据后,进入LM算法迭代循环,首先在拟合变量计算子模块中计算拟合变量X=(A,B,C),得到拟合变量初值X0,然后将拟合变量X及初值X0送入指数计算子模块;
指数计算子模块的内部流程结构如图2所示,包括指数幂计算子模块、正数查找表、负数查找表和指数输出子模块,指数查找表采用分段处理方式,根据指数曲线概率分布特性,曲线平坦段的查找精度低于曲线陡峭段的查找精度,针对指数的幂存在正负数情况,整个查找功能通过正数幂和负数幂两张查找表完成,指数计算子模块通过以下步骤实现:
41)通过指数幂计算子模块计算幂值为正或者负;
42)根据指数计算子模块的正负信号,选择正数查找表或者负数查找表,进行指数查找;
43)经过指数输出子模块输出查找后的指数计算值;
指数计算子模块输出的指数计算值输入到迭代参数计算A子模块,用来计算迭代过程中所需要修正的参数,其中包括阻尼因子,Jacobi矩阵等,该模块主要包括矩阵求逆、矩阵与列向量相乘等部分内容,所计算得出的各迭代参数再利用延时A子模块实现同步各个参数到达下一个功能模块并行判断子模块的时间;
由并行判断子模块进行对迭代准则的判断选择,并行判断子模块原理框图如图3所示,以计算后的迭代参数rat为例,根据进入判断子模块的rat的值有三种情况:情况A,0<rat<0.5时对应拟合变量算法A,nu=max(nu*10,0.1);情况B,0.5<rat<1时对应拟合变量算法B,nu=0;情况C,rat>1时对应拟合变量算法C,nu的值不改变,判断输出的拟合变量值X通过输出子模块输出;并行判断子模块首先对迭代参数进行判断然后采用并行处理方式,计算A、B、C三个拟合变量算法,根据对迭代参数的判断结果选择输出当前情况下的拟合变量值Xi
将拟合变量值Xi再通过迭代系数计算B子模块和延时B子模块,进而修正迭代系数,进入图1中的拟合变量计算子模块进入第二次的迭代过程,根据迭代次数判断是否进行下一次迭代,从而完成对拟合变量的LM算法拟合。
以上所述为本发明的较佳实施例而已,本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。

Claims (2)

1.一种基于FPGA的LM算法实现方法,其实现平台为FPGA,采用硬件描述语言实现,模块输入为采用串行数据流方式的外部测量数据,其特征在于,LM算法模块包括以下子模块:串并转换子模块、归一化处理子模块、拟合变量计算子模块、指数计算子模块、迭代系数计算A子模块、延时A子模块、迭代系数计算B子模块、延时B子模块和并行判断子模块;
所述一种基于FPGA的LM算法实现方法,其步骤如下:
1)通过串并转换子模块将本算法模块外部输入串行数据流转换为并行数据流送入归一化处理子模块;
2)归一化处理子模块对步骤1)生成的并行数据进行归一化处理后送入拟合变量计算子模块;
3)拟合变量计算子模块根据步骤2)归一化处理后的数据计算拟合变量及拟合变量的初值,并将该拟合变量及拟合变量初值送入指数计算子模块;
4)指数计算子模块对步骤3)的拟合变量进行指数查找,并将指数计算值送入迭代系数计算A子模块;
5)迭代系数计算A子模块对步骤4)产生的指数计算值进行计算,计算得到迭代过程中所需要修正的迭代参数,并将各迭代参数送入延时A子模块;
6)利用延时A子模块同步步骤5)产生的各个迭代参数到达并行判断子模块的时间,并将处理结果送入并行判断子模块;
7)通过并行判断子模块对经步骤6)处理的各迭代参数进行修正,得出当前情况下的拟合变量值Xi;
8)对拟合变量值Xi再通过迭代系数计算B子模块和延时B子模块进一步对拟合变量进行处理;
9)将经过步骤8)处理后的拟合变量送入步骤3),计算拟合变量初值,并将当前拟合变量及拟合变量初值送入步骤4),重复步骤4)~步骤9)进行LM算法迭代直到达到预先设定的迭代次数或者算法收敛。
2.根据权利要求1所述的一种基于FPGA的LM算法实现方法,其特征在于,所述指数计算子模块包括指数幂计算子模块、正数查找表、负数查找表和指数输出子模块,正数查找表和负数查找表均采用分段处理方式,根据指数曲线概率分布特性来确定各曲线段的查找精度,其中曲线段越陡峭,则该段的查找精度越高,指数计算子模块通过以下步骤实现:
41)通过指数幂计算子模块计算幂值为正或者负;
42)根据指数幂计算子模块的正负信号,选择正数查找表或者负数查找表,进行指数查找;
43)经过指数输出子模块输出查找后的指数计算值。
CN201210085501.5A 2012-03-28 2012-03-28 一种基于fpga的lm算法实现方法 Active CN102650982B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210085501.5A CN102650982B (zh) 2012-03-28 2012-03-28 一种基于fpga的lm算法实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210085501.5A CN102650982B (zh) 2012-03-28 2012-03-28 一种基于fpga的lm算法实现方法

Publications (2)

Publication Number Publication Date
CN102650982A CN102650982A (zh) 2012-08-29
CN102650982B true CN102650982B (zh) 2014-10-08

Family

ID=46692990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210085501.5A Active CN102650982B (zh) 2012-03-28 2012-03-28 一种基于fpga的lm算法实现方法

Country Status (1)

Country Link
CN (1) CN102650982B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095774B (zh) * 2015-06-12 2018-03-23 北京京东尚科信息技术有限公司 数据加密方法及系统
CN106198433B (zh) * 2016-06-27 2019-04-12 中国科学院合肥物质科学研究院 基于lm-ga算法的红外光谱定性分析方法
CN106500671B (zh) * 2016-09-22 2020-04-07 天津大学 一种基于lm算法分解激光雷达波形确定海水深度的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1930573A (zh) * 2004-03-16 2007-03-14 贝克休斯公司 用于根据机械谐振器数据进行流体的密度、粘度、介电常数和电阻率的化学计量估计的方法和设备
CN101634544A (zh) * 2009-09-02 2010-01-27 郑州辰维科技有限公司 一种水轮机叶片毛坯型面测量与加工余量分析方法
CN101789126A (zh) * 2010-01-26 2010-07-28 北京航空航天大学 基于体素的三维人体运动跟踪方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100996897B1 (ko) * 2009-02-10 2010-11-29 전남대학교산학협력단 직선 핏팅에 의한 광각렌즈의 원주방향의 왜곡영상 보정 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1930573A (zh) * 2004-03-16 2007-03-14 贝克休斯公司 用于根据机械谐振器数据进行流体的密度、粘度、介电常数和电阻率的化学计量估计的方法和设备
CN101634544A (zh) * 2009-09-02 2010-01-27 郑州辰维科技有限公司 一种水轮机叶片毛坯型面测量与加工余量分析方法
CN101789126A (zh) * 2010-01-26 2010-07-28 北京航空航天大学 基于体素的三维人体运动跟踪方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张欣.递归神经网络的并行LM算法.《机械管理开发》.2008,第23卷(第6期),170-171页.
递归神经网络的并行LM算法;张欣;《机械管理开发》;20081231;第23卷(第6期);170-171页 *

Also Published As

Publication number Publication date
CN102650982A (zh) 2012-08-29

Similar Documents

Publication Publication Date Title
CN102650982B (zh) 一种基于fpga的lm算法实现方法
CN105119279B (zh) 一种分布式电源规划方法及其系统
Sun et al. FPGA acceleration of LSTM based on data for test flight
Liu et al. T-MOEA/D: MOEA/D with objective transform in multi-objective problems
CN104111691A (zh) 光伏逆变器基于三点比较法的最大功率点跟踪的控制方法
CN104636829A (zh) 一种提高电力系统温度最优潮流计算效率的解耦算法
CN106092156A (zh) 交流伺服串行通信编码器位置反馈脉冲分频输出系统和方法
Wang et al. Improved auto disturbance rejection control based on moth flame optimization for permanent magnet synchronous motor
Ma et al. Research on A 16.01 FO4 (1V), 26.49 Eu (1V) 4-bit Absolute-Value Detector Based on CMOS transistor
CN106372440B (zh) 一种并行计算的配电网自适应抗差状态估计方法及装置
CN102566965B (zh) 一种误差平坦的浮点数对数运算装置
CN113193663B (zh) 一种磁耦合无线电能传输系统负载及互感双参数辨识方法
Zhou et al. Backflow power optimization of DAB with gradient descent algorithm based extended-phase-shift control in EER application
CN107301266B (zh) 一种磷酸铁锂电池loc估算方法和系统
Gao et al. The application of adaptive Kalman filter in traffic flow forecasting
CN115577777B (zh) 超导量子芯片版图中器件电感能量占比的确定方法及装置
CN114977302A (zh) 一种新能源并网逆变器小信号等值建模方法和系统
CN104182909A (zh) 一种水电系统优化调度的多核并行逐次逼近方法
CN116317197A (zh) 一种lcc-s型无线电能传输系统建模与参数识别方法
Kang et al. Design of convolution operation accelerator based on FPGA
Jiang et al. An end-cloud collaboration for state-of-charge estimation of lithium-ion batteries based on extended Kalman filter and convolutional neural network (CNN)—long short-term memory (LSTM)—attention mechanism (AM)
CN112217191B (zh) 一种基于节点阻抗矩阵的直流配电网稳定性分析方法
Kang et al. Hardware-friendly activation functions for hybridvit models
CN103713686B (zh) 一种小信号功率校正电路
CN108390407B (zh) 分布式光伏接入量计算方法、装置及计算机设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant