CN118133209B - 基于呼吸训练器数据分析的数据处理方法 - Google Patents
基于呼吸训练器数据分析的数据处理方法 Download PDFInfo
- Publication number
- CN118133209B CN118133209B CN202410547588.6A CN202410547588A CN118133209B CN 118133209 B CN118133209 B CN 118133209B CN 202410547588 A CN202410547588 A CN 202410547588A CN 118133209 B CN118133209 B CN 118133209B
- Authority
- CN
- China
- Prior art keywords
- data
- data segment
- period
- segment
- airflow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 13
- 238000003672 processing method Methods 0.000 title claims abstract description 11
- 230000002159 abnormal effect Effects 0.000 claims abstract description 74
- 230000005856 abnormality Effects 0.000 claims abstract description 66
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000001514 detection method Methods 0.000 claims abstract description 15
- 238000012937 correction Methods 0.000 claims abstract description 14
- 230000000737 periodic effect Effects 0.000 claims description 133
- 238000000034 method Methods 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 17
- 230000000241 respiratory effect Effects 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 230000029058 respiratory gaseous exchange Effects 0.000 description 23
- 230000008859 change Effects 0.000 description 12
- 230000001788 irregular Effects 0.000 description 5
- 230000004199 lung function Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 210000004072 lung Anatomy 0.000 description 3
- 230000000630 rising effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 208000023504 respiratory system disease Diseases 0.000 description 2
- 208000000884 Airway Obstruction Diseases 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000035565 breathing frequency Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 230000004202 respiratory function Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63B—APPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
- A63B23/00—Exercising apparatus specially adapted for particular parts of the body
- A63B23/18—Exercising apparatus specially adapted for particular parts of the body for improving respiratory function
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63B—APPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
- A63B2230/00—Measuring physiological parameters of the user
- A63B2230/40—Measuring physiological parameters of the user respiratory characteristics
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63B—APPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
- A63B2230/00—Measuring physiological parameters of the user
- A63B2230/40—Measuring physiological parameters of the user respiratory characteristics
- A63B2230/42—Measuring physiological parameters of the user respiratory characteristics rate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Physical Education & Sports Medicine (AREA)
- General Health & Medical Sciences (AREA)
- Pulmonology (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种基于呼吸训练器数据分析的数据处理方法,包括:采集气流流量数据,对气流流量数据进行分段处理得到每个周期数据段;根据每个周期数据段内每个气流流量数据左右两侧的数据分布波动情况以及数据差异情况得到每个周期数据段的特征参数;根据每个周期数据段的特征参数与整体的差异和周期数据段内气流流量数据的分布幅值,得到每个周期数据段的数据异常程度;获取每个周期数据段与邻域内周期数据段之间的数据距离;基于数据距离利用异常检测算法获取异常周期数据段,利用异常周期数据段与邻域内周期数据段之间的数据距离,对异常周期数据段内的气流流量数据进行修正。本发明能够获得更加准确的修正数据。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于呼吸训练器数据分析的数据处理方法。
背景技术
呼吸康复训练是一种重要的康复手段,用于改善呼吸功能,预防和治疗呼吸系统疾病。通过呼吸训练器进行呼吸康复训练,可以提供全面的呼吸康复解决方案,帮助患者改善肺功能,提高生活质量,减少呼吸道疾病的发生。在医学领域或者平常的生活中得到了广泛的运用。因此,通过呼吸训练器采集到的相关数据的用途较为广泛,确保呼吸训练器反馈数据的准确是尤为重要的。
在正常情况下,可能存在呼吸训练器佩戴不规范导致漏气的情况,使得采集到的数据存在异常,故需要对呼吸训练器的反馈数据进行异常检测并修正。现有常通过异常检测算法对反馈数据进行异常检测,但是由于佩戴不规范的反馈数据也存在一定的聚集性,导致利用异常检测算法进行异常评价的异常得分较不准确,使得异常检测结果较不准确,进而进行数据修正的结果也较不准确。
发明内容
为了解决异常检测结果较不准确,进而进行数据修正的结果也较不准确的技术问题,本发明的目的在于提供一种基于呼吸训练器数据分析的数据处理方法,所采用的技术方案具体如下:
在设定时间段内每个时刻采集呼吸训练器的气流流量数据,根据每个时刻的气流流量数据的分布特征对气流流量数据进行分段处理得到每个周期数据段;
根据每个周期数据段内每个气流流量数据左右两侧的数据分布波动情况以及数据差异情况,得到每个周期数据段的特征参数;
根据每个周期数据段的特征参数与整体的差异和周期数据段内气流流量数据的分布幅值,得到每个周期数据段的数据异常程度;
根据每个周期数据段与邻域内周期数据段的数据异常程度的差异分布情况、每个周期数据段与邻域内周期数据段的特征参数的差异情况,得到周期数据段之间的数据距离;
基于所述数据距离利用异常检测算法获取异常周期数据段,利用异常周期数据段与邻域内周期数据段之间的数据距离,对异常周期数据段内的气流流量数据进行修正。
优选地,所述根据每个周期数据段内每个气流流量数据左右两侧的数据分布波动情况以及数据差异情况,得到每个周期数据段的特征参数,具体包括:
将任意一个周期数据段内任意一个气流流量数据作为目标气流流量数据,根据目标气流流量数据左侧在周期数据段内相邻两个气流流量数据之间的数据差异以及数据差异的波动情况,得到目标气流流量数据的平稳系数;
计算周期数据段内每个气流流量数据与相邻的下一个气流流量数据之间的差值得到差异数据;将目标气流流量数据右侧的差异数据小于预设的差异阈值对应的差异数据的数量占比作为目标气流流量数据的趋势系数;
将所述平稳系数和趋势系数构成的二元组作为目标气流流量数据的特征向量,根据周期数据段内每个气流流量数据的特征向量的数据分布特征得到周期数据段的特征参数。
优选地,所述根据目标气流流量数据左侧在周期数据段内相邻两个气流流量数据之间的数据差异以及数据差异的波动情况,得到目标气流流量数据的平稳系数,具体包括:
计算目标气流流量数据左侧所有差异数据的均值记为第一系数,计算目标气流流量数据左侧所有差异数据的方差记为第二系数;采用水平函数对目标气流流量数据左侧所有气流流量数据进行拟合获得校正决定系数;
计算第一系数的负相关归一化值与第二系数的比值,将该比值与校正决定系数的乘积作为目标气流流量数据的平稳系数。
优选地,所述根据周期数据段内每个气流流量数据的特征向量的数据分布特征得到周期数据段的特征参数,具体包括:
将周期数据段内所有气流流量数据的特征向量的L2范数的最大值对应的特征向量作为周期数据段的特征参数。
优选地,所述根据每个周期数据段的特征参数与整体的差异和周期数据段内气流流量数据的分布幅值,得到每个周期数据段的数据异常程度,具体包括:
对于任意一个周期数据段,计算周期数据段的特征参数的L2范数与周期数据段内气流流量数据的最大值的乘积得到第三系数,对第三系数进行负相关归一化处理得到周期数据段的可能性指标;
根据周期数据段与相邻的周期数据段之间的可能性指标的差异、周期数据段中最后一个时刻的气流流量数据,得到周期数据段的数据异常程度。
优选地,所述根据周期数据段与相邻的周期数据段之间的可能性指标的差异、周期数据段中最后一个时刻的气流流量数据,得到周期数据段的数据异常程度,具体包括:
将任意一个周期数据段记为选定周期数据段,选定周期数据段以及与选定周期数据段相邻的周期数据段构成数据段集合;
计算除了数据段集合之外的所有周期数据段的可能性指标的均值得到第一均值,计算数据段集合中所有周期数据段的可能性指标的均值得到第二均值;将第一均值与第二均值的差值绝对值作为第一差值;将所有周期数据段的可能性指标的最大值与选定周期数据段的可能性指标之间的差值作为第二差值,将第一差值与第二差值的比值作为第一比值;
计算选定周期数据段中最后一个时刻的气流流量数据与该气流流量数据的所述平稳系数的比值作为第二比值;将第一比值与第二比值的乘积作为选定周期数据段的数据异常程度。
优选地,所述根据每个周期数据段与邻域内周期数据段的数据异常程度的差异分布情况、每个周期数据段与邻域内周期数据段的特征参数的差异情况,得到周期数据段之间的数据距离,具体包括:
将任意一个周期数据段记为第一周期数据段,将第一周期数据段的邻域内任意一个周期数据段记为第二周期数据段,计算第一周期数据段和第二周期数据段的数据异常程度之间的和值与第一周期数据段的邻域内所有周期数据段的数据异常程度的方差之间的比值得到第三比值;
将第一周期数据段与第二周期数据段的特征参数之间的差值的二范数作为第一特征系数,将第一周期数据段的特征参数的二范数与第二周期数据段的特征参数的二范数之间的乘积作为第二特征系数,计算第一特征系数和第二特征系数的比值得到第四比值;
将第三比值与第四比值的乘积作为第一周期数据段和第二周期数据段之间的数据距离。
优选地,所述利用异常周期数据段与邻域内周期数据段之间的数据距离,对异常周期数据段内的气流流量数据进行修正,具体包括:
对于任意一个异常周期数据段,对异常周期数据段与邻域内所有周期数据段之间的数据距离的均值进行归一化处理得到异常周期数据段的调整系数;
计算常数1与调整系数的和值与异常周期数据段内的气流流量数据的乘积得到修正后的异常周期数据段内的气流流量数据。
优选地,所述基于所述数据距离利用异常检测算法获取异常周期数据段,具体包括:
对于任意一个周期数据段,对周期数据段与邻域内所有周期数据段之间的数据距离的均值进行归一化处理得到周期数据段的异常得分;将异常得分大于预设的异常阈值对应的周期数据段作为异常周期数据段。
优选地,所述根据每个时刻的气流流量数据的分布特征对气流流量数据进行分段处理得到每个周期数据段,具体包括:
采用傅里叶变换将气流流量数据转化为频域数据获得频谱图,基于频谱图中最大幅值对应的频率获取周期长度,利用周期长度对气流流量数据进行分段处理得到每个周期数据段。
本发明实施例至少具有如下有益效果:
本发明采集气流流量数据,并对气流流量数据进行分段获得的周期数据段,利用周期数据段表征每个完整的呼吸过程,进而为后续分别针对每个呼吸过程的数据变化趋势进行分析提供数据基础。首先,对每个周期数据段内每个气流流量数据左右两侧的数据分布波动情况以及数据差异情况进行分析,量化每个周期数据段的数据分布特征,也即是特征参数反映了周期数据段内数据的平稳性和波动性。然后,通过分析每个周期数据段的特征参数与整体的差异和周期数据段内气流流量数据的分布幅值获得数据异常程度,即异常程度表征了每个周期数据段内存在漏气异常的可能性大小以及异常程度。进一步的,分析每个周期数据段与邻域内周期数据段的数据异常程度的差异分布情况、每个周期数据段与邻域内周期数据段的特征参数的差异情况,可以实现对两个周期数据段之间的数据距离进行量化,即基于异常程度分析周期数据段之间的距离参数,能够更加准确的反映出存在漏气异常的周期数据段,基于此,最终基于所述数据距离利用异常检测算法获取异常周期数据段更加准确,进而可以自适应的对每个周期数据段内的数据进行修正,使得修正后的数据不仅更加准确,而且排除了漏气现象引起的数据异常现象。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明实施例提供的一种基于呼吸训练器数据分析的数据处理方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于呼吸训练器数据分析的数据处理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于呼吸训练器数据分析的数据处理方法的具体方案。
本发明所针对的具体实施场景为:由于用户使用不规范导致设备漏气使得检测数据存在异常情况,本发明通过分析使用呼吸训练器呼气的过程中气流的变化趋势,结合由于佩戴不规范导致漏气的数据特征表现,对每个呼吸过程周期内的数据异常情况进行量化,利用异常得分情况作为调整系数,对存在漏气行为导致的异常数据进行修正,可以有效校正异常数据。
请参阅图1,其示出了本发明一个实施例提供的一种基于呼吸训练器数据分析的数据处理方法的步骤流程图,该方法包括以下步骤:
步骤一,在设定时间段内每个时刻采集呼吸训练器的气流流量数据,根据每个时刻的气流流量数据的分布特征对气流流量数据进行分段处理得到每个周期数据段。
首先,通过呼吸训练器的气流流量数据,可以监测用户的呼吸频率、呼吸深度等参数,帮助使用者了解自己的呼吸模式,从而实现放松身心、调整情绪等训练目标。同时也能够反映用户的肺活量、最大吸气气流等肺功能检测参数,为相关医务人员评估用户的气道阻塞症状、哮喘等疾病的诊断和监测提供重要信息。
在本实施例中,通过在设定时间段内采集每个时刻的呼吸训练器中的气流流量数据,为了消除量纲对后续数据分析的影响,对采集到的数据进行标准化处理。其中,将设定时间段的时间长度设置为5分钟,设定时间段内相邻两个时刻的时间间隔为0.2秒,实施者可根据具体实施场景进行设置。
在设定时间段内使用者不断的进行不同的长呼吸操作,在一个完整的呼吸过程中,气流的变化具有一定的周期性特征,经过一次完整的长呼吸后,肺部的气体已经几乎完全被排除,气流流量会减小到极低的水平,一个呼气结束到下一个呼吸开始的时间段被称为呼吸间期,在这段时间内气流流量数据会维持较为平稳的水平。
基于此,可以利用气流流量数据具有周期性分布的特征,对采集到的数据进行数据段的划分,即根据每个时刻的气流流量数据的分布特征对气流流量数据进行分段处理得到每个周期数据段。具体地,采用傅里叶变换将气流流量数据转化为频域数据获得频谱图,基于频谱图中最大幅值对应的频率获取周期长度,利用周期长度对气流流量数据进行分段处理得到每个周期数据段。
在其他实施例中,考虑到不同的呼吸过程存在一定的时间周期差异性,可以根据实际的数据段划分过程对周期进行调整。具体地,假设周期长度为L,从第一个时刻开始,获取与周期长度数量相等的时刻对应的气流流量数据构成第一个数据段,也即是从第一个时刻至第L个时刻的气流流量数据构成了第一个数据段,考虑到呼吸过程之间存在一定的时间差异,同时在呼吸过程即将结束或者即将开始的阶段,气流流量数据分布较为平稳,故获取第一个数据段最后一个时刻的气流流量数据的周围数据的最小值作为数据段的结束位置,即获取第L-5个时刻至第L+5个时刻的气流流量数据中的最小值,假设为第L+2个时刻,则此时第一个周期数据段即为从第一个时刻至第L+2个时刻的气流流量数据。
进一步的,从第L+3个时刻开始,同样获取L个气流流量数据构成第二个数据段,即初步获取的第二个数据段为从第L+3个时刻至第2L+3个时刻的气流流量数据,然后获取第2L-2个时刻至第2L+8个时刻的气流流量数据中的最小值作为第二个周期数据段的结束位置。以此类推,直至所有时刻的气流流量数据均被划分。
至此,设定时间段内每个时刻的气流流量数据均被划分,每个周期数据段可以表征每次进行呼吸的过程周期对应的气流流量数据。
步骤二,根据每个周期数据段内每个气流流量数据左右两侧的数据分布波动情况以及数据差异情况,得到每个周期数据段的特征参数。
由于佩戴不规范导致呼吸训练器存在漏气情况,此时对呼吸过程的气流存在影响,导致在吸气过程中从缝隙中会进入部分空气,空气来源并非都来自设备管道,导致气流流量数据的监测结果偏小。在呼气过程中呼出的气体可能会从缝隙处流出,导致监测时气流流量数据下降较为缓慢,且与正常情况存在趋势差异,在实际已经结束呼气行为,但是气流流量数据还在缓慢减小,进而还未呈现出较为平稳分布的数据特征就进入下一次呼吸过程的数据变化特征。基于此特征,可以首先在每个周期数据段中,分别以每个气流流量数据为分析对象,分析该数据左侧的气流流量数据和右侧的气流流量数据的波动情况,以寻找周期数据段中最具有代表性的数据特征分布。
在每次呼吸过程对应的周期数据段中,一般是包含较为平稳的数据变化,此时是使用者正在准备即将进行一次深呼吸操作,然后存在一个较为明显的数据拐点,气流流量数据开始发生较为明显的变化趋势,即单调递增的趋势,利用拐点的气流流量数据的数据特征作为具有代表性的数据特征,表示周期数据段的数据特征分布。
首先,分析每个气流流量数据左侧数据的平稳性分布情况。将任意一个周期数据段内任意一个气流流量数据作为目标气流流量数据,根据目标气流流量数据左侧在周期数据段内相邻两个气流流量数据之间的数据差异以及数据差异的波动情况,得到目标气流流量数据的平稳系数。
具体地,计算周期数据段内每个气流流量数据与相邻的下一个气流流量数据之间的差值得到差异数据;计算目标气流流量数据左侧所有差异数据的均值记为第一系数,计算目标气流流量数据左侧所有差异数据的方差记为第二系数;采用水平函数对目标气流流量数据左侧所有气流流量数据进行拟合获得校正决定系数;计算第一系数的负相关归一化值与第二系数的比值,将该比值与校正决定系数的乘积作为目标气流流量数据的平稳系数。
在本实施例中,以任意一个周期数据段为例进行说明,将第i个周期数据段内第t个气流流量数据作为目标气流流量数据,则目标气流流量数据的平稳系数用公式可以表示为: 其中,表示第i个周期数据段内第t个气流流量数据的平稳系数,表示第i个周期数据段内第t个气流流量数据,表示第i个周期数据段内第t+1个气流流量数据,表示第i个周期数据段内第t个气流流量数据对应的差异数据,为第一系数,表示第i个周期数据段内第t个气流流量数据左侧所有差异数据的均值,为第二系数,表示第i个周期数据段内第t个气流流量数据左侧所有差异数据的方差,表示第i个周期数据段内第t个气流流量数据左侧所有气流流量数据进行拟合获得的校正决定系数,exp( )表示以自然常数e为底的指数函数。
差异数据反映了在周期数据段内相邻两个时刻之间的数据差异情况,当目标气流流量数据为周期数据段中的数据拐点时,目标气流流量数据左侧的数据分布更具平稳性,也即是数据波动程度较小,且气流流量数据幅值较小。
因此,的取值越小,说明目标气流流量数据左侧的数据整体差异分布越小,的取值越小,说明目标气流流量数据左侧的差异数据波动情况越小,对应的平稳系数的取值也就越大。
需要说明的是,假设第i个周期数据段是从第个时刻至第个时刻之间的气流流量数据构成的,则第i个周期数据段中第t个气流流量数据的左侧数据可以是第个时刻至第个时刻之间的气流流量数据构成。
采用水平函数的拟合校正决定系数,该值越大表明数据整体表现为在水平方向上呈现为直线的可能性越大,从而避免由于数据差异较大但最终均值较小的影响,对应的平稳系数的取值也就越大。需要说明的是,拟合校正决定系数时的拟合模型为一个常数或者是一个与自变量无关的函数,例如y=c,c的取值可以通过经验获取不处于深呼吸操作时气流流量数据的均值。
平稳系数反映了每个气流流量数据在对应周期数据段左侧的数据平稳性分布特征程度,平稳系数的取值越大,对应的气流流量数据越符合周期数据段中拐点数据的特征分布。
然后,对每个气流流量数据右侧数据的波动情况进行分析。将目标气流流量数据右侧的差异数据小于预设的差异阈值对应的差异数据的数量占比作为目标气流流量数据的趋势系数。
在本实施例中,差异阈值的取值为0,也即是当差异数据时,说明随着时间的增加,气流流量数据在减小,数据变化呈现出下降的趋势。而当差异数据时,说明随着时间的增加,气流流量数据也在增加,数据变化呈现出上升的趋势。进而获取呈现上升趋势的数据数量与右侧所有气流流量数据的比值,可以获得目标气流流量数据右侧呈现上升趋势的差异数据的占比情况,该占比越大,说明呈现出上升的程度大小,对应的每个气流流量数据右侧的变化趋势越符合周期数据段中拐点数据的特征分布。
基于此,结合每个气流流量数据的左右两侧的数据分布特征情况,对每个气流流量数据的信息参数进行表征,即将所述平稳系数和趋势系数构成的二元组作为目标气流流量数据的特征向量,可以根据周期数据段内每个气流流量数据的特征向量的数据分布特征得到周期数据段的特征参数。
具体地,将周期数据段内所有气流流量数据的特征向量的L2范数的最大值对应的特征向量作为周期数据段的特征参数。也即是将周期数据段内所有特征表现程度最大的气流流量数据对应的特征表现作为周期数据段的特征参数。进而特征参数表征了周期数据段内数据分布的正常情况。
步骤三,根据每个周期数据段的特征参数与整体的差异和周期数据段内气流流量数据的分布幅值,得到每个周期数据段的数据异常程度。
特征参数作为周期数据段的特征表征,正常变化的气流流量数据所在的周期数据段与异常变化的气流流量数据所在的周期数据段之间的特征表征存在一定的差异。例如存在漏气情况的周期数据段的特征参数中的平稳系数的取值较小,也即呼吸初期的数据平稳性较差。同时由于存在漏气情况,周期数据段中的气流流量数据偏小,从而使得呼吸过程中的呼气流量峰值降低。
基于此特征,首先通过周期数据段的特征参数与周期数据段内的峰值气流流量数据,对周期数据段的初始异常可能性进行量化。具体地,对于任意一个周期数据段,计算周期数据段的特征参数的L2范数与周期数据段内气流流量数据的最大值的乘积得到第三系数,对第三系数进行负相关归一化处理得到周期数据段的可能性指标。其中,表示第i个周期数据段的可能性指标,表示第i个周期数据段的特征参数,表示第i个周期数据段的特征参数的L2范数,表示第i个周期数据段内气流流量数据的最大值,Norm( )表示线性归一化函数。
为第三系数,反映了周期数据段中特征参数的数据表征与峰值数据之间的乘积,当特征参数的L2范数的取值越小,说明周期数据段内数据的平稳性越差,且波动性可能也越差,同时峰值的取值越小,对应周期数据段内存在漏气异常的可能性越大,即可能性指标的取值越大。周期数据段的可能性指标表征了周期数据段内存在数据异常的可能性大小。
然后,结合初始量化的周期数据段的异常可能性,对周期数据段的异常情况进行进一步的分析,即根据周期数据段与相邻的周期数据段之间的可能性指标的差异、周期数据段中最后一个时刻的气流流量数据,得到周期数据段的数据异常程度。
具体地,将任意一个周期数据段记为选定周期数据段,选定周期数据段以及与选定周期数据段相邻的周期数据段构成数据段集合,在本实施例中,将第i个周期数据段作为选定周期数据段,进而与第i个周期数据段相邻的为第i-1个周期数据段和第i+1个周期数据段,即数据段集合中包含三个周期数据段。
计算除了数据段集合之外的所有周期数据段的可能性指标的均值得到第一均值,计算数据段集合中所有周期数据段的可能性指标的均值得到第二均值;将第一均值与第二均值的差值绝对值作为第一差值;将所有周期数据段的可能性指标的最大值与选定周期数据段的可能性指标之间的差值作为第二差值,将第一差值与第二差值的比值作为第一比值。
计算选定周期数据段中最后一个时刻的气流流量数据与该气流流量数据的所述平稳系数的比值作为第二比值;将第一比值与第二比值的乘积作为选定周期数据段的数据异常程度。
在本实施例中,以任意一个周期数据段为例进行说明,则第i个周期数据段即选定周期数据段的数据异常程度的计算公式可以表示为:其中,表示第i个周期数据段的数据异常程度,为第一均值,表示数据段集合中所有周期数据段的可能性指标的均值,为第二均值,表示除了数据段集合之外的所有周期数据段的可能性指标的均值,表示第i个周期数据段的可能性指标,表示所有周期数据段的可能性指标的最大值,表示第i个周期数据段中最后一个时刻的气流流量数据,表示第i个周期数据段中最后一个时刻的气流流量数据的平稳系数。
为第一差值,反映了选定周期数据段邻域内的异常可能性情况与所有数据整体的异常可能性之间的差异,第一差值的取值越大,说明选定周期相较于整体数据分布的异常可能性越大,对应的数据差异程度的取值越大。
为第二差值,反映了选定周期数据段的可能性指标与最大值之间的差异,该差异越大,说明选定周期数据段的数据异常可能性越小,对应的数据异常程度越小,说明选定周期数据段的数据异常情况越小。
由于存在漏气情况下,在呼吸结束阶段气流流量数据呈现出缓慢减小的趋势,并且在呼吸开始阶段气流流量数据的平稳性系数较差,故当的取值越大,对应的数据异常程度取值越大,说明选定周期数据段内存在异常的程度越大。
周期数据段的数据异常程度较为全面的反映了周期数据段内气流流量数据的异常程度大小,进而也反映了数据异常的可能性大小。
步骤四,根据每个周期数据段与邻域内周期数据段的数据异常程度的差异分布情况、每个周期数据段与邻域内周期数据段的特征参数的差异情况,得到周期数据段之间的数据距离。
在实际中,常采用KNN算法进行数据异常检测,该算法的中心思想是,通过计算每个样本点与之最近的K个样本的平均距离,在利用计算的平均距离与阈值进行比较,如果大于阈值,则认为是异常点。考虑到直接利用气流流量数据进行异常评价,无法区分是由于漏气导致的数据异常还是真实的数据异常,使得数据的异常得分较不准确,故本实施例基于能够表征一个呼吸周期内的数据异常指标进行距离的计算。
首先,需要确定每个周期数据段的K近邻周期数据段,在本实施例中,将每两个周期数据段的数据异常程度之间的欧式距离作为距离评价指标,进而获取每个周期数据段的最近的K个周期数据段构成每个周期数据段的邻域。
然后,对每个周期数据段与邻域内周期数据段的数据异常程度的差异分布情况、每个周期数据段与邻域内周期数据段的特征参数的差异情况进行分析,量化周期数据段之间的数据距离,也就是对每两个周期数据段之间的距离参数进行优化。
具体地,将任意一个周期数据段记为第一周期数据段,将第一周期数据段的邻域内任意一个周期数据段记为第二周期数据段,计算第一周期数据段和第二周期数据段的数据异常程度之间的和值与第一周期数据段的邻域内所有周期数据段的数据异常程度的方差之间的比值得到第三比值。
将第一周期数据段与第二周期数据段的特征参数之间的差值的二范数作为第一特征系数,将第一周期数据段的特征参数的二范数与第二周期数据段的特征参数的二范数之间的乘积作为第二特征系数,计算第一特征系数和第二特征系数的比值得到第四比值;将第三比值与第四比值的乘积作为第一周期数据段和第二周期数据段之间的数据距离。
在本实施例中,将第n个周期数据段作为第一周期数据段,将第一周期数据段的邻域内第m个周期数据段作为第二周期数据段,则第一周期数据段和第二周期数据段之间的数据距离的计算公式可以表示为:其中,表示第n个周期数据段与第一周期数据段的邻域内第m个周期数据段之间的数据距离,表示第n个周期数据段的数据异常程度,表示第n个周期数据段的邻域内第m个周期数据段的数据异常程度,表示第n个周期数据段的邻域内所有周期数据段的数据异常程度的方差,表示第n个周期数据段的特征参数,表示第n个周期数据段的邻域内第m个周期数据段的特征参数,表示求L2范数。
为第三比值,方差越小表现说明邻域内异常数据越集中,但是表现正常呼吸周期的数据同样存在较小的方差,因此利用k邻域内异常程度在数值上的差异确定实现异常数据和正常数据的区分,也即是异常数据的数据异常程度的取值越大,即两个周期数据段的数据异常程度之和的取值越大,对应的第三比值的取值大,对应的两者之间的距离越大。
反映了两个周期数据段之间的特征表示的差异情况,为第四比值,反映了两个周期数据段之间的特征差异距离,该取值越大,说明两个周期数据段之间的数据特征分布差异越大,对应的数据距离越大。
第一周期数据段和第二周期数据段之间的数据距离通过数据异常分布情况以及特征分布差异距离反映了两者之间的差异距离。
步骤五,基于所述数据距离利用异常检测算法获取异常周期数据段,利用异常周期数据段与邻域内周期数据段之间的数据距离,对异常周期数据段内的气流流量数据进行修正。
在本实施例中,利用KNN算法对周期数据段进行异常检测,即计算每个周期数据段与该周期数据段的K近邻周期数据段之间的平均数据距离,再利用计算的平均数据距离与阈值进行比较,筛选出存在异常情况的周期数据段。
具体地,对于任意一个周期数据段,对周期数据段与邻域内所有周期数据段之间的数据距离的均值进行归一化处理得到周期数据段的异常得分;周期数据段的异常得分反映了周期数据段与邻域内数据段之间的差异距离分布情况。当异常得分的取值越大时,说明周期数据段与邻域内周期数据段的数据分布差异越大,进而说明该周期数据段存在异常的可能性越大,同时异常程度越大。当异常得分的取值越小时,说明周期数据段与邻域内周期数据段的数据分布差异越小,进而说明该周期数据段存在异常的可能性越小,同时异常程度越小。
基于此,将异常得分大于预设的异常阈值对应的周期数据段作为异常周期数据段。在本实施例中,异常阈值的取值为0.8。由于周期数据段的异常得分的取值为归一化的数值,故异常阈值的取值范围为(0,1)。
当周期数据段的异常得分大于异常阈值时,说明周期数据段的数据分布与邻域内周期数据段的数据分布之间的差异较大,进而说明该周期数据段相较于邻域内的周期数据段之间的异常程度越大,存在漏气异常的可能性也就越大。当周期数据段的异常得分小于或等于异常阈值时,说明周期数据段的数据分布特征较为复合正常的数据变化特征,进而说明该周期数据段存在漏气异常的可能性越小。
进一步的,通过每个周期数据段的异常得分可以确定每一个周期数据段的数据权重,从而可以实现对肺功能监测参数的校正。即利用异常周期数据段与邻域内周期数据段之间的数据距离,对异常周期数据段内的气流流量数据进行修正。
具体地,对于任意一个异常周期数据段,对异常周期数据段与邻域内所有周期数据段之间的数据距离的均值进行归一化处理得到异常周期数据段的调整系数;计算常数1与调整系数的和值与异常周期数据段内的气流流量数据的乘积得到修正后的异常周期数据段内的气流流量数据。
在本实施例中,为了对肺功能中的肺活量进行监测,故需要获取呼吸过程中的最大呼吸流量,也即是每个周期数据段中气流流量数据的最大值,故利用对应的周期数据段的异常得分对气流流量数据的最大值进行修正,用公式可以表示为:其中,表示修正后的第r个异常周期数据段的气流流量数据的最大值,表示第r个异常周期数据段的气流流量数据的最大值,表示第r个异常周期数据段的调整系数。
需要说明的是,异常周期数据段为存在佩戴不规范而导致漏气现象,故异常周期数据段内的气流流量数据的最大值的测量值相较于实际值较小,故利用调整系数将气流流量数据调大处理,使得修正后的气流流量数据排除了佩戴不规范问题导致的数据异常,使得最终数据更加准确。
进一步的,相关医务人员可以基于更加准确的气流流量数据对使用者的肺功能表现情况进行进一步的数据排查。可以及时提醒使用者前往医院进行相关检查。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,均应包含在本申请的保护范围之内。
Claims (3)
1.一种基于呼吸训练器数据分析的数据处理方法,其特征在于,该方法包括以下步骤:
在设定时间段内每个时刻采集呼吸训练器的气流流量数据,根据每个时刻的气流流量数据的分布特征对气流流量数据进行分段处理得到每个周期数据段;
根据每个周期数据段内每个气流流量数据左右两侧的数据分布波动情况以及数据差异情况,得到每个周期数据段的特征参数;
根据每个周期数据段的特征参数与整体的差异和周期数据段内气流流量数据的分布幅值,得到每个周期数据段的数据异常程度;
根据每个周期数据段与邻域内周期数据段的数据异常程度的差异分布情况、每个周期数据段与邻域内周期数据段的特征参数的差异情况,得到周期数据段之间的数据距离;
基于所述数据距离利用异常检测算法获取异常周期数据段,利用异常周期数据段与邻域内周期数据段之间的数据距离,对异常周期数据段内的气流流量数据进行修正;
所述根据每个周期数据段内每个气流流量数据左右两侧的数据分布波动情况以及数据差异情况,得到每个周期数据段的特征参数,具体包括:
将任意一个周期数据段内任意一个气流流量数据作为目标气流流量数据,根据目标气流流量数据左侧在周期数据段内相邻两个气流流量数据之间的数据差异以及数据差异的波动情况,得到目标气流流量数据的平稳系数;
计算周期数据段内每个气流流量数据与相邻的下一个气流流量数据之间的差值得到差异数据;将目标气流流量数据右侧的差异数据小于预设的差异阈值对应的差异数据的数量占比作为目标气流流量数据的趋势系数;
将所述平稳系数和趋势系数构成的二元组作为目标气流流量数据的特征向量,根据周期数据段内每个气流流量数据的特征向量的数据分布特征得到周期数据段的特征参数;
所述根据目标气流流量数据左侧在周期数据段内相邻两个气流流量数据之间的数据差异以及数据差异的波动情况,得到目标气流流量数据的平稳系数,具体包括:
计算目标气流流量数据左侧所有差异数据的均值记为第一系数,计算目标气流流量数据左侧所有差异数据的方差记为第二系数;采用水平函数对目标气流流量数据左侧所有气流流量数据进行拟合获得校正决定系数;
计算第一系数的负相关归一化值与第二系数的比值,将该比值与校正决定系数的乘积作为目标气流流量数据的平稳系数;
所述根据周期数据段内每个气流流量数据的特征向量的数据分布特征得到周期数据段的特征参数,具体包括:
将周期数据段内所有气流流量数据的特征向量的L2范数的最大值对应的特征向量作为周期数据段的特征参数;
所述根据每个周期数据段的特征参数与整体的差异和周期数据段内气流流量数据的分布幅值,得到每个周期数据段的数据异常程度,具体包括:
对于任意一个周期数据段,计算周期数据段的特征参数的L2范数与周期数据段内气流流量数据的最大值的乘积得到第三系数,对第三系数进行负相关归一化处理得到周期数据段的可能性指标;
根据周期数据段与相邻的周期数据段之间的可能性指标的差异、周期数据段中最后一个时刻的气流流量数据,得到周期数据段的数据异常程度;
所述根据周期数据段与相邻的周期数据段之间的可能性指标的差异、周期数据段中最后一个时刻的气流流量数据,得到周期数据段的数据异常程度,具体包括:
将任意一个周期数据段记为选定周期数据段,选定周期数据段以及与选定周期数据段相邻的周期数据段构成数据段集合;
计算除了数据段集合之外的所有周期数据段的可能性指标的均值得到第一均值,计算数据段集合中所有周期数据段的可能性指标的均值得到第二均值;将第一均值与第二均值的差值绝对值作为第一差值;将所有周期数据段的可能性指标的最大值与选定周期数据段的可能性指标之间的差值作为第二差值,将第一差值与第二差值的比值作为第一比值;
计算选定周期数据段中最后一个时刻的气流流量数据与该气流流量数据的所述平稳系数的比值作为第二比值;将第一比值与第二比值的乘积作为选定周期数据段的数据异常程度;
所述根据每个周期数据段与邻域内周期数据段的数据异常程度的差异分布情况、每个周期数据段与邻域内周期数据段的特征参数的差异情况,得到周期数据段之间的数据距离,具体包括:
将任意一个周期数据段记为第一周期数据段,将第一周期数据段的邻域内任意一个周期数据段记为第二周期数据段,计算第一周期数据段和第二周期数据段的数据异常程度之间的和值与第一周期数据段的邻域内所有周期数据段的数据异常程度的方差之间的比值得到第三比值;
将第一周期数据段与第二周期数据段的特征参数之间的差值的二范数作为第一特征系数,将第一周期数据段的特征参数的二范数与第二周期数据段的特征参数的二范数之间的乘积作为第二特征系数,计算第一特征系数和第二特征系数的比值得到第四比值;
将第三比值与第四比值的乘积作为第一周期数据段和第二周期数据段之间的数据距离;
所述利用异常周期数据段与邻域内周期数据段之间的数据距离,对异常周期数据段内的气流流量数据进行修正,具体包括:
对于任意一个异常周期数据段,对异常周期数据段与邻域内所有周期数据段之间的数据距离的均值进行归一化处理得到异常周期数据段的调整系数;
计算常数1与调整系数的和值与异常周期数据段内的气流流量数据的乘积得到修正后的异常周期数据段内的气流流量数据。
2.根据权利要求1所述的一种基于呼吸训练器数据分析的数据处理方法,其特征在于,所述基于所述数据距离利用异常检测算法获取异常周期数据段,具体包括:
对于任意一个周期数据段,对周期数据段与邻域内所有周期数据段之间的数据距离的均值进行归一化处理得到周期数据段的异常得分;将异常得分大于预设的异常阈值对应的周期数据段作为异常周期数据段。
3.根据权利要求1所述的一种基于呼吸训练器数据分析的数据处理方法,其特征在于,所述根据每个时刻的气流流量数据的分布特征对气流流量数据进行分段处理得到每个周期数据段,具体包括:
采用傅里叶变换将气流流量数据转化为频域数据获得频谱图,基于频谱图中最大幅值对应的频率获取周期长度,利用周期长度对气流流量数据进行分段处理得到每个周期数据段。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410547588.6A CN118133209B (zh) | 2024-05-06 | 2024-05-06 | 基于呼吸训练器数据分析的数据处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410547588.6A CN118133209B (zh) | 2024-05-06 | 2024-05-06 | 基于呼吸训练器数据分析的数据处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118133209A CN118133209A (zh) | 2024-06-04 |
CN118133209B true CN118133209B (zh) | 2024-07-05 |
Family
ID=91239318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410547588.6A Active CN118133209B (zh) | 2024-05-06 | 2024-05-06 | 基于呼吸训练器数据分析的数据处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118133209B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118416354B (zh) * | 2024-07-05 | 2024-09-13 | 长沙心诺医疗器械有限公司 | 一种半导体激光氧疗仪及呼吸状态检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116956188A (zh) * | 2023-07-06 | 2023-10-27 | 中国电信股份有限公司技术创新中心 | 数据异常检测方法、装置、电子设备及存储介质 |
CN117153416A (zh) * | 2023-10-26 | 2023-12-01 | 天津医科大学第二医院 | 一种糖尿病筛查数据处理及管理系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5301310B2 (ja) * | 2009-02-17 | 2013-09-25 | 株式会社日立製作所 | 異常検知方法及び異常検知システム |
CN117349778B (zh) * | 2023-12-04 | 2024-02-20 | 湖南蓝绿光电科技有限公司 | 一种基于物联网的用电设备在线实时监测系统 |
-
2024
- 2024-05-06 CN CN202410547588.6A patent/CN118133209B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116956188A (zh) * | 2023-07-06 | 2023-10-27 | 中国电信股份有限公司技术创新中心 | 数据异常检测方法、装置、电子设备及存储介质 |
CN117153416A (zh) * | 2023-10-26 | 2023-12-01 | 天津医科大学第二医院 | 一种糖尿病筛查数据处理及管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN118133209A (zh) | 2024-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11315687B2 (en) | Method and apparatus for training and evaluating artificial neural networks used to determine lung pathology | |
Abeyratne et al. | Pitch jump probability measures for the analysis of snoring sounds in apnea | |
US6550478B2 (en) | Auto CPAP system profile information | |
US11304624B2 (en) | Method and apparatus for performing dynamic respiratory classification and analysis for detecting wheeze particles and sources | |
US20120037159A1 (en) | Detection of asynchrony | |
CN118133209B (zh) | 基于呼吸训练器数据分析的数据处理方法 | |
US20090247837A1 (en) | System And Method For Diagnosing Sleep Apnea | |
WO2012060107A1 (ja) | 生体音検査装置、及び、生体音検査方法 | |
CN117497181B (zh) | 一种基于人工智能的慢性病信息管理系统 | |
US11529072B2 (en) | Method and apparatus for performing dynamic respiratory classification and tracking of wheeze and crackle | |
KR20180014417A (ko) | 비강압력신호를 이용한 수면호흡장애 환자의 수면/각성 분류 장치 및 방법 | |
US20160228037A1 (en) | Homecare asthma management | |
CN102215750B (zh) | 呼吸辅助病人的呼吸肌肉活动检测系统 | |
US10426426B2 (en) | Methods and apparatus for performing dynamic respiratory classification and tracking | |
Ghaemmaghami et al. | Normal probability testing of snore signals for diagnosis of obstructive sleep apnea | |
CN111281349A (zh) | 睡眠呼吸障碍监测方法及系统 | |
CN114711749A (zh) | 一种基于定量性报告模板的肺功能状态分类方法 | |
CN105361885A (zh) | 呼吸波形辨识方法及其系统 | |
CN117174294A (zh) | 一种构建慢阻肺评估模型方法及系统 | |
CN112971762B (zh) | 呼吸信号质量评估方法 | |
US20230263426A1 (en) | Spirometry methods to diagnose mild and early airflow obstruction | |
CN114767089A (zh) | 一种用于肺功能检查的语音引导检测方法及系统 | |
Staykov et al. | Nasal pressure derived airflow limitation and ventilation measurements are resilient to reduced signal quality | |
Pal et al. | Automatic breathing phase identification based on the second derivative of the recorded lung sounds | |
US20230380719A1 (en) | Method and apparatus for simultaneous collection, processing and display of audio and flow events during breathing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |