[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN107633227B - 一种基于csi的细粒度手势识别方法和系统 - Google Patents

一种基于csi的细粒度手势识别方法和系统 Download PDF

Info

Publication number
CN107633227B
CN107633227B CN201710846518.0A CN201710846518A CN107633227B CN 107633227 B CN107633227 B CN 107633227B CN 201710846518 A CN201710846518 A CN 201710846518A CN 107633227 B CN107633227 B CN 107633227B
Authority
CN
China
Prior art keywords
stroke
gesture
strokes
sequence
channel state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710846518.0A
Other languages
English (en)
Other versions
CN107633227A (zh
Inventor
肖江
王羽西
金海�
倪明选
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201710846518.0A priority Critical patent/CN107633227B/zh
Publication of CN107633227A publication Critical patent/CN107633227A/zh
Priority to US16/105,005 priority patent/US10592736B2/en
Application granted granted Critical
Publication of CN107633227B publication Critical patent/CN107633227B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • G06V30/373Matching; Classification using a special pattern or subpattern alphabet
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供一种基于CSI的细粒度手势识别方法,其特征在于,方法包括以下步骤:基于信道状态信息的特征值判断至少一个笔画手势的多个维度的起始点、终结点、速度、方向和/或笔画拐点;采用机器学习方法基于笔画手势的起始点、终结点、速度、方向和/或笔画拐点将笔画分类并形成笔画序列;基于自然语言规律和/或科学语言规律中笔画的出现频率和/或笔画之间的衔接规律构建笔画转移模型;利用笔画转移模型将笔画序列划分并识别为符合自然语言规律和/或科学语言规律的字母序列、偏旁部首序列、数字序列和/或图形序列。本发明通过手势识别文字笔画,再将笔画构建为文字,既丰富了手势识别文字的种类,又提高了手势书写的准确率。

Description

一种基于CSI的细粒度手势识别方法和系统
技术领域
本发明涉及人机交互的手势识别技术领域,尤其涉及一种基于CSI的细粒度手势识别方法和系统。
背景技术
在虚拟现实等智能化人机交互应用中,通过识别和追踪人体的手势进行有效且清晰的沟通已成为工业界和学术界的未来趋势和研究热点。为了实现手写文本输入的目的,目前已提出利用声音设备、视觉设备、射频识别设备或者传感器来进行检测的方法。然而,采用这些方法搭建的文本手写输入系统本身都存在着种种不足。在现有的手写输入识别系统中,一部分的系统需要使用者在书写时做出大幅度的动作以便准确识别出书写的内容,一部分的系统需要使用者携带特定的书写设备而对书写的便捷性造成影响,而另一部分系统对书写时系统的设备和书写环境有极高的要求。
随着无线通信技术的发展,越来越多的无线设备被人们应用到生活当中。无线通信技术不仅能够实现无线设备之间的通信,还能够被用来对人体的行为和手势进行判断。因此,利用无线通信技术来进行手写输入的识别被认作是一种有效可行的方法。这种方法通过构建书写时手指运动的轨迹与无线信号变化规律的关系,通过对无线信号的强度或传播信道的变化进行分析来识别书写内容。然而,到目前为止,利用无线通信技术进行手写输入的应用系统十分少见,并且这些系统只能实现有限的输入功能。
中国发明专利(CN 105807935)公开了一种基于WiFi的手势控制人机交互系统,包括:一信号采集模块,从WiFi信号中获取物理层包含用户动作的通道状态信息CSI;一信号处理模块,对采集的信号进行处理,包括去噪、滤波和平滑处理操作;一手势动作提取模块,根据信号处理模块中得到的信号进行手势动作信息提取;一动作指令映射模块,用于从手势动作提取模块中获取手势动作数据,并将其映射成对应的计算机操作指令。该专利首次提出了基于无线网络信号的WiFinger手势感应文本输入系统。然而,该系统目前只能实现通过利用无线设备产生的信号来进行对于不同手指组合而成的数字文本输入的功能,而不能对手写英文字母及单词进行识别。
中国专利(CN 105844216 A)公开了一种利用WiFi信号识别手写字母的检测与匹配机制,其特征在于,1)本系统是CSI基于细粒度手写字母识别的首次应用;2)对采集的CSI数据进行有效的去噪处理;3)提出了有效的提取特征波形方法;4)训练样本,构造26个手写字母匹配文件;5) 提出了上下文错误纠正方法,提高系统识别准确率。该专利通过将手部动作与26个手写字母样本匹配来识别手写字母。然而,该发明局限之处在于,只能预先构造与字母对应的样本,然后对手写字母进行识别,导致样本数量庞大。对于用户手写的非英文字母文字、图形、计算符号等均不能够识别。因此,该发明对于手写内容的识别具有局限性,不能满足现有用户对手写内容多样化的需求。
现有用户不仅需要对字母进行识别,还需要对其它文字进行识别,例如中文韩文、日文的识别、数字识别,并且形成文字或公式。而中文、韩文、日文的字的构造比较复杂,字的样本量大,不适合将字的样本与对应的波形一一映射存储,存储量太大。对于文字、数字和图形,笔画是其基本单位且数量有限,因此笔画作为基本单位是适合的。但是,由于手写笔画与标准笔画的差距,特别是在无拘束的无线环境中,用户在无形的空间进行书写,书写笔画的大小、规格难以统一和互相参照,因此文字和图形的笔画的准确识别是难以解决的技术问题。例如,未和末的笔画相同,仅第一笔画和第二笔画的长短具有区别,区分未和末的难度比区分英文单词的难度要大很多。并且,如何将连续的笔画构建成准确的字或公式也是目前无法实现的技术难题。
发明内容
针对现有技术之不足,本发明提供一种基于CSI的细粒度手势识别方法,其特征在于,所述方法包括以下步骤:基于信道状态信息的特征值判断至少一个笔画手势的多个维度的起始点、终结点、速度、方向和/或笔画拐点;采用机器学习方法基于所述笔画手势的起始点、终结点、速度、方向和/或笔画拐点将笔画分类并形成笔画序列;基于自然语言规律和/或科学语言规律中笔画的出现频率和/或所述笔画之间的衔接规律构建笔画转移模型;利用所述笔画转移模型将所述笔画序列划分并识别为符合自然语言规律和/或科学语言规律的字母序列、偏旁部首序列、数字序列和/或图形序列。
本发明通过笔画对文字进行识别的优势在于,不需要建立大量的文字波形样本,而且笔画能够构成丰富多样的文字,丰富了识别的文字种类。特别的,本发明通过识别笔画手势的速度、方向、笔画拐点等信息确定笔画的类别和笔画序列,提高了笔画识别的准确率和笔画构建成文字、公式的准确度。
根据一个优选实施方式,所述方法还包括以下步骤:基于自然语言规律和/或科学语言规律的逻辑顺序构建勘误模型,所述勘误模型基于所述逻辑顺序检测并更正所述字母序列、偏旁部首序列、数字序列和/或图形序列,并且将所述字母序列、偏旁部首序列、数字序列和/或图形序列识别为有序排列的单词、字、数字编码和/或图形。本发明通过构建勘误模型,对笔画转移模型识别的字母、偏旁部首、数字和/或图形进行纠正,得到正确的字母、偏旁部首、数字和/或图形。优选的,若干个识别正确的字母、偏旁部首、数字和/或图形按照笔画顺序形成字母序列、偏旁部首序列、数字序列和/或图形序列。勘误模型将按序排列的字母、偏旁部首、数字和/或图形划分和组合,形成正确的单词、字、数字编码和/或图形。本发明的勘误模型基于自然语言逻辑规律将字母或字进行更正,不仅解决了如何纠正笔画转移模型的错误判断的技术问题,而且能够输出正确的,符合语言逻辑的单词、字、数字编码和/或图形,从而形成具有逻辑顺序的语句。
根据一个优选实施方式,所述笔画手势的方向的判断步骤包括:以线性变换方法消除相位偏移;基于信号到达时间选择不具有多径影响的信号;构建CSI数据矩阵并确定信号入射角度;和基于所述信号入射角度、信号路径以及笔画手势位移确定所述笔画手势的速度方向;其中,以线性变换方法消除相位偏移的方法为:第i个子载波的测量相位
Figure BDA0001409583670000031
为:
Figure BDA0001409583670000032
Figure BDA0001409583670000033
为真实相位,δ为信号接收端相对于信号发射端的时钟偏移,其对应产生的相位偏移是
Figure BDA0001409583670000034
β是位置常熟相位偏移,Z 是测量噪声,Ki是第i个子载波编号,N为快速傅立叶变换的大小;
定义
Figure BDA0001409583670000041
在子载波的频率对称的情况下,即
Figure BDA0001409583670000042
则b简化为
Figure BDA0001409583670000043
从测量相位
Figure BDA0001409583670000044
中减去线性项aki+b,消除由δ和β引起的相位偏移,得到不含有噪声Z的真实相位的线性组合,即
Figure BDA0001409583670000045
由于CSI的测量相位与真实相位相比有严重的相位偏移,需要预先消除这些偏移。经过线性变换后的相位与原始相位相比分布相对稳定,尽管处理结果不是真实的相位,但该处理结果对本发明的笔画手势移动方向的判断没有影响。本发明的速度方向的判断方法,不会忽略较小的物体移动,因此能够快速判断微小的笔画手势的方向。
根据一个优选实施方式,所述方法还包括以下步骤:建立信道状态信息的变化模式与笔画之间的映射关系,基于所述信道状态信息的变化模式确定对应的初始笔画,基于所述初始笔画的起始点、终结点、速度、方向和/或笔画拐点判断相邻的初始笔画之间的连接关系,从而根据所述连接关系确定真实笔画以及所述真实笔画的笔画类别。
在实际操作过程中,相似的笔画具有相似的信道状态信息。因此,仅根据信道状态信息的变化模式确定笔画有可能产生错误。本发明基于信道状态信息的变化模式与笔画之间的映射关系对笔画进行初步判断,然后根据笔画之间的连接关系与初始笔画是否一致。若连接关系与初始笔画的匹配程度很高,则初始笔画的判断是正确的,为真实笔画。本发明不依赖初始笔画的判断,采用连接关系的判断辅助笔画的判断,得到正确的笔画。本发明避免了由于笔画手势的不规则书写产生的信道状态信息判断的错误笔画。
根据一个优选实施方式,所述方法包括以下步骤:基于所述笔画手势的起始点、终结点、笔画时间、速度、方向和/或笔画拐点确定所述笔画的多维度的笔画轨迹,基于所述笔画轨迹与所述初始笔画的匹配程度确定真实笔画及其笔画类别。本发明通过笔画手势的起始点、终结点、笔画时间、速度、方向和/或笔画拐点得到的笔画轨迹是用户书写的真实轨迹,将笔画轨迹与初始笔画进行匹配能够快速判断初始笔画的正确性,简化初始笔画正确性验证的过程,避免初始笔画的判断错误。特别地,笔画轨迹与初始笔画的匹配是一种互相验证的机制,匹配程度高证明初始笔画与笔画轨迹都是正确的。相比于通过机器学习法判断笔画的过程,通过信道状态信息判断初始笔画并验证的过程准确率更高,而且没有降低笔画的判断效率。
根据一个优选实施方式,在所述笔画轨迹与所述初始笔画的匹配程度不小于预设阈值的情况下,确定所述初始笔画为真实笔画;在所述笔画轨迹与所述初始笔画的匹配程度小于预设阈值的情况下,采用机器学习方法基于所述笔画手势的起始点、终结点、速度、方向和/或笔画拐点进行笔画分析,确定真实笔画并将笔画分类。本发明在分情况采用机器学习法对笔画进行判断,对于简易的笔画,减少了判断时间。对于复杂的笔画,规避了信道状态信息的变化模式有误差的弊端,从而保证了笔画判断的正确性。在笔画轨迹与初始笔画不匹配的情况下,机器学习法更有利于对笔画的快速判断。优选的,将采用机器学习法判断的第二笔画与初始笔画进行匹配,若匹配程度大于阈值,则初始笔画为真实笔画。若匹配程度小于阈值,则将机器学习法判断的第二笔画作为真实笔画。并且,将第二笔画与初始笔画的信道状态信息建立映射关联,从而纠正信道状态信息与笔画的映射关系。本发明利用机器学习法增加了自动校正机制,使得本发明在判断笔画的过程中自动校正信道状态信息与笔画之间的映射关系。
根据一个优选实施方式,所述信道状态信息的特征值的提取步骤包括:采集至少一个子载波的第一信道状态信息,以降噪和/或切片的方式将所述第一信道状态信息处理为第二信道状态信息;对所述第二信道状态信息进行多维度测量;校正所述第二信道状态信息;和提取所述第二信道状态信息变化的特征值。特征值的提取是笔画判断的关键,也是笔画构建文字过程中的关键数据。本发明通过降噪和/或切片的方式对信道状态信息进行处理,并且对信道状态信息进行校正,使得信道状态信息的波形更平滑,从而使得信道状态信息准确,减少特征值的误差,提高了后期特征值提取的准确性。因此,多维度的测量不会丢失信道状态信息,使得信道状态信息完整,解决了信道状态信息不完整,缺失的技术问题。
根据一个优选实施方式,所述第二信道状态信息变化的特征值的提取步骤包括:将至少一个所述第二信道状态信息进行逆傅立叶变换,利用离散小波变换方法提取至少一个笔画手势的特征值。逆傅立叶变换和离散小波变换方法的处理方法,排除了噪声值的干扰,得到信道状态信息的平滑的波形,修复了波形的误差,使得特征值的准确率升高。准确地特征值是笔画手势的速度、方向、笔画拐点的判断基础。因此,采用逆傅立叶变换和离散小波变换方法能够解决数据不准确,笔画判断识别率低的技术问题。本发明的手势识别方法能够通过特征值的准确率来提高笔画手势的识别准确度。
本发明提供一种基于CSI的细粒度手势识别系统,其特征在于,所述系统至少包括:信号采集模块、特征值提取模块、笔画分类模块和字母识别模块,所述信号采集模块采集信道状态信息,所述特征值提取模块提取信道状态信息的特征值;所述笔画分类模块基于信道状态信息的特征值判断至少一个笔画手势的多个维度的起始点、终结点、速度、方向和/或笔画拐点,并且所述笔画分类模块采用机器学习方法基于所述笔画手势的起始点、终结点、速度、方向和/或笔画拐点将笔画分类并形成笔画序列;所述字母识别模块设置有基于自然语言规律和/或科学语言规律中笔画的出现频率和/或所述笔画之间的衔接规律构建的笔画转移模型;所述字母识别模块基于信道状态信息的特征值判断至少一个笔画手势的多个维度的起始点、终结点、速度、方向和/或笔画拐点,并且利用所述笔画转移模型将所述笔画序列划分并识别为符合自然语言规律和/或科学语言规律的字母序列、偏旁部首序列、数字序列和/或图形序列。本发明通过提供基于CSI的细粒度手势识别系统,能够准确采集、降噪和切片处理信道状态信息,得到平滑的,误差小的波形,从而得到笔画手势的准确特征值。本发明的笔画分类模块,基于特征值准确区分相似的笔画,不会由于笔画的相似性而混淆笔画的特征。字母识别模块能够对笔画序列进行划分和构建,在不打乱用户输入顺序的基础上构建符合笔画衔接规律的字母、单字、数字和/或图形。本发明的系统能够对无线环境的笔画手势排除重力的影响,进行准确识别。本发明将笔画构建为符合语言规律的字母,进而构建为按照输入顺序排列的,符合语言逻辑的单词、词汇、数字编码或图形。本发明的系统不仅将笔画准确构建为文字,而且还具有自动校正机制,准确率达到98%。
根据一个优选实施方式,所述系统还包括勘误模块,所述勘误模块设置有基于自然语言规律和/或科学语言规律的逻辑顺序构建的勘误模型,所述勘误模块基于所述逻辑顺序检测并更正所述字母序列、偏旁部首序列、数字序列和/或图形序列,并且将所述字母序列、偏旁部首序列、数字序列和/或图形序列识别为有序排列的单词、字、数字编码和/或图形。本发明的勘误模块不仅能够基于语言规律和语言逻辑更正字母识别模块的错误,而且能够将按照序列排列的字母、偏旁部首等信息进一步识别为单词、词汇等语言内容。优选的,本发明提供的系统具有校正机制,降低了错误率,其识别并输出的手势内容又符合语言逻辑,便于用户理解,不需要进一步校正。
本发明的有益技术效果:
本发明只需日常生活中家用的无线网络设备即可实现对手写英文字母及单词的识别,从而达到智能化手写输入的目的。本发明旨在通过获取并分析书写不同字母笔画时无线信道状态信息(Channel State Information,CSI) 的变化规律来判断书写的英文字母笔画,并提出了一种基于笔画构建英文字母与单词的手写输入方法,以实现英文手写输入的功能。在书写过程中,使用者只需要手指进行小范围的笔画书写,且无需携带任何专业设备,可操作性强,成本低,具有极高的普及性。
附图说明
图1是本发明的基于CSI的细粒度手势识别方法的逻辑示意图;
图2是本发明的基于CSI的细粒度手势识别系统的模块示意图;
图3是本发明的天线矩阵接收无线信息的示意图;
图4是本发明的笔画手势的移动方向监测示意图;
图5是本发明的笔画手势的方向示意图;
图6是本发明的左上、右上、左下、右下方向的曲线示意图;
图7是本发明的上、下、左、右方向的曲线示意图;
图8是本发明的字母“B”的笔画移动的部分顺序;和
图9是本发明的随机森林算法的逻辑示意图。
附图标记列表
10:信号采集模块 20:信号处理模块
30:特征提取模块 40:笔画分类模块
50:字母识别模块 60:勘误模块
具体实施方式
下面结合附图进行详细说明。
本发明中,Channel State Inform(CSI),即信道状态信息,是一个在子载波尺度上物理层的消息,指的是一条通信链路的信道属性。信道状态信息 (CSI)描述了信号是如何从发射端经过空气传播到接收端的,反映了信号在每条传输路径上的衰弱因子。
本发明的文字包括简体中文、繁体中文、英文、拉丁文等自然语言文字。本发明的图形包括标点符号、几何图形、数学公式、化学公式等包含有数字和图形的文字。
本发明的笔画包括文字笔画、数字笔画和图形笔画。
本发明的单字是指单个的字。本发明的偏旁部首包括构成文字的偏旁和部首。
实施例1
如图1所示,本发明提供一种基于CSI的细粒度手势识别方法,包括以下步骤:
S1:采集信道状态信息(CSI);
S2:提取信道状态信息的特征值;
S3:基于所述特征值与笔画手势的关联判断笔画的类别并构建笔画序列;利用笔画转移模型将所述笔画序列识别为按照逻辑规律排列的字母序列、偏旁部首序列、数字序列和/或图形序列;基于自然语言规律和/或科学语言规律构建勘误模型以校正至少一个字母序列、偏旁部首序列、数字序列和/或图形序列。
本发明对一种基于CSI的细粒度手势识别方法的各个步骤进行如下详细说明。
S1:采集信道状态信息(CSI)。
本发明通过利用现有的无线网络及设备,来实现对手写文字、数字及图形的识别,从而达到智能化文本输入的功能。
本发明的无线接收设备包括无线信号接收装置。无线信号可以是恒定波传输的信号(例如,RFID信号),快速变化的传输信号(例如,TV信号)或间歇传输信号(例如,WiFi信号)。
本发明以WiFi信号为例进行说明。优选的,使用无线网卡接收WiFi信号。本发明通过修改内核,利用低成本的商用无线网卡获取正交频分载波复用技术传输的以子载波形式存在的信道状态信息(CSI)。
优选的,所述信道状态信息的特征值的提取步骤包括步骤S11至S13。
S11:采集至少一个子载波的第一信道状态信息。
例如,将无线接入点作为WiFi信号发射端。WiFi信号发射端将WiFi 信号发送至配备因特尔iwl 5300网卡的接收端。基于无线网络物理层的正交频分载波复用平台,利用复杂室内环境的多径效应,在接收端获取可作唯一标识的若干个子载波的第一信道状态信息。
本发明中,第一信道状态信息指初步采集,没有经过任何技术手段处理的信道状态信息。
优选的,将无线路由器与无线网卡放置于桌面并保持两者之间的距离为 1米至2米之间。无线路由器与无线网卡之间的距离越近,笔画手势的识别准确率越高。书写时,用户的书写位置需保持在由无线路由器与无线网卡构成的连线上,即在无线信号传播的视线传播(Line-Of-Sight,LOS)路径上。用户在该路径上的具体位置对笔画手势判断的准确率无明显影响。
优选的,解调至少一个子载波的所述信道状态信息为第一信道状态信息。
在正交频分载波复用系统数据包的传输过程中,无线信号经过解调会直接输出到解码器中。解码器对无线信号进行解码,得到解调后的各个子载波的第一信道状态信息,从而计算与第一信道状态信息对应的信号幅值及相位。
S12:对第一信道状态信息进行降噪处理。
信道状态信息的降噪方式包括滤波器降噪和/或矩阵分析方法降噪。
本发明采用低通巴特沃斯滤波器(Butterworth Filter)和鲁棒PCA分析方法对第一信道状态信息的幅值进行降噪处理。由于巴特沃斯低通滤波器不会很大程度扭曲原始信号的相位信息,并且通带有较大的平坦振幅响应,可以极大程度保留由笔画手势造成的信号相位变化。所以选择巴特沃斯低通滤波器对第一信道状态信息进行滤波。通过对巴特沃斯低通滤波器设置合理的参数,去除信号中包含的大部分高频环境噪音。
经过滤波后的信号如果还包含有一部分噪音,可以进一步采用鲁棒PCA 分析方法进行降噪。与传统的经典PCA分析相比,本发明采用的鲁棒PCA 分析方法进行了改良,能够更有效的去除噪声而保持有效信息。经过低通滤波器降噪和鲁棒PCA分析方法降噪的第一信道状态信息,含有较少的噪音,使第一信道状态信息更准确。
S13:对降噪后的第一信道状态信息应用阈值可调节法进行切片处理,生成第二信道状态信息。
切片处理有利于信道状态信息中的特征值提取,从而更清晰的确定第二信道状态信息中的幅值和相位。在静止的环境,第二信道状态信息的波形平稳,笔画手势的动作使信道状态信息的幅值和相位会发生明显变化。本发明利用基于窗口可适性赋值的切片方法获取对应于书写单个笔画过程的第二信道状态信息分段。阈值的初始值设为:
Figure BDA0001409583670000101
其中,μω和σω是手势处于笔画书写状态时的均值和标准差,μs和σs是手势保持静止状态时的均值和标准差。
S2:提取信道状态信息的特征值。
在进行笔画手势识别的过程中,笔画手势的切片片段不能直接识别,需要提取特征值来进行识别。
优选的,对笔画手势切片的第二信道状态信息进行多维度测量和校正。
S21:对第二信道状态信息进行多维度测量。
例如,对第二信道状态信息进行三维测量。优选的,信道状态信息为 Ntx×Nry×N的三维矩阵(Ntx表示发送天线的数目,Nry表示接收天线的数目,第三维的N表示子载波数目)。
S22:校正所述第二信道状态信息。
对失真的信道状态数据进行校对,去除缺少维度或数据明显错误的信道状态数据,从而对第二信道状态信息的整体数据进行校对,保留准确的信道状态数据。
S23:提取所述第二信道状态信息变化的特征值。
优选的,第二信道状态信息变化的特征值的提取步骤包括:
将至少一个所述第二信道状态信息进行逆傅立叶变换,和
利用离散小波变换方法提取至少一个笔画手势的特征值。
具体地,对经过校对后笔画手势切片的第二信道状态信息进行逆傅立叶变换,并且利用离散小波变换方法对分段的信道状态信息提取笔画手势的信道状态信息变化模式及其特征值。
根据一个优选实施方式,本发明将笔画手势与信道状态信息变化模式建立关联关系。利用随机森林(Random Forest)算法对已知的笔画手势样本的信道状态信息变化模式进行训练,得到笔画转移模型。随机森林算法是一种多值分类算法,能够将信道状态的特征值进行分类,对应7种已定义笔画。将对应于7种笔画的分类标签定义为Y=[1,7],选取N=500颗决策树 T={T1,T2,…,TN}构建随机森林,如图9所示。
测试CSI中x段为其中一个笔画,随机森林模型要求每个决策树Ti∈T为检测CSI段X所属的属性标签y∈Y进行投票。在选择所有的N个树后,随机森林通过给出所有树中7个类标签的多数投票的类预测
Figure BDA0001409583670000112
将测试CSI 段x分类为其中一个笔画,类预测
Figure BDA0001409583670000113
计算为
Figure BDA0001409583670000114
其中Ci(x)是树Ti的预测。除了书面笔画的预测类标签外,还从随机森林方法中获得了7个笔画的投票概率。输入CSI段x的笔画类标签y的投票概率为Ci(x)=y除以N的总数,计算为
Figure BDA0001409583670000111
对于未知手写笔画的信道状态信息,本发明先获得该书写笔画的信道状态信息的变化模式,随后将其输入到已训练好的笔画转移模型当中得到分类结果,从而实现对该手写字母笔画的判断。
根据一个优选实施方式,本发明还可以基于第二信道状态信息的均值、标准差、平均绝对偏差和/或最大值确定笔画手势的特征数据。根据特征数据确定笔画手势的分类。
均值能够较好的反映信道状态数据集中趋势,标准差能够衡量信道状态数据的离散程度,平均绝对偏差能够计算信道状态数据序列的平均绝对偏差的情况,最大值能够反映极值的程度。通过离散小波转换(DWT),在l2(Z) 长度为N的离散的CSI振幅片段x由近似值g和波长h表示为:
Figure BDA0001409583670000121
其中,j0是任意值,i∈[0,N],
Figure BDA0001409583670000122
离散小波转换(DWT)将原始CSI信号分解为近似系数和细节系数。本发明使用近似系数进行特征提取,因为它们描绘了保持CSI变化模式的信号的形状。由于基本小波函数
Figure BDA0001409583670000126
Figure BDA0001409583670000127
总是相互正交地选择,近似系数α和细节系数分别计算为:
Figure BDA0001409583670000123
Figure BDA0001409583670000124
优选的,本发明基于笔画手势的特征值判断笔画手势的起始点、终止点、方向、速度、加速度和/或笔画拐点。在默认笔画手势的速度为匀速的情况下,本发明也可以不对笔画手势的速度和加速度进行采集和计算。
本发明对笔画手势的方向、速度和笔画拐点的判断进行举例说明。
本发明对笔画手势的速度判断方法如下所示,通过信道状态信息的特征值计算笔画手势的速度。
基于采集并经过数据处理的第二信道状态数据的分析,信道状态数据能量包括静态CSI能量值和动态CSI能量值。
Figure BDA0001409583670000125
使用逆傅立叶变换,将信道状态信息的时域信息转化为频域信息,根据频率和波长的关系得到笔画手势的速度为:
Figure BDA0001409583670000131
其中,λ表示波长的大小,f表示子载波的频率。如图3所示,θ是天线接收无线信号的入射角。
基于笔画手势的速度和时间,确定笔画手势的速度变化以及加速度。根据笔画手势的速度变化过程,确定笔画手势在笔画拐点是转向还是笔画终止。
本发明对笔画手势的方向的判断方法如下。通过判断笔画手势的方向,记录笔画手势的方向变化,有助于确定笔画拐点。
所述笔画手势的速度方向的判断步骤包括:
以线性变换方法消除相位偏移;
基于信号到达时间选择不具有多径影响的信号;
构建CSI数据矩阵并确定信号入射角度;和
基于所述信号入射角度、信号路径以及笔画手势位移确定所述笔画手势的速度方向。
其中,以线性变换方法消除相位偏移的方法为:
第i个子载波的测量相位
Figure BDA0001409583670000135
为:
Figure BDA0001409583670000132
Figure BDA0001409583670000136
为真实相位,δ为信号接收端相对于信号发射端的时钟偏移,其对应产生的相位偏移是β是位置常熟相位偏移,Z是测量噪声,Ki是第i 个子载波的子载波编号,N为快速傅立叶变换的大小。本发明中,子载波编号的取值范围为-28~28。由于未知相位偏移的存在,仅通过商业网卡无法获得真实的相位偏移。
为消除随机相位偏移的影响,对测量相位进行线性变换。
首先,定义
Figure BDA0001409583670000133
Figure BDA0001409583670000134
在子载波的频率对称的情况下,即
Figure BDA0001409583670000138
则b简化为
Figure BDA0001409583670000139
从测量相位
Figure BDA0001409583670000144
中减去线性项aki+b,消除由δ和β引起的相位偏移,得到不含有噪声Z(忽略测量噪声Z)的真实相位的线性组合,即
Figure BDA0001409583670000141
经过消除未知相位偏移,得到了分布稳定的相位,作为有效特征。
在消除相位偏离后,本发明还需要消除CSI数据的多径影响。
本发明从接收端接收的信号提取出笔画手势移动过程导致的信号改变,即笔画手势路径信号。笔画手势路径信号的特点在于:无线信号经过笔画手势反射直接被接收端接收,不存在再次反射的情况,无线信号到达的时间最短。本发明基于无线信号的接收时间进行判断,选取最小的无线信号到达时间值,排除多径的影响,得到笔画手势路径信号。
将CSI数据中30个子载波的时间序列数据,构建天线矩阵阵列。
Figure BDA0001409583670000142
使用MUSIC算法得到笔画手势与信号之间的入射角度:
Figure BDA0001409583670000143
本发明根据无线信号发射端,至少两个无线信号接收端以及笔画手势与信号之间的入射角度评估笔画手势的方向。
如图4所示,带箭头虚线表示WiFi信号,带箭头实线表示笔画手势的移动方向,虚线表示无线信号反射路径。在笔画手势移动过程中,WiFi 信号经过手部反射分别被WiFi信号接收端A1和A2。接收端A1的天线入射角为θ。接收端A2的天线入射角为α。接收端A1和接收端A2的接收信号延长线相交于一点S1,从而确定当前状态下笔画手势的位置为S1。如图,手从S1移动至S2。手移动的方向为S。当笔画手势在移动过程中位置不断发生变化,WiFi信号发生器持续发送WiFi信号,笔画手势反射的WiFi信号被至少两个接收端持续接收,从而不断确定笔画手势的移动方向和笔画拐点。
优选的,基于笔画手势的时间、速度、方向和/或笔画拐点综合判断笔画手势对应的书写笔画。
例如,字母“L”需要两个笔画动作“|”和“一”。笔画动作存在笔画拐点。基于在笔画拐点出现时两个笔画手势的速度变化以及第一笔画终止点和第二笔画起始点的时间间隔确定两个笔画是连接的,而不是独立的两个笔画。
优选的,针对文字、数字、图形的基本笔画分类存储对应的基本笔画样本的波形和笔画拐点。存储基本笔画样本的优势在于,可以减少存储的样本数量。例如,多个英文字母包含笔画“一”。本发明仅需要存储一次笔画“一”,基于自然语言或科学语言规律将笔画互相组合形成字母、单字、固定图形或公式。本发明可以形成数量较多的字母、单字和数字,而不需要针对每一个文字存储波形样本,节省了存储空间,也提高了笔画和文字的识别率。
S3:基于所述特征值与笔画手势的映射关联判断笔画的类别并构建笔画序列;利用笔画转移模型将所述笔画序列识别为按照逻辑规律排列的字母序列、偏旁部首序列、数字序列和/或图形序列。
优选的,基于笔画手势的CSI数据样本建立笔画手势波形与笔画之间的映射列表,将笔画手势波形与笔画建立映射关联。从而,基于笔画手势的波形特征值确定笔画的类别。
优选的,采用机器学习方法基于特征值与笔画手势的关联关系判断笔画的类别和顺序。
例如,英文包括26个英文字母,但构成其字母的笔画只有7种。采集用户在书写位置用手势书写构成英文字母的7种笔画。用户将每种笔画至少写50次。采集与每种笔画对应的信道状态信息,将经过降噪、切片和特征值提取的第二信道状态信息,利用随机森林方法进行样本训练,得到笔画转移模型。利用笔画转移模型对笔画手势进行分类。
优选的,本发明还可以基于HMM(隐马尔可夫)算法进行对书写字母笔画手势的分类。HMM方法能够使机器快速识别笔画,提高笔画的识别效率和准确度。优选的,基于笔画手势波形的输入顺序判断笔画的顺序。
通常,HMM模型λ由三个部分组成,定义为λ=(π,A,B)。λ中的三个参数分别对应于隐藏状态的初始分布概率,隐藏状态的转移概率矩阵和排放概率矩阵。在本发明中,隐藏状态的初始分布概率表示不同笔画的先验概率,即πi=P(Si),i∈[1,8],并且可以通过对字符集中的第一笔划的频率进行计数来获得CH={A,B,…Z}。转移概率矩阵Ai,j的每个元素表示在先前笔划为Sj的条件下写入笔画Si的概率,即Ai,j=P(si|sj),i,j∈[1,8]。类似地,也可以通过所有字符的统计来获得该概率矩阵。对于排放概率矩阵,每个元素表示在隐藏状态为si的条件下获得某一观察(CSI段)Bk,i的概率, Bk,i=P(Ok|si),k∈[1,n],i∈[1,8]。假设获得该HMM的所有参数,对于上述观察序列O=o1o2…on,相应的笔画序列可以通过计算argmaxsP(S=s1s2…sn|o1o2…on,λ)来估计。
由于给定了某个信号段的8个笔画获得了投票概率,
Figure BDA0001409583670000164
在上一步中使用随机森林,本发明对HMM模型进行修改,并使用它来获得具有置信概率而不是最优S的所有可行笔画序列S′s∈CH。根据贝叶斯定理,估计概率P(ok|si)为
Figure BDA0001409583670000161
其中P(ok)和P(si)表示给定观察值和某一行程的先验概率。因此,给出观察序列O=o1o2…on,对于隐藏状态的某个可行序列产生这些观察的概率可以计算为
Figure BDA0001409583670000162
将上式中的P(Oi|si)代入式1,可以得到等式2的等式
Figure BDA0001409583670000163
为了计算给定观察值的每个笔画序列的置信度,本发明总结通过上述方程计算的每个S的能力概率,并用softmax函数对每个S的概率进行归一化为
Figure BDA0001409583670000171
虽然在上述推导中先验概率P(ok),k∈[1,n]是未知的,幸运的是,在等式4的规范化步骤中,所有这些未知概率都可以被去除。在获得所有可行笔画序列的归一化概率之后,即CSI片段序列的所有候选字符的置信度概率,可以通过选择具有最高归一化概率的那个来确定该字符。
例如,笔画手势输入的顺序为“/”和“V”,则识别出的笔画顺序为先“/”后“V”。
优选的,基于笔画的类别、速度、方向、笔画拐点和/或顺序构建至少一个与单个字母、单个偏旁部首、单个数字、单个图形对应的笔画序列。
每一个字母、偏旁部首或图形,由至少一个笔画构成。因此,基于笔画的类别和顺序初步判断笔画之间的连接关系,从而形成与单个字母、单个偏旁部首、单个数字、单个图形对应的笔画序列。
S31:基于自然语言中笔画的出现频率、方向、速度、笔画拐点或笔画之间的衔接规律构建笔画转移模型。
根据笔画序列、出现频率、方向、速度、笔画拐点或笔画之间的衔接规律建立能够将笔画识别为单个字母、单个字、图形的笔画转移模型。优选的,笔画转移模型根据笔画的序列、方向、速度、笔画拐点综合评估笔画之间的衔接关系,并且基于笔画衔接规律确定笔画之间的衔接关系,从而将笔画序列构成完整的字母、单字或图形。优选的,笔画转移模型基于笔画的速度、方向、笔画拐点确定笔画的轨迹,并且基于笔画的轨迹确定笔画衔接关系。有些字母的笔画是相近的。例如,“D”和“b”的笔画构成相近,均由竖直笔画和半圆笔画构成,区别在于半圆的大小。因此,笔画转移模型基于半圆形笔画的轨迹的起始点位置与竖直笔画轨迹的相对位置关系确定对应的字母为“D”或“b”。
S32:基于自然语言规律和/或科学语言规律构建勘误模型以校正至少一个字母序列、单字序列、数字序列和/或图形序列。
优选的,构建勘误模型。勘误模型对字母序列、单字序列、数字序列和 /或图形序列五分为单词、词或公式图形,并且进行校正。
笔画转移模型输出的字母序列、单字序列、数字序列和/或图形序列有可能存在识别错误。例如,将字母识别为笔画相近的其它笔画。
勘误模型基于自然语言规律和/或科学语言规律对字母序列、单字序列、数字序列和/或图形序列进行组合,将字母序列组合为单词、单字序列组合为字,将数字与图形组合为公式。
优选的,勘误模型基于自然语言规律和/或科学语言规律对字母、单字、数字、图形进行校正。优选的,勘误模型基于自然语言规律、科学语言规律以及逻辑规律对字母、单字、数字、图形进行校正。
例如,在笔画小写字母“a”和小写字母“d”通过非常相似的运动来写入时,笔画转移模型可能仅仅基于速度和方向进行区分。然而,语言模型可以提供字符序列“和”具有比字符序列“dnd”更高的概率的信息,因为“和”是经常出现的英文单词,而“dnd”在英语中没有意义。勘误模型可用于更正相应字符的识别。
基于自然语言规律的勘误模型可以提供关于字序列的信息。例如,“be my guest”这个词的顺序比“be my quest”序列的概率更高。两个序列只有字母“g”和“q”不同,这很难区分。单词序列的出现频率可以正确地影响正确字符和单词的识别。
在勘误模型构建成功后,使用笔画手势波形样本、笔画手势移动信息样本对笔画转移模型、勘误模型进行训练,提高笔画手势的识别效率。
根据一个优选实施方式,本发明的方法还包括以下步骤:建立信道状态信息的变化模式与笔画之间的映射关系。基于所述信道状态信息的变化模式确定对应的初始笔画。基于所述初始笔画的起始点、终结点、速度、方向和 /或笔画拐点判断相邻的初始笔画之间的连接关系,从而根据所述连接关系确定真实笔画以及所述真实笔画的笔画类别。此步骤的优势在于,进一步保证了笔画识别的正确性,降低错误率。
优选的,本发明的方法还包括以下步骤:基于所述笔画手势的起始点、终结点、笔画时间、速度、方向和/或笔画拐点确定所述笔画的多维度的笔画轨迹。
优选的,本发明基于笔画手势的起始点、终止点、速度、方向和笔画拐点将笔画进行编码,从而识别笔画。图5至图8示出了组成笔画的序列的基本轨迹部分的示例。“S”表示直线型,“C”表示圆线型。圆线型是指中心角为90度的圆弧。代码以“c”,“u”表示向上,“d”表示向下,“r”表示右,“I”表示左。因此,本发明可以区分不同粒度的笔画轨迹。
如图5所示,s:c-l表示从中心开始并在左边结束的直线。s:c-dr代表从中心开始直到右下的直线。如图6所示,c:l-u表示从左边开始的向上的圆形线(趋势向右)。c:r-d代表从右到右的圆形线(趋势向左)。如图7 所示,c:dl-ul表示从左下方开始并向左上方的圆线。c:dl-dr代表从左下和右下方开始的圆线。如图8所示,字母B的移动的部分顺序描述为s:c-d, s:c-u,c:u-r,c:r-d,c:u-r,c:r-d。
优选的,本发明基于笔画手势的加速度、方向和笔画拐点将笔画进行编码,从而识别笔画。
以字母“A”为例。与字母“A”笔画相关的部分的序列描述为:s:c-ur, s:cdr,s:c-ul,s:c-r。通过天线矩阵对笔画手势的速度变化的计算,得到笔画手势的加速度。基于加速度数据进行识别能够提高手写识别的精度。例如,当用户在空中写字母“A”时,加速度可以准确测量笔画手势的速度变化以及方向变化,从而确定笔画手势在三维空间的笔画轨迹。
优选的,采用归一化的方法对笔画轨迹进行数据处理,使得不标准的笔画轨迹归一化为标准的笔画轨迹,从而便于笔画识别。
优选的,基于所述笔画轨迹与所述初始笔画的匹配程度确定真实笔画及其笔画类别。此步骤的优势在于,若笔画轨迹与初始笔画的匹配程度高,则简化了进一步依据笔画的速、方向等特征识别的步骤,提高了笔画识别和分类的效率,而且不会降低笔画识别的正确率。
优选的,本发明的方法还包括以下步骤:在所述笔画轨迹与所述初始笔画的匹配程度不小于预设阈值的情况下,确定所述初始笔画为真实笔画;在所述笔画轨迹与所述初始笔画的匹配程度小于预设阈值的情况下,采用机器学习方法基于所述笔画手势的起始点、终结点、速度、方向和/或笔画拐点进行笔画分析,确定真实笔画并将笔画分类。此步骤的优势在于,分情况采取对笔画识别的判断方法,即有利于提高笔画识别的正确率,又有利于节省笔画识别的时间。
S4:利用笔画手势样本进行字母识别、勘误识别的整体训练,使得本发明能够迅速识别笔画手势的文字信息。
优选的,勘误模型也通过机器学习法进行训练,从而快速对文字、数字或图形进行校正。
实施例2
本实施例是对实施例1的进一步改进,与实施例1重复的内容不再赘述。
本实施例以单词“HI”为例对笔画手势的识别进行说明。
单词“HI”,其字母“H”对应的笔画为“|,—,|,”,字母“I”对应的笔画为“|”。对于每个笔画,其书写时间为1秒,同一字母内连续两个笔画之间的间隔为2秒,连续两个字母之间的间隔为5秒,用户在笔画间隔期间保持手势静止。
无线网卡在接收到书写单词“HI”的所有信道状态信息后,对其进行降噪与切片处理,并利用离散小波变换提取每个笔画对应的信道状态信息的特征,从而构成对应于每一笔画的信道状态信息的变化模式。对于单词“HI”,采集到对应于“H”字母的3个模式和对应于“I”字母的1个模式。将所有模式按顺序输入在笔画转移模型中进行分类,从而得到每个模式对应于每种笔画的可能概率。
本发明对英文字母中各种笔画出现的频率及笔画间的衔接规律进行统计,通过建立基于隐马尔可夫模型(hidden Markov model,HMM)的笔画转移模型实现从笔画到字母之间的转换,得到书写该字母的一系列笔画对应的可能性最高的前两个字母作为可能被判断正确的字母。例如,字母“H”可能被判断成字母“H”和“G”,字母“I”可能被判断成字母“I”和“C”。将字母之间进行组合从而得到可能的字母序列,例如可能的字母组合为“HI”,“GI”,“HC”,“GC”。将字母组合与字典中的单词进行匹配,从而判断并识别出用户实际书写的单词为“HI”。
实施例3
本实施例是对实施例1和实施例2的进一步改进,与实施例1重复的内容不再赘述。
本实施例提供一种基于CSI的细粒度手势识别系统,其特征在于,所述系统至少包括:信号采集模块10、特征值提取模块30、笔画分类模块40 和字母识别模块50。所述信号采集模块10采集信道状态信息CSI。所述特征值提取模块30提取信道状态信息的特征值。所述笔画分类模块40基于信道状态信息的特征值判断至少一个笔画手势的多个维度的起始点、终结点、速度、方向和/或笔画拐点,并且所述笔画分类模块40采用机器学习方法基于所述笔画手势的起始点、终结点、速度、方向和/或笔画拐点将笔画分类并形成笔画序列。所述字母识别模块50设置有基于自然语言规律和/ 或科学语言规律中笔画的出现频率和/或所述笔画之间的衔接规律构建的笔画转移模型。所述字母识别模块50基于信道状态信息的特征值判断至少一个笔画手势的多个维度的起始点、终结点、速度、方向和/或笔画拐点,并且利用所述笔画转移模型将所述笔画序列划分并识别为符合自然语言规律和/或科学语言规律的字母序列、偏旁部首序列、数字序列和/或图形序列。
优选的,所述系统还包括勘误模块60。所述勘误模块60设置有基于自然语言规律和/或科学语言规律的逻辑顺序构建的勘误模型。所述勘误模块 60基于所述逻辑顺序检测并更正所述字母序列、偏旁部首序列、数字序列和/或图形序列,并且将所述字母序列、偏旁部首序列、数字序列和/或图形序列识别为有序排列的单词、字、数字编码和/或图形。
优选的,本发明的基于CSI的细粒度手势识别系统还包括信号处理模块 20。
如图2所示,信号采集模块10与信号处理模块20连接。信号处理模块20与特征值提取模块30连接。特征值提取模块30与笔画分类模块40 连接。笔画分类模块40与字母识别模块50连接。字母识别模块50与勘误模块60连接。勘误模块60将识别的单词、字、数字或图形输出。
优选的,信号处理模块20对信号采集模块10采集的信道状态信息进行降噪和切片处理。信号处理模块20将经过降噪和切片处理后生成的第二信道状态信息发送至特征值提取模块30。特征值提取模块30对第二信道状态信息进行多维度测量和信号校正,然后进行特征值提取。优选的,特征值提取模块30提取笔画手势的波形的特征值。优选的,特征值包括笔画手势波形的均值、标准差、平均绝对偏差和/或最大值。优选的,特征值还包括至少两个接收端接收无线信号的入射角度。
笔画分类模块40设置有笔画转移模型。笔画分类模块40基于特征值提取模块30发送的信息识别笔画手势的类别、速度、方向以及笔画拐点。优选的,笔画分类模块40基于识别的笔画手势的速度、方向以及笔画拐点确定笔画类别以及笔画序列。
字母识别模块50基于笔画序列、笔画的衔接规律和笔画的出现频率将笔画分类模块40识别的笔画组合并识别为字母序列、单字序列、数字序列和/或图形序列。
勘误模块60设置有勘误模型。勘误模块60将字母识别模块50发送的字母序列、单字序列、数字序列和/或图形序列进行校正,并且基于自然语言规律和/或科学语言规律将字母序列识别为至少一个单词,将单字序列识别为至少一个词汇,将数字序列识别为至少一个数字,并且将图形序列识别为至少一个图形。优选的,勘误模型60基于数字和图形的混合序列识别为数学公式或化学公式。
本发明的基于CSI的细粒度手势识别系统通过采集笔画手势信息,从而识别笔画,再基于笔画序列识别文字信息。本发明的优势在于,能够丰富识别的语种和图形,输出多样化的语言文字或数字图形。本发明通过对笔画手势的速度、方向、笔画拐点的文字判断,识别率增高,降低了失误率。本发明的识别率能够达到98%以上。
例如,笔画转移模块将用户输入的笔画手势识别为字母、数字和化学式形序列。例如:CH3、—、和
Figure BDA0001409583670000221
勘误模型基于化学语言规律将字母、数字和化学图形序列根据化学符号出现频率和衔接规律构建为:
Figure BDA0001409583670000222
优选的,用户预设输入的语言种类。笔画转移模型基于选定语言的语言规律、笔画衔接规律及语言逻辑构建为对应的字母、偏旁部首、数字或图形。勘误模型基于选定语言的语言逻辑和规律将笔画转移模型输出的信息更正为符合语言逻辑的单词、词汇、数字编码、图形或公式。
本发明的基于CSI的细粒度手势识别系统可以全部由硬件构成。信号采集模块10包括天线和型号为因特尔iwl 5300的网卡。信号处理模块20包括数字信号处理器、信号处理集成芯片、DSP芯片中的一种或几种。特征值提取模块30为分析信道状态信息的特征值的专用集成芯片。笔画分类模块 40为将笔画构建为笔画序列的专用集成芯片。字母识别模块50为将笔画序列构建为语言文字的专用集成芯片。勘误模块60为勘误文字错误的专用集成芯片。
根据一个优选实施方式,特征值提取模块30包括专用集成芯片和微处理器。笔画分类模块40包括专用集成芯片和微处理器。字母识别模块50 包括专用集成芯片和微处理器。勘误模块60包括专用集成芯片和微处理器。
需要注意的是,上述具体实施例是示例性的,本领域技术人员可以在本发明公开内容的启发下想出各种解决方案,而这些解决方案也都属于本发明的公开范围并落入本发明的保护范围之内。本领域技术人员应该明白,本发明说明书及其附图均为说明性而并非构成对权利要求的限制。本发明的保护范围由权利要求及其等同物限定。

Claims (9)

1.一种基于CSI的细粒度手势识别方法,其特征在于,所述方法包括以下步骤:
基于信道状态信息的特征值判断至少一个笔画手势的多个维度的起始点、终结点、速度、方向和/或笔画拐点;
基于所述笔画手势的起始点、终结点、速度、方向和/或笔画拐点将笔画分类并形成笔画序列;
基于自然语言规律和/或科学语言规律中笔画的出现频率和/或所述笔画之间的衔接规律构建笔画转移模型;和
利用所述笔画转移模型将所述笔画序列划分并识别为符合自然语言规律和/或科学语言规律的字母序列、偏旁部首序列、数字序列和/或图形序列,
其中,所述笔画手势的方向的判断步骤包括:
以线性变换方法消除相位偏移;
基于信号到达时间选择不具有多径影响的信号;
构建CSI数据矩阵并确定信号入射角度;和
基于所述信号入射角度、信号路径以及笔画手势位移确定所述笔画手势的速度方向;
其中,以线性变换方法消除相位偏移的方法为:
第i个子载波的测量相位
Figure FDA0002281344390000011
为:
Figure FDA0002281344390000012
Figure FDA0002281344390000013
为真实相位,δ为信号接收端相对于信号发射端的时钟偏移,其对应产生的相位偏移是
Figure FDA0002281344390000014
β是位置常熟相位偏移,Z是测量噪声,Ki是第i个子载波编号,N为FFT的大小;
定义
Figure FDA0002281344390000015
在子载波的频率对称的情况下,即
Figure FDA0002281344390000016
则b简化为
Figure FDA0002281344390000017
从测量相位
Figure FDA0002281344390000018
中减去线性项aki+b,消除由δ和β引起的相位偏移,得到不含有噪声Z的真实相位的线性组合,即
Figure FDA0002281344390000021
2.如权利要求1所述的基于CSI的细粒度手势识别方法,其特征在于,所述方法还包括以下步骤:
基于自然语言规律和/或科学语言规律的逻辑顺序构建勘误模型,
所述勘误模型基于所述逻辑顺序检测并更正所述字母序列、偏旁部首序列、数字序列和/或图形序列,并且将所述字母序列、偏旁部首序列、数字序列和/或图形序列识别为有序排列的单词、字、数字编码和/或图形。
3.如权利要求2所述的基于CSI的细粒度手势识别方法,其特征在于,所述方法还包括以下步骤:
建立信道状态信息的变化模式与笔画之间的映射关系,
基于所述信道状态信息的变化模式确定对应的初始笔画,
基于所述初始笔画的起始点、终结点、速度、方向和/或笔画拐点判断相邻的初始笔画之间的连接关系,从而根据所述连接关系确定真实笔画以及所述真实笔画的笔画类别。
4.如权利要求3所述的基于CSI的细粒度手势识别方法,其特征在于,所述方法包括以下步骤:
基于所述笔画手势的起始点、终结点、笔画时间、速度、方向和/或笔画拐点确定所述笔画的多维度的笔画轨迹,
基于所述笔画轨迹与所述初始笔画的匹配程度确定真实笔画及其笔画类别。
5.如权利要求4所述的基于CSI的细粒度手势识别方法,其特征在于,
在所述笔画轨迹与所述初始笔画的匹配程度不小于预设阈值的情况下,确定所述初始笔画为真实笔画;
在所述笔画轨迹与所述初始笔画的匹配程度小于预设阈值的情况下,采用机器学习方法基于所述笔画手势的起始点、终结点、速度、方向和/或笔画拐点进行笔画分析,确定真实笔画并将笔画分类。
6.如前述权利要求之一所述的基于CSI的细粒度手势识别方法,其特征在于,所述信道状态信息的特征值的提取步骤包括:
采集至少一个子载波的第一信道状态信息,
以降噪和/或切片的方式将所述第一信道状态信息处理为第二信道状态信息;
对所述第二信道状态信息进行多维度测量;
校正所述第二信道状态信息;和
提取所述第二信道状态信息变化的特征值。
7.如权利要求6所述的基于CSI的细粒度手势识别方法,其特征在于,所述第二信道状态信息变化的特征值的提取步骤包括:
将至少一个所述第二信道状态信息进行逆傅立叶变换,
利用离散小波变换方法提取至少一个笔画手势的特征值。
8.一种基于CSI的细粒度手势识别系统,其特征在于,所述系统至少包括:信号采集模块(10)、特征值提取模块(30)、笔画分类模块(40)和字母识别模块(50),
所述信号采集模块(10)采集信道状态信息(CSI),
所述特征值提取模块(30)提取信道状态信息的特征值;
所述笔画分类模块(40)基于信道状态信息的特征值判断至少一个笔画手势的多个维度的起始点、终结点、速度、方向和/或笔画拐点,并且
所述笔画分类模块(40)采用机器学习方法基于所述笔画手势的起始点、终结点、速度、方向和/或笔画拐点将笔画分类并形成笔画序列;
所述字母识别模块(50)设置有基于自然语言规律和/或科学语言规律中笔画的出现频率和/或所述笔画之间的衔接规律构建的笔画转移模型;
所述字母识别模块(50)基于信道状态信息的特征值判断至少一个笔画手势的多个维度的起始点、终结点、速度、方向和/或笔画拐点,并且利用所述笔画转移模型将所述笔画序列划分并识别为符合自然语言规律和/或科学语言规律的字母序列、偏旁部首序列、数字序列和/或图形序列,
其中,所述笔画手势的方向的判断步骤包括:
以线性变换方法消除相位偏移;
基于信号到达时间选择不具有多径影响的信号;
构建CSI数据矩阵并确定信号入射角度;和
基于所述信号入射角度、信号路径以及笔画手势位移确定所述笔画手势的速度方向;
其中,以线性变换方法消除相位偏移的方法为:
第i个子载波的测量相位
Figure FDA0002281344390000041
为:
Figure FDA0002281344390000042
Figure FDA0002281344390000043
为真实相位,δ为信号接收端相对于信号发射端的时钟偏移,其对应产生的相位偏移是
Figure FDA0002281344390000044
β是位置常熟相位偏移,Z是测量噪声,Ki是第i个子载波编号,N为FFT的大小;
定义
Figure FDA0002281344390000045
在子载波的频率对称的情况下,即
Figure FDA0002281344390000046
则b简化为
Figure FDA0002281344390000047
从测量相位
Figure FDA0002281344390000048
中减去线性项aki+b,消除由δ和β引起的相位偏移,得到不含有噪声Z的真实相位的线性组合,即
Figure FDA0002281344390000049
9.如权利要求8所述的基于CSI的细粒度手势识别系统,其特征在于,所述系统还包括勘误模块(60),
所述勘误模块(60)设置有基于自然语言规律和/或科学语言规律的逻辑顺序构建的勘误模型,
所述勘误模块(60)基于所述逻辑顺序检测并更正所述字母序列、偏旁部首序列、数字序列和/或图形序列,并且将所述字母序列、偏旁部首序列、数字序列和/或图形序列识别为有序排列的单词、字、数字编码和/或图形。
CN201710846518.0A 2017-09-15 2017-09-15 一种基于csi的细粒度手势识别方法和系统 Active CN107633227B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710846518.0A CN107633227B (zh) 2017-09-15 2017-09-15 一种基于csi的细粒度手势识别方法和系统
US16/105,005 US10592736B2 (en) 2017-09-15 2018-08-20 Method and system for CSI-based fine-grained gesture recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710846518.0A CN107633227B (zh) 2017-09-15 2017-09-15 一种基于csi的细粒度手势识别方法和系统

Publications (2)

Publication Number Publication Date
CN107633227A CN107633227A (zh) 2018-01-26
CN107633227B true CN107633227B (zh) 2020-04-28

Family

ID=61102300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710846518.0A Active CN107633227B (zh) 2017-09-15 2017-09-15 一种基于csi的细粒度手势识别方法和系统

Country Status (2)

Country Link
US (1) US10592736B2 (zh)
CN (1) CN107633227B (zh)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015141260A1 (ja) * 2014-03-17 2015-09-24 株式会社河合楽器製作所 手書き音楽記号認識装置およびプログラム
KR101584045B1 (ko) * 2015-09-02 2016-01-11 주식회사 시큐브 세그먼트 기반 수기서명 인증 시스템 및 방법
CN108805194B (zh) * 2018-06-04 2021-12-31 上海交通大学 一种基于wifi信道状态信息的手写识别方法及系统
CN109522785A (zh) * 2018-09-26 2019-03-26 西安电子科技大学工程技术研究院有限公司 一种基于大数据和无线信号模型的手势识别方法和装置
DE102018128962A1 (de) * 2018-11-19 2020-05-20 Rheinmetall Waffe Munition Gmbh Verfahren zur Bestimmung der Position eines Objektes, Vorrichtung zur Bestimmung der Position eines Objektes und System
CN109784212A (zh) * 2018-12-27 2019-05-21 东莞理工学院 一种基于WiFi信号的生物打字识别方法
CN110059612B (zh) * 2019-04-15 2022-11-18 哈尔滨工程大学 一种基于信道状态信息的位置无关的手势识别方法及系统
CN110110674B (zh) * 2019-05-13 2022-12-13 湘潭大学 一种基于加速度微机电系统和基础笔画的手势识别方法
CN110353693A (zh) * 2019-07-09 2019-10-22 中国石油大学(华东) 一种基于WiFi的手写字母识别方法及系统
CN110412566A (zh) * 2019-07-22 2019-11-05 西北工业大学 一种基于多普勒雷达时频域特征的细粒度人体手臂运动识别方法
CN110737201B (zh) * 2019-10-11 2020-10-09 珠海格力电器股份有限公司 一种监护方法、装置、存储介质及空调
CN111104886A (zh) * 2019-12-10 2020-05-05 北京集创北方科技股份有限公司 手势识别方法、装置、设备和存储介质
CN111159337A (zh) * 2019-12-20 2020-05-15 中国建设银行股份有限公司 化学表达式提取方法、装置及设备
CN113495619B (zh) * 2020-04-03 2023-11-10 北京金坤科创技术有限公司 一种基于Wi-Fi信道状态信息相位的手势识别方法
CN111626174B (zh) * 2020-05-22 2023-03-24 哈尔滨工程大学 一种基于信道状态信息的姿态鲁棒动作识别方法
CN111865378B (zh) * 2020-05-28 2021-06-11 东南大学 基于深度学习的大规模mimo下行预编码方法
CN112036433B (zh) * 2020-07-10 2022-11-04 天津城建大学 一种基于CNN的Wi-Move行为感知方法
CN112214156B (zh) 2020-10-21 2022-07-15 安徽鸿程光电有限公司 一种触控屏放大镜调用方法、装置、电子设备及存储介质
CN112733609B (zh) * 2020-12-14 2023-08-18 中山大学 一种基于离散小波变换的领域自适应Wi-Fi手势识别方法
CN112765550B (zh) * 2021-01-20 2024-05-07 济南杰睿信息科技有限公司 一种基于Wi-Fi信道状态信息的目标行为分割方法
CN112905011B (zh) * 2021-02-09 2022-08-30 北京邮电大学 手势追踪方法、装置、电子设备和介质
CN112926567B (zh) * 2021-03-01 2022-05-27 中国科学院软件研究所 一种基于用户反馈信息的在线手写公式识别方法及装置
CN113609977B (zh) * 2021-08-04 2023-10-17 燕山大学 基于信道状态信息商距离的行人步态识别方法
CN113902066A (zh) * 2021-08-26 2022-01-07 西北大学 一种语句级手语识别方法、系统、设备及终端
CN113963229B (zh) * 2021-09-23 2023-08-18 西北大学 一种基于视频的无线信号增强与跨目标手势识别方法
CN114241491B (zh) * 2021-11-22 2024-07-12 南京邮电大学 一种基于轻量级深度学习网络的手写字母识别方法
CN114499712B (zh) * 2021-12-22 2024-01-05 天翼云科技有限公司 一种手势识别方法、设备及存储介质
CN114879849B (zh) * 2022-06-07 2024-07-09 吉林大学 一种多通道空中笔势识别方法
CN115412188A (zh) * 2022-08-26 2022-11-29 福州大学 一种基于无线感知的配电站房操作行为识别方法
CN116597521B (zh) * 2023-07-19 2023-09-19 山东科技大学 一种人类轨迹及躯干活动识别方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010011929A1 (en) * 2008-07-25 2010-01-28 Gesturetek, Inc. Enhanced detection of waving engagement gesture
CN103679213A (zh) * 2013-12-13 2014-03-26 电子科技大学 一种3d手势识别方法
CN103713730A (zh) * 2012-09-29 2014-04-09 炬才微电子(深圳)有限公司 应用于智能终端的空中手势识别方法及装置
CN104951757A (zh) * 2015-06-10 2015-09-30 南京大学 一种基于无线信号的动作检测和识别的方法
CN105844216A (zh) * 2016-03-11 2016-08-10 南京航空航天大学 一种利用WiFi信号识别手写字母的检测与匹配机制
CN106618497A (zh) * 2016-12-13 2017-05-10 北京理工大学 复杂环境下基于信道状态信息监测睡眠的方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6801659B1 (en) * 1999-01-04 2004-10-05 Zi Technology Corporation Ltd. Text input system for ideographic and nonideographic languages
US7760969B2 (en) * 1999-05-25 2010-07-20 Silverbrook Research Pty Ltd Method of providing information via context searching from a printed substrate
US7971784B2 (en) * 1999-05-25 2011-07-05 Silverbrook Research Pty Ltd Sensing device with mode changes via nib switch
AUPR687701A0 (en) * 2001-08-08 2001-08-30 Litster, Gregory John Method of and apparatus for selecting symbols in ideographic languages
KR101584045B1 (ko) * 2015-09-02 2016-01-11 주식회사 시큐브 세그먼트 기반 수기서명 인증 시스템 및 방법
CN105807935B (zh) 2016-04-01 2019-01-11 中国科学技术大学苏州研究院 一种基于WiFi的手势控制人机交互系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010011929A1 (en) * 2008-07-25 2010-01-28 Gesturetek, Inc. Enhanced detection of waving engagement gesture
CN103713730A (zh) * 2012-09-29 2014-04-09 炬才微电子(深圳)有限公司 应用于智能终端的空中手势识别方法及装置
CN103679213A (zh) * 2013-12-13 2014-03-26 电子科技大学 一种3d手势识别方法
CN104951757A (zh) * 2015-06-10 2015-09-30 南京大学 一种基于无线信号的动作检测和识别的方法
CN105844216A (zh) * 2016-03-11 2016-08-10 南京航空航天大学 一种利用WiFi信号识别手写字母的检测与匹配机制
CN106618497A (zh) * 2016-12-13 2017-05-10 北京理工大学 复杂环境下基于信道状态信息监测睡眠的方法

Also Published As

Publication number Publication date
US10592736B2 (en) 2020-03-17
CN107633227A (zh) 2018-01-26
US20190087654A1 (en) 2019-03-21

Similar Documents

Publication Publication Date Title
CN107633227B (zh) 一种基于csi的细粒度手势识别方法和系统
CN105844216B (zh) 一种利用WiFi信号识别手写字母的检测与匹配机制
US9460398B2 (en) Apparatus and method for recognizing user activity
US7298903B2 (en) Method and system for separating text and drawings in digital ink
CN105512692B (zh) 基于blstm的联机手写数学公式符号识别方法
CN105893968B (zh) 基于深度学习的文本无关的端到端的笔迹识别方法
CN104205126A (zh) 对手写字符的无旋转识别
CN110472675A (zh) 图像分类方法、图像分类装置、存储介质与电子设备
CN108805194A (zh) 一种基于wifi信道状态信息的手写识别方法及系统
CN102985897A (zh) 高效姿势处理
KR20120064922A (ko) 근전도 센서와 자이로 센서를 이용한 지화 인식 방법 및 장치
CN104517097A (zh) 一种基于kinect的运动人体姿态识别方法
Li et al. A deep convolutional network for multitype signal detection and classification in spectrogram
CN107909042B (zh) 一种连续手势切分识别方法
CN107798351B (zh) 一种基于深度学习神经网络的身份识别方法和系统
CN114781463A (zh) 一种跨场景鲁棒的室内摔倒无线检测方法及相关设备
Nogales et al. Real-time hand gesture recognition using the leap motion controller and machine learning
Gao et al. Wicgesture: Meta-motion based continuous gesture recognition with wi-fi
CN107103289B (zh) 利用笔迹轮廓特征来进行笔迹鉴别的方法及系统
CN109766951A (zh) 一种基于时频统计特性的WiFi手势识别
JP2013171441A (ja) 文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラム
Mandal et al. An improved discriminative region selection methodology for online handwriting recognition
Zhang et al. WiOpen: A Robust Wi-Fi-based Open-set Gesture Recognition Framework
Sen et al. An approach to stroke-based online handwritten Bangla character recognition
Zhao et al. Leveraging Topic Model for CSI Based Human Activity Recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant