CN106503639A - 基于描述符的视频特征提取方法及装置 - Google Patents
基于描述符的视频特征提取方法及装置 Download PDFInfo
- Publication number
- CN106503639A CN106503639A CN201610897432.6A CN201610897432A CN106503639A CN 106503639 A CN106503639 A CN 106503639A CN 201610897432 A CN201610897432 A CN 201610897432A CN 106503639 A CN106503639 A CN 106503639A
- Authority
- CN
- China
- Prior art keywords
- video
- descriptor
- degree
- fitting
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于视频处理的技术领域,尤其涉及一种基于描述符的视频特征提取方法及装置。该包括如下步骤:S1,视频特征预处理,用于加载视频内容,并以帧为单位分割视频,由内容分析器提取所述视频内容中的关键特征,建立与关键特征相对应的第一描述符;S2,视频特征检索,将第一描述符与预先存储的多个第二描述符进行匹配,并分析匹配的拟合度,得到与第一描述符拟合度最高的所述第二描述符,并建立第一描述符、第二描述符和拟合度之间的对应关系链表;S3,检索结果处理,将拟合度大于预先设定的拟合度阈值的链表项目进行存储,以供用户决策或检索。本发明的视频特征提取方法节约了存储空间,提高了视频内容特征提取的准确性和灵活性。
Description
技术领域
本发明属于视频处理的技术领域,尤其涉及一种基于描述符的视频特征提取方法及装置。
背景技术
随着计算机网络技术的发展广泛应用,视频技术也得到广泛应用,当人们在对视频检索过程中,通常会将视频的内容检索居于首位,而目前的视频内容检索通常都是基于视频内容开发商给预先出的关键词等特征,这已经完全不能满足视频用户对于视频内容的多样化、广泛性的需求,而目前后期的视频内容中的特征提取主要是人工提取,其效率低下,海量视频的内容特征提取成为不可能实现的任务。虽然已经出现了少量的视频特征提取算法,但其准确性及稳定性有不尽如人意。因此,有待提出一种新型的视频内容特征提取算法,来克服现有技术中的上述诸多问题。
发明内容
本发明的目的在于解决现有技术的问题,提出一种基于描述符的视频特征提取方法和装置。具体如下:
一种基于描述符的视频特征提取方法,包括如下步骤:
S1,视频特征预处理,用于加载视频内容,并以帧为单位分割视频,由内容分析器提取所述视频内容中的关键特征,建立与所述关键特征相对应的第一描述符;
S2,视频特征检索,将所述第一描述符与预先存储的多个第二描述符进行匹配,并分析匹配的拟合度,得到与所述第一描述符拟合度最高的所述第二描述符,并建立第一描述符、第二描述符和拟合度之间的对应关系链表;
S3,检索结果处理,将所述拟合度大于预先设定的拟合度阈值的链表项目进行存储,以供用户决策或检索。
优选的,所述步骤S1还包括:提取视频帧里的关键特征,所述关键特征根据特征类别分为人体特征和物体特征,所述人体特征和物体特征可以在人机交互界面供用户选择;所述关键特征具体为语义特征,并根据所述语义特征建立语义模型,并为每一个视频帧对应的语义特征建立描述符。
优选的,所述步骤S2还包括:所述第二描述符为预先构建的与人体特征和物体特征相关联的描述符,并由多个第二描述符共同构成特征数据库;所述特征数据库存储在远程服务器,以减少本地的数据存储负担。
优选的,所述步骤S2还包括:所述视频检索过程基于远程服务器,或者,基于用户本地客户端。
优选的,所述步骤S3还包括:所述拟合度阈值有多个,每个拟合度区间的链表项目作为一项进行存储,共同构成分级存储单元。
一种基于描述符的视频特征提取装置,包括如下模块:
视频特征预处理模块,用于加载视频内容,并以帧为单位分割视频,由内容分析器提取所述视频内容中的关键特征,建立与所述关键特征相对应的第一描述符;
视频特征检索模块,用于将所述第一描述符与预先存储的多个第二描述符进行匹配,并分析匹配的拟合度,得到与所述第一描述符拟合度最高的所述第二描述符,并建立第一描述符、第二描述符和拟合度之间的对应关系链表;
检索结果处理模块,用于将所述拟合度大于预先设定的拟合度阈值的链表项目进行存储,以供用户决策或检索。
优选的,所述视频特征预处理模块还包括:提取视频帧里的关键特征,所述关键特征根据特征类别分为人体特征和物体特征,所述人体特征和物体特征可以在人机交互界面供用户选择;所述关键特征具体为语义特征,并根据所述语义特征建立语义模型,并为每一个视频帧对应的语义特征建立描述符。
优选的,所述视频特征检索模块还包括:所述第二描述符为预先构建的与人体特征和物体特征相关联的描述符,并由多个第二描述符共同构成特征数据库;所述特征数据库存储在远程服务器,以减少本地的数据存储负担。
优选的,所述视频特征检索模块还包括:所述视频检索过程基于远程服务器,或者,基于用户本地客户端。
优选的,所述检索结果处理模块还包括:所述拟合度阈值有多个,每个拟合度区间的链表项目作为一项进行存储,共同构成分级存储单元。
本发明的视频特征提取方法及装置有如下优点:1.为每一帧视频建立描述符,最大可能的节约了存储空间。2.建立了分级的拟合度存储方法,综合考虑了你和算法和人工干预,从而提高了视频内容特征提取的准确性。3.视频内容的特征检索过程在远程服务器端可以节约用户本地运算负担,也可以设置在用户本地,具有很高的灵活性。
附图说明
图1为本发明实施例的方法流程图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
一种基于描述符的视频特征提取方法,包括如下步骤:
S1,视频特征预处理,用于加载视频内容,并以帧为单位分割视频,由内容分析器提取所述视频内容中的关键特征,建立与所述关键特征相对应的第一描述符。
其中在视频预处理中,以视频帧为最小单位,把视频分割成多个分析单元并获取其有代表性的语义特征,进而得到其语义信息,通过得到的语义信息建立语义模型,其中对视频事件的描述,主要包括了事件发生对象及事件发展过程两方面。本申请所述方法研究3个方面:事件动态信息的描述与特征提取,建立运动词典和解决事件间相互作用对事件的影响。对于事件动态信息的描述与特征提取,即采取噪声最少的静态信息的描述方法,分析物体运动轨迹,探索合适的特征和方法,来描述运动轨迹。通过定义不同轨迹间相似度的计算方法,在此基础上对轨迹进行聚类,实现对动态特征的编码,以有效地描述事件中物体运动信息。对于运动词典,是把动态与静态信息统一在单一特征中。而解决事件间的相互作用对事件的影响,是为了更好的描述事件以及消除摄像机运动的影响的问题。
S2,视频特征检索,将所述第一描述符与预先存储的多个第二描述符进行匹配,并分析匹配的拟合度,得到与所述第一描述符拟合度最高的所述第二描述符,并建立第一描述符、第二描述符和拟合度之间的对应关系链表。
在视频事件检索中,着重考虑事件的过程性属性和时间维度上的关联,研究特征的时序化处理和表示方法;同时对现有的SVM(支持向量机)分类器进行相应改进,并研究其他适用于序列特征的分类器,从特征提取和机器学习两方面提高事件检索的准确率。对事件描述,通过融合概念检测、语义知识网、概念对事件检测的贡献度等信息,提取与事件相关的各种概念和要素。
也可以采用如下方式,首先构建从捕获自周围环境的关键帧图像的集合提取的SURF特征的图。在提取第一视频帧的SURF特征并将它们与该图匹配之后,该算法在后续帧中局部地跟踪这些特征。与当前视频帧具有最大重叠区域的关键帧被称为关键节点。附近关键帧的重叠区域基于它们的帧间单应性在每帧中更新,并且因此,关键节点不断地切换到数据库中最相似的图像,允许不断地跟踪并发现视频序列中的新区域。
S3,检索结果处理,将所述拟合度大于预先设定的拟合度阈值的链表项目进行存储,以供用户决策或检索。
优选的,所述步骤S1还包括:提取视频帧里的关键特征,所述关键特征根据特征类别分为人体特征和物体特征,所述人体特征和物体特征可以在人机交互界面供用户选择;所述关键特征具体为语义特征,并根据所述语义特征建立语义模型,并为每一个视频帧对应的语义特征建立描述符。
也可以采用另一种提取方法,首先对第一帧的运动向量的角度做直方图。帧的直方图表示总的运动趋势,可认为与直方图中的少的角度对应的运动产生为添加到实际运动中的包括随机误差的运动。因此,可从表示帧的总的运动趋势中排除与直方图中的少的角度对应的运动。因此,可按做成直方图的角度的幅度的顺序选择预定数量的运动向量,选择的运动向量可被定义为第一帧的第一帧特征。对于包括在第一场景中的每个第一帧,从每个第一帧中提取被选为第 一帧特征的预定数量的数据,对所有第一帧的数据进行分组,从而限定第一场景的选择因素,也就是第一场景特征。
优选的,所述步骤S2还包括:所述第二描述符为预先构建的与人体特征和物体特征相关联的描述符,并由多个第二描述符共同构成特征数据库;所述特征数据库存储在远程服务器,以减少本地的数据存储负担。
优选的,所述步骤S2还包括:所述视频检索过程基于远程服务器,或者,基于用户本地客户端。
优选的,所述步骤S3还包括:所述拟合度阈值有多个,每个拟合度区间的链表项目作为一项进行存储,共同构成分级存储单元。分级存储单元将接收到的视频内容数据存储到后端存储数据中心,并将视频内容数据的存储节点信息存储到本地数据库中;再通过P2P架构并采用DHT技术和分级存储技术的存储模块形成存储不同特征的数据库群,将数据按信息内容分级存储,使存储更便于管理和归档,降低存储成本;并保存既有的版本式滚动存储,又有远程存储备份;同时,存储的数据具有很高的可靠性、可扩展性和可用性;与此同时,分级存储后端模块3还提供一定缓存,缓存必要信息,作为以后用户访问的接口。
一种基于描述符的视频特征提取装置,包括如下模块:
视频特征预处理模块,用于加载视频内容,并以帧为单位分割视频,由内容分析器提取所述视频内容中的关键特征,建立与所述关键特征相对应的第一描述符。
其中在视频预处理中,以视频帧为最小单位,把视频分割成多个分析单元并获取其有代表性的语义特征,进而得到其语义信息,通过得到的语义信息建立语义模型,其中对视频事件的描述,主要包括了事件发生对象及事件发展过程两方面。本申请所述方法研究3个方面:事件动态信息的描述与特征提取,建立运动词典和解决事件间相互作用对事件的影响。对于事件动态信息的描述与特征提取,即采取噪声最少的静态信息的描述方法,分析物体运动轨迹,探索合适的特征和方法,来描述运动轨迹。通过定义不同轨迹间相似度的计算方法,在此基础上对轨迹进行聚类,实现对动态特征的编码,以有效地描述事件中物体运动信息。对于运动词典,是把动态与静态信息统一在单一特征中。而解决事件间的相互作用对事件的影响,是为了更好的描述事件以及消除摄像机运动的影响的问题。
视频特征检索模块,用于将所述第一描述符与预先存储的多个第二描述符进行匹配,并分析匹配的拟合度,得到与所述第一描述符拟合度最高的所述第二描述符,并建立第一描述符、第二描述符和拟合度之间的对应关系链表。
在视频事件检索中,着重考虑事件的过程性属性和时间维度上的关联,研究特征的时序化处理和表示方法;同时对现有的SVM(支持向量机)分类器进行相应改进,并研究其他适用于序列特征的分类器,从特征提取和机器学习两方面提高事件检索的准确率。对事件描述,通过融合概念检测、语义知识网、概念对事件检测的贡献度等信息,提取与事件相关的各种概念和要素。
也可以采用如下方式,首先构建从捕获自周围环境的关键帧图像的集合提取的SURF特征的图。在提取第一视频帧的SURF特征并将它们与该图匹配之后,该算法在后续帧中局部地跟踪这些特征。与当前视频帧具有最大重叠区域的关键帧被称为关键节点。附近关键帧的重叠区域基于它们的帧间单应性在每帧中更新,并且因此,关键节点不断地切换到数据库中最相似的图像,允许不断地跟踪并发现视频序列中的新区域。
检索结果处理模块,用于将所述拟合度大于预先设定的拟合度阈值的链表项目进行存储,以供用户决策或检索。
优选的,所述视频特征预处理模块还包括:提取视频帧里的关键特征,所述关键特征根据特征类别分为人体特征和物体特征,所述人体特征和物体特征可以在人机交互界面供用户选择;所述关键特征具体为语义特征,并根据所述语义特征建立语义模型,并为每一个视频帧对应的语义特征建立描述符。
也可以采用另一种提取方法,首先对第一帧的运动向量的角度做直方图。帧的直方图表示总的运动趋势,可认为与直方图中的少的角度对应的运动产生为添加到实际运动中的包括随机误差的运动。因此,可从表示帧的总的运动趋势中排除与直方图中的少的角度对应的运动。因此,可按做成直方图的角度的幅度的顺序选择预定数量的运动向量,选择的运动向量可被定义为第一帧的第一帧特征。对于包括在第一场景中的每个第一帧,从每个第一帧中提取被选为第 一帧特征的预定数量的数据,对所有第一帧的数据进行分组,从而限定第一场景的选择因素,也就是第一场景特征。
优选的,所述视频特征检索模块还包括:所述第二描述符为预先构建的与人体特征和物体特征相关联的描述符,并由多个第二描述符共同构成特征数据库;所述特征数据库存储在远程服务器,以减少本地的数据存储负担。
优选的,所述视频特征检索模块还包括:所述视频检索过程基于远程服务器,或者,基于用户本地客户端。
优选的,所述检索结果处理模块还包括:所述拟合度阈值有多个,每个拟合度区间的链表项目作为一项进行存储,共同构成分级存储单元。分级存储单元将接收到的视频内容数据存储到后端存储数据中心,并将视频内容数据的存储节点信息存储到本地数据库中;再通过P2P架构并采用DHT技术和分级存储技术的存储模块形成存储不同特征的数据库群,将数据按信息内容分级存储,使存储更便于管理和归档,降低存储成本;并保存既有的版本式滚动存储,又有远程存储备份;同时,存储的数据具有很高的可靠性、可扩展性和可用性;与此同时,分级存储后端模块3还提供一定缓存,缓存必要信息,作为以后用户访问的接口。
本发明的视频特征提取方法及装置有如下优点:1.为每一帧视频建立描述符,最大可能的节约了存储空间。2.建立了分级的拟合度存储方法,综合考虑了你和算法和人工干预,从而提高了视频内容特征提取的准确性。3.视频内容的特征检索过程在远程服务器端可以节约用户本地运算负担,也可以设置在用户本地,具有很高的灵活性。
上述说明示出并描述了发明的优选实施例,如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (10)
1.一种基于描述符的视频特征提取方法,其特征在于,包括如下步骤:
S1,视频特征预处理,用于加载视频内容,并以帧为单位分割视频,由内容分析器提取所述视频内容中的关键特征,建立与所述关键特征相对应的第一描述符;
S2,视频特征检索,将所述第一描述符与预先存储的多个第二描述符进行匹配,并分析匹配的拟合度,得到与所述第一描述符拟合度最高的所述第二描述符,并建立第一描述符、第二描述符和拟合度之间的对应关系链表;
S3,检索结果处理,将所述拟合度大于预先设定的拟合度阈值的链表项目进行存储,以供用户决策或检索。
2.根据权利要求1所述的视频特征提取方法,其特征在于,所述步骤S1还包括:提取视频帧里的关键特征,所述关键特征根据特征类别分为人体特征和物体特征,所述人体特征和物体特征可以在人机交互界面供用户选择;所述关键特征具体为语义特征,并根据所述语义特征建立语义模型,并为每一个视频帧对应的语义特征建立描述符。
3.根据权利要求1所述的视频特征提取方法,其特征在于,所述步骤S2还包括:所述第二描述符为预先构建的与人体特征和物体特征相关联的描述符,并由多个第二描述符共同构成特征数据库;所述特征数据库存储在远程服务器,以减少本地的数据存储负担。
4.根据权利要求1所述的视频特征提取方法,其特征在于,所述步骤S2还包括:所述视频检索过程基于远程服务器,或者,基于用户本地客户端。
5.根据权利要求1所述的视频特征提取方法,其特征在于,所述步骤S3还包括:所述拟合度阈值有多个,每个拟合度区间的链表项目作为一项进行存储,共同构成分级存储单元。
6.一种基于描述符的视频特征提取装置,其特征在于,包括如下模块:
视频特征预处理模块,用于加载视频内容,并以帧为单位分割视频,由内容分析器提取所述视频内容中的关键特征,建立与所述关键特征相对应的第一描述符;
视频特征检索模块,用于将所述第一描述符与预先存储的多个第二描述符进行匹配,并分析匹配的拟合度,得到与所述第一描述符拟合度最高的所述第二描述符,并建立第一描述符、第二描述符和拟合度之间的对应关系链表;
检索结果处理模块,用于将所述拟合度大于预先设定的拟合度阈值的链表项目进行存储,以供用户决策或检索。
7.根据权利要求6所述的视频特征提取装置,其特征在于,所述视频特征预处理模块还包括:提取视频帧里的关键特征,所述关键特征根据特征类别分为人体特征和物体特征,所述人体特征和物体特征可以在人机交互界面供用户选择;所述关键特征具体为语义特征,并根据所述语义特征建立语义模型,并为每一个视频帧对应的语义特征建立描述符。
8.根据权利要求6所述的视频特征提取装置,其特征在于,所述视频特征检索模块还包括:所述第二描述符为预先构建的与人体特征和物体特征相关联的描述符,并由多个第二描述符共同构成特征数据库;所述特征数据库存储在远程服务器,以减少本地的数据存储负担。
9.根据权利要求6所述的视频特征提取装置,其特征在于,所述视频特征检索模块还包括:所述视频检索过程基于远程服务器,或者,基于用户本地客户端。
10.根据权利要求6所述的视频特征提取装置,其特征在于,所述检索结果处理模块还包括:所述拟合度阈值有多个,每个拟合度区间的链表项目作为一项进行存储,共同构成分级存储单元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610897432.6A CN106503639A (zh) | 2016-10-15 | 2016-10-15 | 基于描述符的视频特征提取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610897432.6A CN106503639A (zh) | 2016-10-15 | 2016-10-15 | 基于描述符的视频特征提取方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106503639A true CN106503639A (zh) | 2017-03-15 |
Family
ID=58294147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610897432.6A Pending CN106503639A (zh) | 2016-10-15 | 2016-10-15 | 基于描述符的视频特征提取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106503639A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113866502A (zh) * | 2021-12-02 | 2021-12-31 | 深圳市鼎阳科技股份有限公司 | 频谱分析仪及其数据扫描和处理方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101374234A (zh) * | 2008-09-25 | 2009-02-25 | 清华大学 | 一种基于内容的视频拷贝监测方法及装置 |
CN103778237A (zh) * | 2014-01-27 | 2014-05-07 | 北京邮电大学 | 一种基于活动事件时空重组的视频摘要生成方法 |
CN103929653A (zh) * | 2014-04-30 | 2014-07-16 | 成都理想境界科技有限公司 | 增强现实视频生成器、播放器及其生成方法、播放方法 |
CN104038792A (zh) * | 2014-06-04 | 2014-09-10 | 紫光软件系统有限公司 | 用于iptv监管的视频内容分析方法及设备 |
CN104520875A (zh) * | 2012-07-11 | 2015-04-15 | 意大利广播电视股份公司 | 优选用于搜索和检索目的的从视频内容提取描述符的方法和装置 |
CN105528458A (zh) * | 2016-01-07 | 2016-04-27 | 华东师范大学 | 通过检索视频内容实现超感体验的方法 |
-
2016
- 2016-10-15 CN CN201610897432.6A patent/CN106503639A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101374234A (zh) * | 2008-09-25 | 2009-02-25 | 清华大学 | 一种基于内容的视频拷贝监测方法及装置 |
CN104520875A (zh) * | 2012-07-11 | 2015-04-15 | 意大利广播电视股份公司 | 优选用于搜索和检索目的的从视频内容提取描述符的方法和装置 |
CN103778237A (zh) * | 2014-01-27 | 2014-05-07 | 北京邮电大学 | 一种基于活动事件时空重组的视频摘要生成方法 |
CN103929653A (zh) * | 2014-04-30 | 2014-07-16 | 成都理想境界科技有限公司 | 增强现实视频生成器、播放器及其生成方法、播放方法 |
CN104038792A (zh) * | 2014-06-04 | 2014-09-10 | 紫光软件系统有限公司 | 用于iptv监管的视频内容分析方法及设备 |
CN105528458A (zh) * | 2016-01-07 | 2016-04-27 | 华东师范大学 | 通过检索视频内容实现超感体验的方法 |
Non-Patent Citations (4)
Title |
---|
UTKARSHA S PACHARANEY 等: "Dimensionality Reduction for Fast and Accurate Video Search and Retrieval in a Large Scale Database", 《2013 NIRMA UNIVERSITY INTERNATIONAL CONFERENCE ON ENGINEERING (NUICONE)》 * |
李洁: "基于Hadoop的海量视频的分布式存储与检索研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
邵必林: "《海量信息存储安全技术及其应用》", 30 April 2014, 《西北工业大学出版社》 * |
邹福泰等: "《对等网络、网格计算与云计算 原理与安全》", 31 August 2012, 《清华大学出版社》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113866502A (zh) * | 2021-12-02 | 2021-12-31 | 深圳市鼎阳科技股份有限公司 | 频谱分析仪及其数据扫描和处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111209440B (zh) | 一种视频播放方法、装置和存储介质 | |
Liu et al. | Towards micro-video understanding by joint sequential-sparse modeling | |
CN111324774B (zh) | 一种视频去重方法和装置 | |
US9373040B2 (en) | Image matching using motion manifolds | |
Yu et al. | Stratified pooling based deep convolutional neural networks for human action recognition | |
CN109871490B (zh) | 媒体资源匹配方法、装置、存储介质和计算机设备 | |
US10104345B2 (en) | Data-enhanced video viewing system and methods for computer vision processing | |
Shen et al. | FEXNet: Foreground extraction network for human action recognition | |
Bakas et al. | A digital forensic technique for inter–frame video forgery detection based on 3D CNN | |
WO2023236469A1 (zh) | 一种视频行为识别方法、装置、电子设备及存储介质 | |
CN110991278A (zh) | 计算机视觉系统的视频中人体动作识别方法和装置 | |
Zhao et al. | Key‐Frame Extraction Based on HSV Histogram and Adaptive Clustering | |
Zhao et al. | Metadata extraction and correction for large-scale traffic surveillance videos | |
Ramesh et al. | Sports Video Classification Framework Using Enhanced Threshold Based Keyframe Selection Algorithm and Customized CNN on UCF101 and Sports1‐M Dataset | |
Yao | Key frame extraction method of music and dance video based on multicore learning feature fusion | |
CN113392689A (zh) | 视频文字跟踪方法、视频处理方法、装置、设备及介质 | |
CN114299304B (zh) | 一种图像处理方法及相关设备 | |
Jeysudha et al. | Real Time Video Copy Detection using Hadoop | |
CN115062709A (zh) | 模型优化方法、装置、设备、存储介质及程序产品 | |
Wang et al. | Knowledge-supervised learning: Knowledge consensus constraints for person re-identification | |
CN106503639A (zh) | 基于描述符的视频特征提取方法及装置 | |
CN113395584A (zh) | 一种视频数据处理方法、装置、设备以及介质 | |
Yang et al. | Research on human motion recognition based on data redundancy technology | |
Leonardi et al. | Image memorability using diverse visual features and soft attention | |
CN117011741A (zh) | 视频检测模型的训练方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170315 |
|
RJ01 | Rejection of invention patent application after publication |