CN107748761A - 一种视频摘要的关键帧提取方法 - Google Patents
一种视频摘要的关键帧提取方法 Download PDFInfo
- Publication number
- CN107748761A CN107748761A CN201710878227.XA CN201710878227A CN107748761A CN 107748761 A CN107748761 A CN 107748761A CN 201710878227 A CN201710878227 A CN 201710878227A CN 107748761 A CN107748761 A CN 107748761A
- Authority
- CN
- China
- Prior art keywords
- video
- key frame
- dis
- key
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 12
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000003287 optical effect Effects 0.000 claims description 2
- 230000003542 behavioural effect Effects 0.000 claims 1
- 238000000691 measurement method Methods 0.000 claims 1
- 230000003068 static effect Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000011840 criminal investigation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种视频摘要的关键帧提取方法,所述方法包括:对视频摘要中满足代表性和多样性条件的帧进行提取以作为所述关键帧,如下式所示:
Description
技术领域
本申请涉及机器学习与数据分析领域,其尤其指一种视频摘要的关键帧提取方法。
背景技术
视屏摘要:视频摘要又称视频浓缩,是对视频内容的一个简单概括,以自动或半自动的方式,先通过运动目标分析,提取运动目标,然后对各个目标的运动轨迹进行分析,将不同的目标拼接到一个共同的背景场景中,并将它们以某种方式进行组合。视频摘要在视频分析和基于内容的视频检索中扮演着重要角色。在社会公共安全领域,视频监控系统成为维护社会治安,加强社会管理的一个重要组成部分。然而视频录像存在存储数据量大,存储时间长等特点,通过录像寻找线索,获取证据传统的做法是要耗费大量人力、物力以及时间,效率极其低下,以至于错过最佳破案时机。因此在视频监控系统中,对原始视频进行浓缩,可以快速浏览,锁定检索对象,能够满足公安,网监,刑侦的各种需求及应用。
静态的视频摘要:也称之为视频概要(video summary),是以一系列从原始视频流中抽取出来的静态语义单元来表现视频的内容。静态语义单元是诸如关键帧、标题、幻灯片等可以概括表示视频镜头内容的静态特征信息。目前的静态视频摘要的研究主要是基于关键帧选取方法来展开的。通过将多个关键帧组合成视频摘要,允许用于通过少量的关键帧快速浏览原始视频的内容,并提供快速检索。关键帧的选取主要利用颜色、运动矢量等视觉特征去区分帧间的差异性。但差异性的区分计算依赖阈值的选择,选择过程中计算了较大、实时性较差。基于关键帧的视频摘要结果简单,观看方便。但由于其以静态图像为结果的表达形式,很难准确地表达视频的内在语义,且对“对象”动态特征的描述不够全面,所以仅仅适用于视频的精彩瞬间生成,无法适应需要进行“对象”特征分析的场合。
动态视频摘要:又称之为视频浓缩(video synthesis),是一段比原始视频短的多的浓缩结果。动态视频摘要可以分为精彩剪辑视频、专题浓缩视频、一般浓缩视频三种。精彩剪辑视频主要用于电影电视行业,是由原始视频中的精彩瞬间组成,专题浓缩视频主要应用于医学、金融等特定领域,利用特定专业知识对原始视频进行分析后浓缩得到的表现该领域特定内容的浓缩视频。
相对而言,一般视频浓缩采用通用浓缩方法面向较为普通视频,用户可以通过播放这些相对精炼的摘要视频来了解整个视频的内容。
发明内容
本发明认为组成视频摘要的关键帧需要满足代表性和多样性,其提出了新的代表性和多样性的定义方法,它们分别基于拓扑势与范数,并且提出了关键帧提取的数学模型。并且利用拓扑势来确定每一帧代表性,在我们得到每一帧的拓扑势后,将视频帧按照拓扑势进行代表性排序。同时考虑视频帧的外观不相似度和行为不相似度对其进行分别定义,最终得到确定关键帧的式子。
本发明的目的通过下述技术方案实现:
组成视频摘要的关键帧需要满足代表性和多元性,如下式所示:
其中,R(S)代表关键帧的代表性,而D(S)代表关键帧的多样性。
(1)代表性
对video frames建立网络G=(V,E),其中V为视频帧集合,E的权重为dij=d(vi,vj)。根据数据场势函数的定义,任一结点的拓扑势可以表示为,
其中,mj表示网络节点vj的质量,用来描述vj的固有属性,n为网络节点的个数,σ为影响因子,用于控制每个结点的影响范围。我们利用拓扑势来确定每一帧的代表性,则:
1)我们定义vj局部密度来代表vj的固有属性。其中
dc为截断误差,其通常为实际值与计算值之间的差值。
2)影响因子σ的选取应该使势场分布尽可能体现数据的内在分布规律,我们引入势熵的概念来衡量势场数据分布的合理性。势熵定义如下:其中为标准化因子,我们通过下式来求解影响因子σ:
由此,我们得到每一帧的拓扑势,并将视频帧按照拓扑势进行代表性排序。
(2)多样性
我们同时考虑视频帧的外观不相似度和行为不相似度,定义如下:
disa(vi,vj)=||ci-cj||,dism(vi,vj)=||oi-oj||,其中,c和o分别是colorhistogram和optical flow,dis(vi,vj)=disa(vi,vj)+dism(vi,vj)。那么,关键帧的多样性由下式进行确定:
*外观和行为的两个距离要调和才能进行运算。
综上所述,我们利用下式进行关键帧提取:
本发明相对于现有技术的优点及效果:
本文提出的方法基于视频摘要的两个因素代表性和多样性,我们对其进行了新的定义,在此基础上得到获取视频摘要的数学模型,此后进一步提出关键帧提取的具体方式方法,首先设置关键帧的代表能力的阈值,而后按照帧代表性从大到小的顺序对关键帧进行挑选。相比于现有的技术,本文所提出的方法具有一定的参考价值,并且对于一些特殊情况下的视频分析提取具有比一般方法更加突出的优势和作用。
具体实施方式
考虑到我们希望挑选的关键帧在不存在信息冗余的情况下尽可能地展现视频的主要内容,所以我们以差异性为约束,对关键帧集合的代表性进行优化。
(1)首先我们设置关键帧的代表能力的阈值δ1,我们只对代表能力的视频帧进行研究。接下来,我们对视频帧按照代表性的大小排序:
其中k是排序之后视频帧的标号,N为代表能力的视频帧的数目。
(2)我们按照帧代表性从大到小的顺序对关键帧进行挑选。第1帧最具有代表性,显然可以作为关键帧。如果第k帧被选入关键帧集合,那么我们定义下一个关键帧的备选集合为{k+1,k+2,...,N}。第k+i帧被选入关键帧集合,如果满足:
dis(k,k+i)>δ2,and dis(k,k+j)≤δ,
其中δ2是两帧相似程度的阈值。
Claims (3)
1.一种视频摘要的关键帧提取方法,其特征在于,所述方法包括:对视频摘要中满足代表性和多样性条件的帧进行提取以作为所述关键帧,如下式所示:
<mrow>
<mi>S</mi>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mi>max</mi>
<mrow>
<mi>S</mi>
<mo>&Subset;</mo>
<mi>V</mi>
</mrow>
</munder>
<mi>R</mi>
<mrow>
<mo>(</mo>
<mi>S</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mi>D</mi>
<mrow>
<mo>(</mo>
<mi>S</mi>
<mo>)</mo>
</mrow>
<mo>,</mo>
</mrow>
其中,R(S)代表关键帧的代表性,而D(S)代表关键帧的多样性,S表示关键帧。
2.如权利要求1所述的提取方法,其特征在于,所述代表性条件具体包括:
对所述视频摘要建立网络G=(V,E),其中V为视频帧集合,E的权重为dij=d(vi,vj),其表示网络中每条边的权值,可取欧氏距离等度量方法进行计算;根据数据场势函数的定义,任一结点的拓扑势表示为,
其中,mj表示网络节点vj的质量,用来描述vj的固有属性,n为节点的数量;σ为影响因子,用于控制每个结点的影响范围;
然后利用所述拓扑势来确定每一帧的代表性,即:
其中有:
dc为截断误差,其为实际值与计算值之间的差值;
影响因子σ为其中
3.如权利要求2述的提取方法,其特征在于,所述多样性条件具体包括:
首先计算外观不相似度:disa(vi,vj)=||ci-cj||和行为不相似度:dism(vi,vj)=||oi-oj||,
其中,c和o分别是彩色直方图和光流,所述关键帧的多样性条件由下式进行确定:
其中dis(vi,vj)=disa(vi,vj)+dism(vi,vj)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710878227.XA CN107748761B (zh) | 2017-09-26 | 2017-09-26 | 一种视频摘要的关键帧提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710878227.XA CN107748761B (zh) | 2017-09-26 | 2017-09-26 | 一种视频摘要的关键帧提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107748761A true CN107748761A (zh) | 2018-03-02 |
CN107748761B CN107748761B (zh) | 2021-10-19 |
Family
ID=61254611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710878227.XA Expired - Fee Related CN107748761B (zh) | 2017-09-26 | 2017-09-26 | 一种视频摘要的关键帧提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107748761B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109243594A (zh) * | 2018-08-28 | 2019-01-18 | 青岛大学附属医院 | 一种小儿外科刀口清洁护理装置及控制方法 |
CN113642422A (zh) * | 2021-07-27 | 2021-11-12 | 东北电力大学 | 一种连续中文手语识别方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7027513B2 (en) * | 2003-01-15 | 2006-04-11 | Microsoft Corporation | Method and system for extracting key frames from video using a triangle model of motion based on perceived motion energy |
EP2038774A2 (en) * | 2006-06-29 | 2009-03-25 | Koninklijke Philips Electronics N.V. | Method and system of key frame extraction |
CN101577824A (zh) * | 2009-06-12 | 2009-11-11 | 西安理工大学 | 基于邻近i帧dc图像相似度的压缩域关键帧提取方法 |
CN103942751A (zh) * | 2014-04-28 | 2014-07-23 | 中央民族大学 | 一种视频关键帧提取方法 |
CN104394488A (zh) * | 2014-11-28 | 2015-03-04 | 苏州科达科技股份有限公司 | 一种视频摘要的生成方法及系统 |
US20170024930A1 (en) * | 2015-07-20 | 2017-01-26 | Ming Chuang | Consistent tessellation via topology-aware surface tracking |
-
2017
- 2017-09-26 CN CN201710878227.XA patent/CN107748761B/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7027513B2 (en) * | 2003-01-15 | 2006-04-11 | Microsoft Corporation | Method and system for extracting key frames from video using a triangle model of motion based on perceived motion energy |
US7983340B2 (en) * | 2003-01-15 | 2011-07-19 | Microsoft Corporation | Extracting key frames from video using a triangle model of motion based on perceived motion energy |
EP2038774A2 (en) * | 2006-06-29 | 2009-03-25 | Koninklijke Philips Electronics N.V. | Method and system of key frame extraction |
CN101577824A (zh) * | 2009-06-12 | 2009-11-11 | 西安理工大学 | 基于邻近i帧dc图像相似度的压缩域关键帧提取方法 |
CN103942751A (zh) * | 2014-04-28 | 2014-07-23 | 中央民族大学 | 一种视频关键帧提取方法 |
CN104394488A (zh) * | 2014-11-28 | 2015-03-04 | 苏州科达科技股份有限公司 | 一种视频摘要的生成方法及系统 |
US20170024930A1 (en) * | 2015-07-20 | 2017-01-26 | Ming Chuang | Consistent tessellation via topology-aware surface tracking |
Non-Patent Citations (4)
Title |
---|
CHAKRABORTY S,TICKOO O,IYER R: ""Adaptive keyframe selection for video summarization"", 《IEEE WINTER CONFERENCE ON APPLICATIONS OF COMPUTER VISION》 * |
王宇、汪荣贵、杨娟: ""一种新的自适应的视频关键帧提取方法"", 《合肥工业大学学报(自然科学版)》 * |
肖俐平、孟晖、李德毅: ""基于拓扑势的网络节点重要性排序及评价方法"", 《武汉大学学报-信息科学版》 * |
解晓萌、黎绍发: ""一种新的冗余关键帧去除算法"", 《电视技术》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109243594A (zh) * | 2018-08-28 | 2019-01-18 | 青岛大学附属医院 | 一种小儿外科刀口清洁护理装置及控制方法 |
CN113642422A (zh) * | 2021-07-27 | 2021-11-12 | 东北电力大学 | 一种连续中文手语识别方法 |
CN113642422B (zh) * | 2021-07-27 | 2024-05-24 | 东北电力大学 | 一种连续中文手语识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107748761B (zh) | 2021-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rui et al. | Constructing table-of-content for videos | |
Zhou et al. | Movie genre classification via scene categorization | |
JP3568117B2 (ja) | ビデオ画像の分割、分類、および要約のための方法およびシステム | |
Cong et al. | Towards scalable summarization of consumer videos via sparse dictionary selection | |
CN106649713B (zh) | 一种基于内容的电影可视化处理方法及其系统 | |
US20080162561A1 (en) | Method and apparatus for semantic super-resolution of audio-visual data | |
Qu et al. | An improved keyframe extraction method based on HSV colour space. | |
Papadopoulos et al. | Automatic summarization and annotation of videos with lack of metadata information | |
Mahum et al. | A generic framework for generation of summarized video clips using transfer learning (SumVClip) | |
Zhao et al. | Key‐Frame Extraction Based on HSV Histogram and Adaptive Clustering | |
CN107748761B (zh) | 一种视频摘要的关键帧提取方法 | |
Jin et al. | Network video summarization based on key frame extraction via superpixel segmentation | |
CN107516084B (zh) | 一种基于多特征融合的互联网视频作者身份识别方法 | |
Lu et al. | A novel video summarization framework for document preparation and archival applications | |
CN110933520B (zh) | 一种基于螺旋摘要的监控视频展示方法及存储介质 | |
Widiarto et al. | Video summarization using a key frame selection based on shot segmentation | |
CN111090775A (zh) | 一种视频摘要的关键帧提取方法 | |
Dao et al. | Discovering inherent event taxonomies from social media collections | |
Kadam et al. | Recent Challenges and Opportunities in Video Summarization With Machine Learning Algorithms | |
Dong et al. | Advanced news video parsing via visual characteristics of anchorperson scenes | |
Jiang et al. | A scene change detection framework based on deep learning and image matching | |
Naveen Kumar et al. | An efficient approach for video retrieval by spatio-temporal features | |
Vijayakumar et al. | Recent trends and research issues in video association mining | |
Psallidas et al. | Summarization of user-generated videos fusing handcrafted and deep audiovisual features | |
Weber et al. | Video object mining: Issues and perspectives |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211019 |
|
CF01 | Termination of patent right due to non-payment of annual fee |