CN103385000A - 用于测量视频质量的方法和装置 - Google Patents
用于测量视频质量的方法和装置 Download PDFInfo
- Publication number
- CN103385000A CN103385000A CN2010800683107A CN201080068310A CN103385000A CN 103385000 A CN103385000 A CN 103385000A CN 2010800683107 A CN2010800683107 A CN 2010800683107A CN 201080068310 A CN201080068310 A CN 201080068310A CN 103385000 A CN103385000 A CN 103385000A
- Authority
- CN
- China
- Prior art keywords
- frame
- video sequence
- parameter
- quality
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000033001 locomotion Effects 0.000 claims abstract description 73
- 230000001427 coherent effect Effects 0.000 claims abstract description 9
- 238000012360 testing method Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 3
- 230000008447 perception Effects 0.000 description 39
- 238000009432 framing Methods 0.000 description 18
- 230000000694 effects Effects 0.000 description 17
- 238000005259 measurement Methods 0.000 description 14
- 210000004556 brain Anatomy 0.000 description 7
- 230000003068 static effect Effects 0.000 description 7
- 239000002131 composite material Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 210000001508 eye Anatomy 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 230000035807 sensation Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013442 quality metrics Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000006854 communication Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 208000012661 Dyskinesia Diseases 0.000 description 1
- 206010016338 Feeling jittery Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 210000005252 bulbus oculi Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000036461 convulsion Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004434 saccadic eye movement Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/002—Diagnosis, testing or measuring for television systems or their details for television cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/04—Diagnosis, testing or measuring for television systems or their details for receivers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/89—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/21—Circuitry for suppressing or minimising disturbance, e.g. moiré or halo
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明提供了一种用于测量包括多个帧的视频序列的质量的方法和对应的装置。所述视频序列中一个或多个连续帧丢失,并且在所述视频序列的显示过程中,在从显示所述一个或多个丢失的帧的其前紧邻帧到显示其后紧邻帧的时间段内用所述视频序列中其前紧邻帧代替所述一个或多个丢失的帧。所述方法包括:根据与在所述时间段内所述其前紧邻帧的稳定性相关的第一参数、与所述其前紧邻帧和其后紧邻帧之间的连续性相关的第二参数和与所述视频序列的相干运动相关的第三参数测量所述视频序列的质量。
Description
技术领域
本发明总体上涉及视频质量,具体而言,本发明涉及用于测量由于丢帧造成失真的视频序列的质量的方法和装置。
背景技术
需要指出,本发明用于向读者介绍各个方面的有关技术,其可能与下述本发明的各个方面相关。这部分介绍有助于向读者介绍背景信息以促进对于本发明的各个方面的理解。因此,可以理解,本发明的讨论是出于上述的目的,而非构成对于现有技术的承认。
由于无线通信技术的迅速发展,利用视频电话、视频流技术和视频广播的视频通信变得越来越普遍。在这种类型的通信过程中,压缩媒体数据包有可能在不稳定的网络上传输,在这个过程中,压缩时的数据丢失或传输中的丢包可能引入空间和时间失真。比特率适配技术和网络中的丢包可能是可感知的视频质量降低的原因。在源编码阶段,时间下采样是用于比特率适配的技术之一,在该过程中视频序列经受了弃帧(frame dropping)操作,这会影响视频的运动连续性。
可感知抖动(perceptual jitter)是丢帧所造成的常见视频质量降低(video quality degradation)。通常而言,可感知抖动是在下述情况下察觉到的一种时间伪像(temporal artifact):视频帧序列中的一个或多个连续帧在视频流过程中丢失并在后续的显示阶段中用最后正确接收的帧替代。图1是显示由丢帧(例如弃帧)造成的可感知抖动的示意图。丢帧过程及其对视频质量的影响示于图1中。图1所示曲线表示一个物体的运动轨迹,其中X轴表示时间,Y轴表示物体位置。时间B0与B之间的帧被丢弃。在这种情况下,由于在时间B0最后正确接收的帧将被显示,直至在时间B正确接收到新的帧,显示的物体在此时间段内将保持静止,然后立刻跳至新位置。如果此时间段相对较短并且物体运动比较轻微,则观看者可以猜测物体的行为并且不会察觉到运动中断。否则,人类的大脑将无法隐藏该“运动中断”现象,这样观看 者将会识别到该时间伪像。
已经进行了一些研究来估计由可感知抖动造成的时间质量降低的可感知影响。基于文件1中描述的具体主观实验法,可以得出可感知质量随着丢帧数量的增加而降低的结论。文件2进行的研究对上述结论进行了扩展,其结论是上述可感知影响与内容高度相关。文件3的结论与上述两个文件类似,但具体指出与内容相关的因素是运动活跃性(motion activity)――抖动的存在对运动活跃性较低的视频造成的可感知质量降低比运动活跃性较高的视频要小。基于上述结论,还提出了量化模型。
但是,还没有用于可感知抖动的系统性的评估方案。
发明内容
本申请的发明人的研究显示,当包含多个帧的视频序列中的一个或多个连续帧丢失,并且在从显示所述一个或多个丢失的帧的其前紧邻帧到显示其后紧邻帧的时间段内用所述视频序列中其前紧邻帧代替,所述失真的视频序列的质量将主要受下面三个参数的影响:与在所述时间段内所述其前紧邻帧的稳定性相关的参数、与所述其前紧邻帧和其后紧邻帧之间的连续性相关的参数和与所述视频序列的相干运动(coherent motion)相关的参数。
考虑到上述发现,本发明提供了一种用于根据上述三个参数测量由于丢帧而造成失真的视频序列的视频质量的方法和装置。
本发明的一个方面提供了一种用于测量包括多个帧的视频序列的质量的方法,所述视频序列中一个或多个连续帧丢失,并且在所述视频序列的显示过程中,在从显示所述一个或多个丢失的帧的其前紧邻帧到显示其后紧邻帧的时间段内用所述视频序列中其前紧邻帧代替所述一个或多个丢失的帧。所述方法包括:根据与在所述时间段内所述其前紧邻帧的稳定性相关的第一参数、与所述其前紧邻帧和其后紧邻帧之间的连续性相关的第二参数和与所述视频序列的相干运动相关的第三参数测量所述视频序列的质量。
本发明的另一个方面提供了一种用于测量包括多个帧的视频序列的质量的装置,所述视频序列中一个或多个连续帧丢失,并且在所述视频序列的显示过程中,在从显示所述一个或多个丢失的帧的其前紧邻帧到显示其后紧邻帧的时间段内用所述视频序列中其前紧邻帧代替所述一个或多个丢失的帧。所述装置包括:用于获得与在所述时间段内所述其前紧邻帧的稳定性相 关的第一参数的第一测量单元;用于获得与所述其前紧邻帧和其后紧邻帧之间的连续性相关的第二参数的第二测量单元;用于获得与所述视频序列的相干运动相关的第三参数的第三测量单元;和根据所述第一参数、第二参数和第三参数测量所述视频序列的质量结果的组合单元。
本发明的实施方式披露于权利要求、说明书及其附图中。
附图说明
下面将结合附图对本发明的实施方式进行详细说明,其中:
图1是显示由丢帧(例如弃帧)造成的可感知抖动的示意图;
图2是根据本发明的实施方式的用于测量由于丢帧造成失真的视频序列的可感知抖动的方法的流程图;
图3是根据本发明的实施方式的用于测量由于丢帧造成失真的视频序列的可感知抖动的装置的高层框图;和
图4是用于对视频质量进行主观测试的软件工具的界面示意图。
具体实施方式
下面将参照视频流系统对本发明的实施方式进行说明。根据本实施方式,视频序列中的一个或多个连续帧在流处理过程中被丢失并且在显示过程在正确接收到视频序列中的后续帧之前用最后一个正确接收的帧代替,视频序列的可感知抖动收到下面三个方面因素的影响:
1)定帧(frame freeze):当一个或多个连续帧丢失时由于最后一个正确接收到的帧在从显示最后一个接收到的帧到显示后续帧之间的时间段内保持静止/固定而导致的效应。
2)运动中断(motion discontinuity):由于最后一个正确接收到的帧与后续帧之间在上述时间段内的不连续性而造成的物体运动变得中断的效应。例如,当观看者正在关注视频中的篮球,则运动中断是指该篮球在出现较短时间后突然出现在另一位置。
3)心理急动(psychological jerk):由相干运动(特别是摄像机运动)造成的效应。具体而言,当在快速平移(fast panning)情况下一个或多个连续帧丢失时,观看者的感知将极大地降低,这是因为其眼睛和大脑对于发生的大量心理行动变得厌倦。
考虑到上述情况,本发明的实施方式提议根据与上述三种效应相关的三个参数对视频序列的质量进行测量。
本发明的实施方式的一个方面提供了一种用于测量由于丢帧造成失真的视频序列的可感知抖动的方法。
图2是根据本发明的实施方式的用于测量由于丢帧造成失真的视频序列的可感知抖动的方法的流程图。
如图2所示,所述方法包括下述步骤:
S201:估计丢帧造成失真的视频序列的定帧;
S202:估计丢帧造成失真的视频序列的运动中断;
S203:估计丢帧造成失真的视频序列的心理急动;
S204:通过组合上述三个步骤的结果测量视频序列的可感知抖动。
根据一个改变的实施例,步骤S204中可以结合所述三个结果中选出的两个结果,而不是所有三个结果。
本发明的实施方式的另一个方面提供了一种用于测量由于丢帧造成失真的视频序列的可感知抖动的装置。
根据本发明的实施方式,首先通过该装置对上述三种效应中的每一个进行估计,然后通过组合三个结果获得可感知抖动的总体测量结果。
图3是根据本发明的实施方式的用于测量由于丢帧造成失真的视频序列的可感知抖动的装置300的高层框图。如图3所示,装置300的输入是具有一个或多个连续帧丢失的失真视频序列,其输出是表示该失真视频序列中由一个或多个连续帧丢失造成的质量降低(在本实施例中为可感知抖动)等级的数值。
装置300包括:定帧估计模块301,用于接收所述失真视频序列并估计所述定帧造成的视频序列的可感知抖动;运动中断估计模块302,用于接收所述失真视频序列并估计所述运动中断造成的视频序列的可感知抖动;心理急动估计模块303,用于接收所述失真视频序列并估计所述心理急动造成的视频序列的可感知抖动;和组合模块304,用于从模块302、302和303接收输出并将所述输出结合出纳岗位由于丢帧造成的总体可感知抖动测量结果。
下面将对装置300的运转进行详细说明。
首先将进行一些定义。
在下面对于实施方式的说明中,用v={f1,f2,...,fN}表示原始视频序列。 假设帧fk+1,fk+2,...,fm-1在传输过程中丢失,用V′={f1′,f2′,...,fN′》表示流视频序列/失真视频序列。
其中:
简言之,装置300用于估计当原始视频序列的m-k-1个帧丢失时失真视频序列中帧fk′与fm'之间的时间质量降低的等级。
在下面的说明中,假设帧速率为FPS,并且T=(m-k)/FPS表示fk′和fm′之间显示的内容保持静止的时间段。MVi,x,y表示视频序列V的第i个帧的编号为(x,y)的宏块的运动矢量。
1.定帧估计模块301
根据本发明的实施方式,定帧估计模块301可以通过下述公式(1)测量由定帧造成的视频可感知抖动:
DF=g1(MVk)×g2(T) (1)
可以理解,观看者无法识别出运动非常慢的极稳定视频序列中的定帧。在上述公式(1)中,g1(MVk)用于表示这种情况,其中MVk是视频序列V的第k个帧的运动矢量的测量值。
在公式1中,g2(T)用于表示定帧T的时间段,是用于由定帧造成的可识别效应的评估的重要参数。
如上所示,如果时间段小于常数(T<c2),人的大脑将试图把定帧之前和之后的图像联系起来,从而将该时间段理解为连续运动。在这种情况下,观看者将意识不到定帧。
2.运动中断估计模块302
在视频浏览中,观看者的眼睛运动主要可以分解为三种类型:扫视(saccade)、注视(fixation)和平稳追视(smooth pursuit)。扫视是非常迅速的眼睛运动,使用户可以在视野中探寻。注视是当眼球凝视在视野的特定区域时的残余运动。平稳追视是眼睛平稳地跟踪移动物体图像的能力。
观看者主要从注视/平稳追视阶段获取信息。在这些阶段,人的眼睛关注于相关物体的小的区域。当发生丢帧时,人的眼睛在接收到正确传输的新帧之前一直保持静止。因此可以理解,当前关注区域的像素值差异越大,越容易注意到运动中断。
根据上述解释,运动中断估计模块302可以通过下列公式(2)估计由运动中断造成的可感知抖动。
其中N是像素数,pi,j表示帧fj′中第i个像素的像素值。
3.心理急动估计模块303
与由于物体运动造成的运动中断效应不同,心理急动是由全局摄像机运动造成的。
如上结合附图1所述,当时间B0与B之间的帧丢失时,时间B0的帧将保持静止,直至在时间B接收到新帧。但是,观看者所感知的与此并不完全相似。当视频内容在时间B0突然变得静止时,观看者的大脑将试图以时间B0之前的速度解释物体运动并将时间B0和B的内容自然地联系在一起。当时间B0和B之间的时间段很短时,根据“似动理论(apparent movement theory)”,人的大脑可以成功做到。否则大脑将无法实现这一点。在这种情况下无论人的大脑能够实现上述联系,都会产生许多心理活动。
当视频序列中由于全局摄像机运动产生丢帧时,视频序列的每个像素将都需要此种类型的心理活动。结果,当依赖于这种伪像时,观看者很容易感到疲劳和不愉快。在本发明中将这种效应称为“心理急动”并根据摄像机运动的等级进行估计。
文件4说明了一种所谓的8参数运动模型,可以用于上述的全局运动估计中。
x′i=(a0+a2xi+a3yi)/(T+a6xi+a7yi)
y′i=(a1+a4xi+a5yi)/(1+a6xi+a7yi)
其中(a0,...,a7)是全局运动参数,(xi,yi)表示当前帧中第i个像素的空间坐标,(x′i,y′i)表示先前帧中对应像素的坐标。运动模型参数与符号等级的解释之间的关系如下:
Pan=a0
Tilt=a1
Zoom=(a2+a5)/2
采用上述算法,心理急动估计模块303可以通过下述公式(3)估计由于定帧导致的视频可感知抖动:
其中c4是用于将所述值规格化至[0,1]范围的系数。
对于不同的摄像机操作(平移(Pan)、翻转(Tilt)、变焦(Zoom))可以采用不同的权重系数,因为这些操作对于可感知抖动具有不同的影响。
4.组合模块304
组合模块304将模块301、302和303的输出组合以获得可感知抖动的总体测量结果。
例如,组合模块304可以采用线性组合获取可感知抖动的总体测量结果。下述公式(4)说明了线性组合:
l1=k1×DF+k2×DD+k3×Dp (4)
其中通过试验确定三个系数k1,k2和k3。
通过主观试验描述收集数据集DS={si|i=1,2,...,M}。数据集中的每个采样si是传输的具有丢帧的视频镜头。DF(i)、DD(i)和DP(i)分别表示si的定帧、运动中断和心理急动的可感知感觉估计。假设J1(i)表示根据公式(4)的采样si的可感知抖动的客观估计,Js(i)表示采样si的可感知抖动的主观评分。则可以通过下面的公式确定系数k1,k2和k3:
可选择地,也可以采用机器学习获得可感知抖动的总体测量结果。即,假设DF、DD和DP是提取的特征,则可感知抖动的总体估计结果是机器输出。在这种情况下,可以采用如下所示人工神经网络(artificial neutral network)作为图3中所示的训练机器305。
J2=ANN(DF,DD,Dp) (5)
在组合模块304,需要一些系数作为观看者对于定帧、运动中断和心理急动的不同灵敏度的加权值。通过在上述数据集上的训练提供这些系数的缺省数值集。但是,对于不同人和不同的应用场景可以修改这些数值。
图4是用于对视频质量进行主观测试的软件工具的界面示意图。如图4 所示,视频序列的随机镜头显示时在序列的随机位置具有随机长度的丢帧。
观看者被要求如下所述标出对于抖动的感知:
0-没有可感知的质量降低
1-质量降低可以被注意到,但不非常烦人
2-明显的质量降低,非常烦人
用Js表示主观评分。所有具有标出的评分的序列组成数据集DS。
下面将说明用于主观试验的参数设置。
在试验中,通过试验确定常数:β1=β2=1,β3=2;c1=1;c2=1/15(s),c3=1/3(5)。
根据主观测试为公式J1中的k1,k2和k3的每一个以及公式J2中的训练机器参数赋值为缺省值。但是,定帧、运动中断和心理急动的可感知感觉有可能完全不同并且互不相关。即,某些人可能对心理急动非常敏感,而另外的人可能不喜欢其注意的物体上的运动中断。因此,定帧、运动中断和信息急动的可感知感觉对于可感知抖动的总体估计值的贡献可能在不同的应用场景和对于不同的人完全不同。出于灵活性的目的,以平均方式为这些参数提供配置。但是这些数值设置是可以改变的。
如上所述,组合模块304可以采用线性组合或机器学习来获得可感知抖动的总体估计结果。通过将客观估计结果(J1/J2)与主观评分Js进行比较来测量上述两种方式的预测精度。可以采用皮尔逊相关进行这种预测精度测量。
下面的表格给出了本发明的皮尔逊相关以及文件3中提出的方法的预测精度。所述预测精度是通过(两个观看者)的200个采样测试得出的。
文件3提出的方法 | 0.52 |
本发明的J1 | 0.70 |
本发明的J2 | 0.73 |
“跳跃暂停(Pausing with skipping)”是在不稳定网络条件下的一种常用播放模式,其定义为视频暂停一段时间并随后带着视频信息的某些丢失重新播放的事件。跳跃暂停的一个例子是一对IP视频电话,其中繁忙的网络流量使IP视频电话的显示短暂静止,并且当IP视频电话继续显示时某些内 容丢失。另外的一个例子是进行恒定或变化的跳帧的视频会议系统。处理后的包含由跳帧产生的停顿的视频序列将与相关原始视频序列具有相同期间[根据VQEG的MM测试]。
本发明提出的可感知抖动测量方法和装置可以直接用于估计任何“跳跃暂停”所引入的质量降低。
本发明提出的算法还有助于在带宽限制条件下适应性地选择丢弃的帧而同时使引入的质量降低最小化。通过将丢帧数设置为常数,可以测量视频序列中每个帧的时间重要性。
上面对本发明的实施方式进行了说明,但本领域普通技术人员可以在本发明的原理和范围内做出很多修改。
说明书及其附图和权利要求中公开的每个特征都可以单独或以任何适当的形式组合。所述特征可以用硬件、软件及其组合来实施。权利要求书中的附图标记用于说明的目的,不限定权利要求的范围。
文件1:Y.N.Qi,M.Y.Dai,“The Effect of Frame Freezing and Frame Skipping on Video Quality”,2006International Conference on Intelligent Information Hiding and Multimedia,pp.423-426.(《视频质量的的定帧和跳帧效应》,2006年世界智能信息隐蔽和多媒体大会)
文件2:M.Ghanbari,Q.Huynh-Thu,“Impact of Jitter and Jerkiness on Perceived Video Quality”,2nd International Workshop on Video Processing and Quality Metrics for Consumer Electronics,Scottsdale,USA,22-24,Jan.2006.(《抖动和急动对可感知视频质量的影响》,第二届消费电子视频处理和质量度量国际研讨会)
文件3:K.C.Yang,C.C.Guest,K.El-Maleh,P.K.Das,“Perceptual Temporal Quality Metric for Compressed Video”,IEEE Transaction on Multimedia,Vol.9,No.7,Nov.2007,pp.1528-1535.(《压缩视频的可感知时间质量度量》,IEEE多媒体学报)
文件4:L.Y.Duan,J.Q.Wang et al.,“Shot-Level Camera Motion Estimation based on a Parametric Model”.(《基于参数模型的拍摄等级摄像机运动估计》) 。
Claims (10)
1.一种用于测量包括多个帧的视频序列的质量的方法,所述视频序列中一个或多个连续帧丢失,并且在所述视频序列的显示过程中,在从显示所述一个或多个丢失的帧的其前紧邻帧到显示其后紧邻帧的时间段内用所述视频序列中其前紧邻帧代替所述一个或多个丢失的帧,其特征在于,所述方法包括:
根据与在所述时间段内所述其前紧邻帧的稳定性相关的第一参数(DF)、与所述其前紧邻帧和其后紧邻帧之间的连续性相关的第二参数(DD)和与所述视频序列的相干运动相关的第三参数(DP)测量所述视频序列的质量。
2.根据权利要求1所述的方法,其中根据所述第一参数(DF)、第二参数(DD)和第三参数(DP)的线性组合(K1xDF+K2xDD+K3xDP)测量所述视频序列的质量,其中通过试验获得所述线性组合的系数(K1、K2和K3)。
3.根据权利要求1所述的方法,其中根据所述第一参数(DF)、第二参数(DD)和第三参数(DP)的机器学习测量所述视频序列的质量。
4.根据权利要求1-3中任一所述的方法,其中根据所述其前紧邻帧的运动矢量和所述时间段的长度确定所述第一参数(DF)。
5.根据权利要求1-3中任一所述的方法,其中根据所述其前紧邻帧和所述其后紧邻帧的像素值和像素数确定所述第二参数(DD)。
6.根据权利要求1-3中任一所述的方法,其中所述相干运动是通过摄像机产生所述视频序列的过程中的摄像机运动。
7.根据权利要求6所述的方法,其中所述摄像机运动包括在产生所述视频序列过程中摄像机的平移、翻转和变焦操作。
8.一种用于测量包括多个帧的视频序列的质量的装置(300),所述视频序列中一个或多个连续帧丢失,并且在所述视频序列的显示过程中,在从显示所述一个或多个丢失的帧的其前紧邻帧到显示其后紧邻帧的时间段内用所述视频序列中其前紧邻帧代替所述一个或多个丢失的帧,其特征在于,所述装置(300)包括:
第一测量单元(301),用于获得与在所述时间段内所述其前紧邻帧的稳定性相关的第一参数(DF);
第二测量单元(302),用于获得与所述其前紧邻帧和其后紧邻帧之间的连续性相关的第二参数(DD);
第三测量单元(303),用于获得与所述视频序列的相干运动相关的第三参数(DP);和
组合单元(304),根据所述第一参数(DF)、第二参数(DD)和第三参数(DP)测量所述视频序列的质量结果。
9.根据权利要求8所述的装置(300),其中所述组合单元(304)根据所述第一参数(DF)、第二参数(DD)和第三参数(DP)的线性组合(K1xDF+K2xDD+K3xDP)测量所述视频序列的质量,其中通过试验获得所述线性组合的系数(K1、K2和K3)。
10.根据权利要求8所述的装置(300),其中所述组合单元(304)根据训练机器(305)对所述第一参数(DF)、第二参数(DD)和第三参数(DP)的机器学习测量所述视频序列的质量。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2010/001150 WO2012012914A1 (en) | 2010-07-30 | 2010-07-30 | Method and apparatus for measuring video quality |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103385000A true CN103385000A (zh) | 2013-11-06 |
Family
ID=45529342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800683107A Pending CN103385000A (zh) | 2010-07-30 | 2010-07-30 | 用于测量视频质量的方法和装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8675075B2 (zh) |
EP (1) | EP2599310B1 (zh) |
JP (1) | JP5751648B2 (zh) |
KR (1) | KR20130090881A (zh) |
CN (1) | CN103385000A (zh) |
AU (1) | AU2010358309B2 (zh) |
BR (1) | BR112013002361A2 (zh) |
WO (1) | WO2012012914A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105049915A (zh) * | 2015-06-30 | 2015-11-11 | 株洲南车时代电气股份有限公司 | 一种机车视频数据完整性自动检测方法 |
WO2023011098A1 (zh) * | 2021-08-06 | 2023-02-09 | 腾讯科技(深圳)有限公司 | 一种数据传输方法及相关装置 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6010625B2 (ja) | 2011-11-28 | 2016-10-19 | トムソン ライセンシングThomson Licensing | 歪み/品質測定 |
US10649613B2 (en) | 2012-06-07 | 2020-05-12 | Wormhole Labs, Inc. | Remote experience interfaces, systems and methods |
US10489389B2 (en) | 2012-06-07 | 2019-11-26 | Wormhole Labs, Inc. | Experience analytic objects, systems and methods |
CA2881860A1 (en) * | 2012-08-27 | 2014-03-06 | Thomson Licensing | Method and apparatus for estimating motion homogeneity for video quality assessment |
FR2996978B1 (fr) * | 2012-10-11 | 2015-10-16 | Tdf | Detection de gel d'image |
CN103747238B (zh) * | 2013-02-20 | 2015-07-08 | 华为技术有限公司 | 视频静止失真程度评估方法和装置 |
CN108632666B (zh) * | 2017-03-15 | 2021-03-05 | 华为技术有限公司 | 一种视频检测方法及视频检测设备 |
WO2020158095A1 (ja) * | 2019-02-01 | 2020-08-06 | 株式会社Nttドコモ | 評価装置 |
EP3989530A1 (en) | 2020-10-23 | 2022-04-27 | Axis AB | Generating substitute image frames based on camera motion |
JP2023144519A (ja) * | 2022-03-28 | 2023-10-11 | ラピステクノロジー株式会社 | 映像信号処理装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101146226A (zh) * | 2007-08-10 | 2008-03-19 | 中国传媒大学 | 一种基于自适应st区的高清视频图像质量评价方法及装置 |
CN101282481A (zh) * | 2008-05-09 | 2008-10-08 | 中国传媒大学 | 一种基于人工神经网络的视频质量评价方法 |
CN101411208A (zh) * | 2006-04-05 | 2009-04-15 | 高通股份有限公司 | 视频编码的时间质量度量 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10150665A (ja) * | 1996-09-20 | 1998-06-02 | Hitachi Ltd | 予測画像の作成方法及び画像符号化方法及び画像符号化装置 |
US6804294B1 (en) * | 1998-08-11 | 2004-10-12 | Lucent Technologies Inc. | Method and apparatus for video frame selection for improved coding quality at low bit-rates |
CN100477789C (zh) * | 2003-06-20 | 2009-04-08 | 松下电器产业株式会社 | 一种基于运动联合图像专家组2000的图像帧间增强方法 |
US8494052B2 (en) | 2006-04-07 | 2013-07-23 | Microsoft Corporation | Dynamic selection of motion estimation search ranges and extended motion vector ranges |
JP4802183B2 (ja) * | 2007-12-28 | 2011-10-26 | 日本電信電話株式会社 | マルチメディア総合品質推定方法および装置 |
-
2010
- 2010-07-30 CN CN2010800683107A patent/CN103385000A/zh active Pending
- 2010-07-30 BR BR112013002361A patent/BR112013002361A2/pt not_active IP Right Cessation
- 2010-07-30 US US13/811,657 patent/US8675075B2/en active Active
- 2010-07-30 WO PCT/CN2010/001150 patent/WO2012012914A1/en active Application Filing
- 2010-07-30 KR KR1020137002489A patent/KR20130090881A/ko active IP Right Grant
- 2010-07-30 EP EP10855142.5A patent/EP2599310B1/en active Active
- 2010-07-30 AU AU2010358309A patent/AU2010358309B2/en not_active Ceased
- 2010-07-30 JP JP2013520938A patent/JP5751648B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101411208A (zh) * | 2006-04-05 | 2009-04-15 | 高通股份有限公司 | 视频编码的时间质量度量 |
CN101146226A (zh) * | 2007-08-10 | 2008-03-19 | 中国传媒大学 | 一种基于自适应st区的高清视频图像质量评价方法及装置 |
CN101282481A (zh) * | 2008-05-09 | 2008-10-08 | 中国传媒大学 | 一种基于人工神经网络的视频质量评价方法 |
Non-Patent Citations (2)
Title |
---|
STEFAN WINKLER等: "The Evolution of Video Quality Measurement:From PSNR to Hybrid Metrics", 《IEEE TRANSACTIONS ON BROADCASTING》, vol. 54, no. 3, 1 September 2008 (2008-09-01) * |
ULRICH ENGELKE等: "Perceptual-based Quality Metrics for Image and Video Services: A Survey", 《NEXT GENERATION INTERNET NETWORKS》, 1 May 2007 (2007-05-01) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105049915A (zh) * | 2015-06-30 | 2015-11-11 | 株洲南车时代电气股份有限公司 | 一种机车视频数据完整性自动检测方法 |
WO2023011098A1 (zh) * | 2021-08-06 | 2023-02-09 | 腾讯科技(深圳)有限公司 | 一种数据传输方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
AU2010358309A1 (en) | 2013-02-14 |
EP2599310B1 (en) | 2018-04-04 |
EP2599310A4 (en) | 2015-12-02 |
AU2010358309B2 (en) | 2014-12-04 |
EP2599310A1 (en) | 2013-06-05 |
BR112013002361A2 (pt) | 2016-05-24 |
JP2013537748A (ja) | 2013-10-03 |
WO2012012914A1 (en) | 2012-02-02 |
US8675075B2 (en) | 2014-03-18 |
JP5751648B2 (ja) | 2015-07-22 |
KR20130090881A (ko) | 2013-08-14 |
US20130120587A1 (en) | 2013-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103385000A (zh) | 用于测量视频质量的方法和装置 | |
Lin et al. | A versatile model for packet loss visibility and its application to packet prioritization | |
Bampis et al. | Towards perceptually optimized end-to-end adaptive video streaming | |
JP7072754B2 (ja) | ストリーミング・ビデオの自動体感品質測定のための方法及びシステム | |
KR100977694B1 (ko) | 비디오 코딩용 순간 품질 메트릭 | |
Xue et al. | Assessing quality of experience for adaptive HTTP video streaming | |
CN107247733B (zh) | 一种视频片段观看热度分析方法及系统 | |
EP2727344B1 (en) | Frame encoding selection based on frame similarities and visual quality and interests | |
CN107454446A (zh) | 基于体验质量分析的视频帧管理方法及其装置 | |
Cherif et al. | A_PSQA: Efficient real-time video streaming QoE tool in a future media internet context | |
KR20140135240A (ko) | 멀티미디어 품질 평가 방법 및 장치 | |
CN112887795B (zh) | 视频播放方法、装置、设备和介质 | |
CN111093069A (zh) | 一种全景视频流的质量评估方法及装置 | |
Zhang et al. | Quality-of-experience evaluation for digital twins in 6G network environments | |
CN111083125B (zh) | 神经网络优化的无参考自适应流媒体质量评价方法及系统 | |
WO2016164874A1 (en) | System and method for determinig and utilizing priority maps in video | |
Martínez-Rach et al. | Quality assessment metrics vs. PSNR under packet lossscenarios in manet wireless networks | |
Ickin et al. | Studying the challenges in assessing the perceived quality of mobile-phone based video | |
Almohamedh et al. | Subjective Assessment of Mobile Videos Quality for Long Term Evolution (LTE) Cellular Networks | |
Ghosh et al. | M-3R: A Memory Based Approach for Streaming QoE Prediction under 3R settings | |
Atzori | Observing the Users to Estimate the Perceived Quality: Challenges and Technologies. | |
Krause et al. | A quality metric for use with frame-rate based bandwidth adaptation algorithms | |
Bampis et al. | Subjective analysis of an end-to-end streaming system | |
Almohamedh et al. | Mobile Video Quality Prediction (MVQP) for Long Term Evolution (LTE) | |
Narapareddy | QoE Performance Evaluation by Introducing Video Freeze on Mobile Multimedia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20131106 |
|
WD01 | Invention patent application deemed withdrawn after publication |