CN110072119B - 一种基于深度学习网络的内容感知视频自适应传输方法 - Google Patents
一种基于深度学习网络的内容感知视频自适应传输方法 Download PDFInfo
- Publication number
- CN110072119B CN110072119B CN201910290831.XA CN201910290831A CN110072119B CN 110072119 B CN110072119 B CN 110072119B CN 201910290831 A CN201910290831 A CN 201910290831A CN 110072119 B CN110072119 B CN 110072119B
- Authority
- CN
- China
- Prior art keywords
- video
- content
- client
- deep learning
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000005540 biological transmission Effects 0.000 title claims abstract description 27
- 238000013135 deep learning Methods 0.000 title claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 8
- 230000008447 perception Effects 0.000 claims abstract description 6
- 238000013528 artificial neural network Methods 0.000 claims description 19
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 240000007839 Kleinhovia hospita Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明为一种基于深度学习网络的内容感知视频自适应传输方法。该发明是一种新的视频传输框架,可以有效利用客户端的计算能力。可根据视频的类型,在服务端进行特定的内容感知处理,提取核心有效信息进行编码处理,在客户端,对服务器中所下载视频进行清晰度重构,从而可以对较低质量的视频经过深度学习网络的处理达到一个较好的视频质量,该方法能够有效减少视频流对带宽的依赖性并提高用户的观看体验。
Description
技术领域
本发明属于移动网络传输技术领域,涉及到网络传输过程中的服务器端视频部署方式和处理方法,以及请求视频的超分辨率重构处理过程,特别涉及一种基于深度学习网络的内容感知视频自适应传输方法。
背景技术
随着移动互联网技术的不断发展以及智能终端设备的普及,视频服务逐渐在互联网业务中越来越起到了举足轻重的作用。不过,传统的视频传输机制很大程度上依赖网络带宽的状态。所以用户的观看体验会受到网络带宽状态的极大的影响。然而,HTTP自适应流媒体技术(HAS,HTTP Adaptive Streaming)等技术的提出,能够有效的减少视频播放等待时间和充分利用链路带宽等优点,也渐渐成为当前主流的流媒体技术,在智能终端的视频应用中得到了广泛应用。不过,带宽限制始终会成为内容分发网络工作效率低下的主要原因。
在中国专利201711407905中提出了一种基于强化学习的自适应码率视频传输方法以及系统。该方法及系统利用深度神经网络的优化求解和泛化能力,实现了在真实网络环境下最优化视频服务质量体验指标,其中Critic网络用于学习在不同网络状态下选择不同码率所得到视频质量体验指标,而Actor网络利用Critic网络给出的优化目标来最大化视频码率选择所带来的收益,避免了人工特征选择和规则设置带来的效率问题,让本发明的方法更加适用于多样复杂的现实环境,在节省配置调试时间的同时也大大的提高了视频质量体验。。
在中国专利201810195620中提出基于超分辨率重建技术的视频传输系统及传输方法。所述方法包含如下步骤法包括以下步骤:(1)视频接收步骤,网关设备接收视频服务器发送的视频数据;(2)超分辨率重建步骤,网关设备对视频数据进行超分辨率重建;(3)视频发送步骤,网关设备将超分辨率重建后的视频传输给客户端。通过在视频服务器与客户端之间设置网关设备,并使用网关设备作为传递数据的中间部件,并且在转发视频服务器的视频数据之间,对视频数据进行超分辨率重建,然后转发给客户端,客户端既可以是用户的视频播放终端,如电视盒子、手机、电脑等,也可以是下一级的其他网络设备,如交换机、路由器等。视频服务器到网关设备之间通常使用公网传输数据,视频服务器和网关设备之间依旧可以采用现有的传输方式。网关设备可以输出高分辨率的视频数据给客户端,由客户端播放或传输,从而为用户提供更好的视频播放体验。
上述相关发明专利都通过应用了深度学习网络,但它们的侧重点都有所不同,专利1主要强调了在客户端进行视频多切片版本选择时采用深度强化学习网络来预测将要下载的下载块。而专利2主要是在网关设备上接收视频,并将接收到的视频进行超分辨率重建,并将超分辨率重建后的视频传输给客户端。本发明与上述发明专利的区别在于是在服务端进行视频分类和编码再处理,之后在客户端对请求视频进行超分辨率重构,从服务端和客户端两个层面进行处理视频,来达到更好传输效果。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于深度学习网络的内容感知视频自适应传输方法,利用深度学习网络的相关应用,通过卷积神经网络对服务端视频进行处理,采取有效信息;在客户端对视频进行清晰度的再次处理,提升视频应用在移动网络中的用户体验;最终通过在客户端和服务端进行不同的操作,解决带宽资源较差条件下用户观看体验的问题。
为了实现上述目的,本发明采用的技术方案是:
一种基于深度学习网络的内容感知视频自适应传输方法,包括如下步骤:
步骤1,根据视频特征将视频分类;
步骤2,在服务端通过卷积神经网络对视频进行有效信息感知,保留同类视频图像的有效核心信息,模糊非核心区域,在视频传输过程中使用非核心区域的低清视频进行传输;
步骤3,在客户端通过深度学习网络对请求视频进行分辨率重构。
所述步骤1中,采用商业视频平台对不同视频划分种类的方法进行分类,对于无法按照商业视频平台方法划分的视频,通过深度神经网络的方法进行分类,在此过程中,分别计算新视频图像和已有各类视频图像的相似性距离L,当某一类取得min{L},认为两类视频同属一类,放置入已有视频集合。
在视频分类之后,可将视频类型信息写入视频的描述文件。
所述步骤2中,对于不同种类的视频,为每一类视频训练一种内容感知的语义分割网络,达到泛化的内容感知处理。例如,可采用Yolo-v2对象检测算法对各类视频进行内容感知。
所述语义分割网络为卷积深度神经网络,用其提取视频中的核心信息,并采用自适应视频编码的方式,对卷积深度神经网络中输出的核心信息进行高码率编码,对非核心区域进行较低码率编码。
所述较低码率编码方式可为双三线性插值的方式降采样。
所述步骤3中,因为不同终端的计算能力有一定差异,所以在客户端预先准备不同种类的超分辨率重构神经网络,用来适应不同的客户端,客户端根据自适应码率请求算法,来请求服务端预置的视频文件;接收到服务器的视频数据后,对视频数据进行解码,重建视频的图像;将解码数据通过客户端预置好的超分辨率重建模块,对图像进行超分辨率重构,最终生成超分辨率的视频图像。其中,超分辨率重构神经网络是根据不同类型视频训练出的神经网络,网络模型可用SRCNN等。
所述客户端从所请求视频文件中发现视频类型的描述信息,从而在客户端选择与之对应且合理的超分辨率图像清晰度重构神经网络,对服务端响应视频内容进行处理。
所述步骤3中,客户端通过如下方式对请求视频进行分辨率重构:
S1:获取视频数据中一帧视频的数据;
S2:对该帧视频图像解码并重建图像;
S3:对该重建后的图像进行超分辨率重建。
与现有技术相比,本发明通过深度神经网络,可以在尽可能提高视频质量的前提下,降低网络流量和带宽占用资源,有效地降低服务器吞吐压力,降低视频内容提供商的运营成本,同时降低广大普通用户的网络流量消耗,在客户端利用超分辨率重构的思想,能够有效提取特征,利用终端计算能力,实际减少代价,最终有效减少视频卡顿,提高图像质量,带给用户更好的使用体验。
附图说明
图1为本发明整体框架原理示意图。
图2为本发明流程图。
图3为采用的基于深度学习的视频重建技术示意图。
具体实施方式
为了增加对本发明的理解,下面结合附图和实施例详细说明本发明的实施方式。
如图1所示,本发明在服务端和客户端会对视频进行一系列操作,视频传输过程中使用非核心区域的低清视频进行传输,用户终端再将接收视频采用基于深度学习的超分辨图像重建技术重构,最终可以高清地播放,从而能够有效的减少带宽成本。
如图2所示,下面对本发明的技术方案进行详细说明:
Step1:根据视频特征将视频分类。
首先可以将各种不同的视频进行分类成几种大类,可参照优酷,腾讯等商业视频平台对不同视频划分种类的方法;对于无法按照商业视频平台划分的视频,可通过深度神经网络的方法对视频图像进行分类,在此过程中,分别计算新视频图像和已有各类视频图像的相似性距离L,当某一类取得min{L},可认为两类视频同属一类,放置入已有视频集合;其中L可以有很多种定义,可参考感知哈希算法等。
利用感知哈希算法计算视频图像间的相似性的方法如下:
a)缩小尺寸:去除高频和细节的最快方法是缩小图片,将图片缩小到一定的尺寸。不要保持纵横比,只需将其变成一致的正方形。这样就可以比较任意大小的图片,摒弃不同尺寸、比例带来的图片差异;
b)简化色彩:将图片转换成灰度图像;
c)计算平均值:计算所有像素点的灰度平均值;
d)比较像素灰度:将每个像素的灰度,与平均值进行比较。大于或等于平均值,记为1;小于平均值,记为0;
e)计算hash值:将上一步的比较结果,组合在一起,就构成了一个整数,这就是这张图片的指纹;
f)计算相似性:计算这两张图片的hash指纹,然后计算不同位的个数(汉明距离)。如果这个值为一定的阈值,则表示这两张图片非常相似,否则,汉明距离大于一定的阈值,则表明完全不同的图片。欧式距离也可以参考;
f()-----表示映射欧式空间的嵌入函数;
D()----表示欧式平方距离;
P,Q----平方欧式距离。
在视频分类之后,为了方便进一步对视频进行处理,可将视频类型信息写入视频的描述文件。
Step2:在服务端通过卷积神经网络对视频进行有效信息感知,保留同类视频图像的有效核心信息,模糊非核心区域,在视频传输过程中使用非核心区域的低清视频进行传输。
具体地,对于不同种类的视频,为每一类视频训练一种内容感知的语义分割网络,达到泛化的内容感知处理,例如可采用Yolo-v2对象检测算法对各类视频进行内容感知,基于卷积深度神经网络提取视频中的核心信息。
Step3:采用自适应视频编码的方式,对卷积深度神经网络中输出的核心信息进行高码率编码,对非核心区域进行较低码率编码,例如双三线性插值的方式降采样。新处理的图像可以在核心区域达到较高的清晰度,而在非核心区域成为较低清晰度,从而减低网络带宽资源消耗。
Step4:采用编码技术将视频压缩,进一步减少传输的视频大小;现有的编码技术包括H.264、H.265、AVS2等。
Step5:在客户端通过深度学习网络对请求视频进行分辨率重构,参考图3,具体包括:
Step51:在客户端预先准备不同种类视频对应的适合其计算能力的超分辨率图像清晰度重构神经网络,超分辨率重构神经网络是根据不同类型视频训练出的神经网络,网络模型可用SRCNN等;
Step52:客户端根据自适应码率请求算法,来请求服务端预置的视频文件;该方法有多种模型,如剩余残差网络,srcnn等。具体地,客户端可从所请求视频文件中发现视频类型的描述信息,从而在客户端选择与之对应且合理的超分辨率图像清晰度重构神经网络,对服务端响应视频内容进行处理。其中自适应码率请求算法可采用多种客户端HTTPadaptive streaming算法,本发明可参考infocom的BOLA算法。
Step53:接收到服务器的视频数据后,对视频数据进行解码,重建视频的图像;
Step54:将解码数据通过客户端预置好的超分辨率重建模块,对图像进行超分辨率重构,最终生成超分辨率的视频图像,达到一个较好的视频观看体验。
在本发明的一个具体实施例中,采用了如下训练方法:
a)先将低分辨率图像使用双三次差值放大至目标尺寸(如放大至2倍、3倍等),此时仍然称放大至目标尺寸后的图像为低分辨率图像(Low-resolution image),即图中的输入(input),损失函数可用均方误差函数:
其中,y′i表示神经网络的预测值,yi表示标签值,n表示参与训练的图像个数;
b)将低分辨率图像输入三层卷积神经网络,(举例:对YCrCb颜色空间中的Y通道进行重建,网络形式为(conv1+relu1)—(conv2+relu2)—(conv3+relu3))第一层卷积:卷积核尺寸9×9(f1×f1),卷积核数目64(n1),输出64张特征图;第二层卷积:卷积核尺寸1×1(f2×f2),卷积核数目32(n2),输出32张特征图;第三层卷积:卷积核尺寸5×5(f3×f3),卷积核数目1(n3),输出1张特征图即为最终重建高分辨率图像。
则超分辨率重建步骤包括以下步骤:
S1:获取视频数据中一帧视频的数据;
S2:对该帧视频图像解码并重建图像;
S3:对该重建后的图像进行超分辨率重建。
本发明采用以上技术方案,在视频源端把原始视频经过内容提取,得到感知视频,然后进行视频压缩编码,再传输压缩后视频。由于一定程度的减少高码率信息,视频编码数据会极大地减小,所需传输的视频流量也会减小,从而达到减少带宽消耗。在用户接收端,当用户只能接受到视频,选择合适的重构网络进行深度学习的超分辨图像重建方法把传输视频重建并还原成高分辨率视频,从而有效提高了观看体验。SRCNN该重构网络提出轻量的端到端网络SRCNN来解决超分问题,有比传统方法性能更强、速度更快的优点,而且将基于SC(稀疏编码)的超分方法理解为卷积神经网络的一种形式,也是一种进步。
Claims (6)
1.一种基于深度学习网络的内容感知视频自适应传输方法,其特征在于,包括如下步骤:
步骤1,根据视频特征将视频分类;
步骤2,在服务端通过卷积神经网络对视频进行有效信息感知,保留同类视频图像的有效核心信息,模糊非核心区域,在视频传输过程中使用非核心区域的低清视频进行传输,对于不同种类的视频,为每一类视频训练一种内容感知的语义分割网络,达到泛化的内容感知处理;
所述语义分割网络为卷积神经网络,用其提取视频中的核心信息,并采用自适应视频编码的方式,对卷积神经网络中输出的核心信息进行高码率编码,对非核心区域进行较低码率编码,所述较低码率编码为双三线性插值的方式降采样;
步骤3,在客户端预先准备不同种类视频对应的适合其计算能力的超分辨率图像清晰度重构神经网络,超分辨率重构神经网络是根据不同类型视频训练出的神经网络,客户端根据视频文件的类型,选择与之对应的且适合客户端计算能力的超分辨率图像清晰度重构神经网络,对请求视频进行超分辨率重构。
2.根据权利要求1所述基于深度学习网络的内容感知视频自适应传输方法,其特征在于,所述步骤1中,采用商业视频平台对不同视频划分种类的方法进行分类,对于无法按照商业视频平台方法划分的视频,通过深度学习网络的方法进行分类,在此过程中,分别计算新视频图像和已有各类视频图像的相似性距离L,当某一类取得min{L},认为两类视频同属一类,放置入已有视频集合。
3.根据权利要求1所述基于深度学习网络的内容感知视频自适应传输方法,其特征在于,在视频分类之后,将视频类型信息写入视频的描述文件。
4.根据权利要求1所述基于深度学习网络的内容感知视频自适应传输方法,其特征在于,所述步骤2中,采用Yolo-v2对象检测算法对各类视频进行内容感知。
5.根据权利要求1所述基于深度学习网络的内容感知视频自适应传输方法,其特征在于,客户端从所请求视频文件中发现视频类型的描述信息,从而在客户端选择与之对应且适合客户端计算能力的超分辨率图像清晰度重构神经网络,对服务端响应视频内容进行处理。
6.根据权利要求1所述基于深度学习网络的内容感知视频自适应传输方法,其特征在于,所述步骤3中,客户端通过如下方式对请求视频进行分辨率重构:
S1:获取视频数据中一帧视频的数据;
S2:对该帧视频图像解码并重建图像;
S3:对该重建后的图像进行超分辨率重建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910290831.XA CN110072119B (zh) | 2019-04-11 | 2019-04-11 | 一种基于深度学习网络的内容感知视频自适应传输方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910290831.XA CN110072119B (zh) | 2019-04-11 | 2019-04-11 | 一种基于深度学习网络的内容感知视频自适应传输方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110072119A CN110072119A (zh) | 2019-07-30 |
CN110072119B true CN110072119B (zh) | 2020-04-10 |
Family
ID=67367427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910290831.XA Active CN110072119B (zh) | 2019-04-11 | 2019-04-11 | 一种基于深度学习网络的内容感知视频自适应传输方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110072119B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112468830A (zh) * | 2019-09-09 | 2021-03-09 | 阿里巴巴集团控股有限公司 | 视频图像处理方法、装置及电子设备 |
CN110809127B (zh) * | 2019-10-10 | 2021-03-19 | 北京邮电大学 | 一种基于深度模仿学习的视频通话方法及装置 |
CN111405296B (zh) * | 2020-03-11 | 2021-08-20 | 北京邮电大学 | 视频数据传输方法、视频数据处理方法、装置及电子设备 |
CN111770363B (zh) * | 2020-07-10 | 2022-02-11 | 陕西师范大学 | 基于情景感知的低延迟高分辨率移动增强现实系统 |
CN112001347B (zh) * | 2020-08-31 | 2023-07-21 | 重庆科技学院 | 一种基于人体骨架形态与检测目标的动作识别方法 |
CN114586056A (zh) * | 2020-09-30 | 2022-06-03 | 京东方科技集团股份有限公司 | 图像处理方法及装置、设备、视频处理方法及存储介质 |
CN113115060B (zh) * | 2021-04-07 | 2022-10-25 | 中国工商银行股份有限公司 | 视频传输方法、装置及系统 |
CN113709512A (zh) * | 2021-08-26 | 2021-11-26 | 广州虎牙科技有限公司 | 直播数据流交互方法、装置、服务器及可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106162167A (zh) * | 2015-03-26 | 2016-11-23 | 中国科学院深圳先进技术研究院 | 基于学习的高效视频编码方法 |
CN106303527A (zh) * | 2016-08-16 | 2017-01-04 | 广东中星电子有限公司 | 时分复用神经网络处理器的视频分级码流编码方法和架构 |
CN108012157A (zh) * | 2017-11-27 | 2018-05-08 | 上海交通大学 | 用于视频编码分数像素插值的卷积神经网络的构建方法 |
CN108449631A (zh) * | 2017-02-16 | 2018-08-24 | 福希科有限公司 | 使用人脸检测来连接视频序列的系统和方法 |
WO2018176017A1 (en) * | 2017-03-24 | 2018-09-27 | Revealit Corporation | Method, system, and apparatus for identifying and revealing selected objects from video |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101945275B (zh) * | 2010-08-18 | 2012-10-24 | 镇江唐桥微电子有限公司 | 一种基于感兴趣区域的视频编码方法 |
CN103974071A (zh) * | 2013-01-29 | 2014-08-06 | 富士通株式会社 | 基于感兴趣区域的视频编码方法和设备 |
CN104270638A (zh) * | 2014-07-29 | 2015-01-07 | 武汉飞脉科技有限责任公司 | 一种ct影像感兴趣区域压缩与质量评估方法 |
US11166027B2 (en) * | 2016-06-10 | 2021-11-02 | Apple Inc. | Content adaptation for streaming |
CN106407352B (zh) * | 2016-09-06 | 2019-09-10 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于深度学习的交通图像检索方法 |
CN106791927A (zh) * | 2016-12-23 | 2017-05-31 | 福建帝视信息科技有限公司 | 一种基于深度学习的视频增强与传输方法 |
CN108882020B (zh) * | 2017-05-15 | 2021-01-01 | 北京大学 | 一种视频信息处理方法、装置及系统 |
GB2565775A (en) * | 2017-08-21 | 2019-02-27 | Nokia Technologies Oy | A Method, an apparatus and a computer program product for object detection |
CN107704862A (zh) * | 2017-11-06 | 2018-02-16 | 深圳市唯特视科技有限公司 | 一种基于语义实例分割算法的视频对象分割方法 |
CN108564097B (zh) * | 2017-12-05 | 2020-09-22 | 华南理工大学 | 一种基于深度卷积神经网络的多尺度目标检测方法 |
CN108063961B (zh) * | 2017-12-22 | 2020-07-31 | 深圳市云网拜特科技有限公司 | 一种基于强化学习的自适应码率视频传输方法以及系统 |
CN108810538B (zh) * | 2018-06-08 | 2022-04-05 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、终端及存储介质 |
CN108833915A (zh) * | 2018-06-21 | 2018-11-16 | 杭州雄迈集成电路技术有限公司 | 一种自适应跳帧的智能编码方法 |
CN109120936A (zh) * | 2018-09-27 | 2019-01-01 | 贺禄元 | 一种视频图像的解码方法和装置 |
-
2019
- 2019-04-11 CN CN201910290831.XA patent/CN110072119B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106162167A (zh) * | 2015-03-26 | 2016-11-23 | 中国科学院深圳先进技术研究院 | 基于学习的高效视频编码方法 |
CN106303527A (zh) * | 2016-08-16 | 2017-01-04 | 广东中星电子有限公司 | 时分复用神经网络处理器的视频分级码流编码方法和架构 |
CN108449631A (zh) * | 2017-02-16 | 2018-08-24 | 福希科有限公司 | 使用人脸检测来连接视频序列的系统和方法 |
WO2018176017A1 (en) * | 2017-03-24 | 2018-09-27 | Revealit Corporation | Method, system, and apparatus for identifying and revealing selected objects from video |
CN108012157A (zh) * | 2017-11-27 | 2018-05-08 | 上海交通大学 | 用于视频编码分数像素插值的卷积神经网络的构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110072119A (zh) | 2019-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110072119B (zh) | 一种基于深度学习网络的内容感知视频自适应传输方法 | |
US10798386B2 (en) | Video compression with generative models | |
CN109218727B (zh) | 视频处理的方法和装置 | |
CN111970513A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
WO2022111631A1 (zh) | 视频传输方法、服务器、终端和视频传输系统 | |
CN113115067A (zh) | 直播系统、视频处理方法及相关装置 | |
WO2020233483A1 (zh) | 视频编码方法和视频解码方法 | |
CN112868229A (zh) | 用于流传输数据的方法和设备 | |
CN112053408B (zh) | 基于深度学习的人脸图像压缩方法及装置 | |
KR20190093746A (ko) | 신경망을 이용한 컨텐츠 인지 기반 컨텐츠 전송 서버 장치 및 방법 | |
WO2023050720A1 (zh) | 图像处理方法、图像处理装置、模型训练方法 | |
WO2021047177A1 (zh) | 数据编码方法及装置 | |
WO2023061116A1 (zh) | 图像处理网络的训练方法、装置、计算机设备和存储介质 | |
CN113573140A (zh) | 一种支持人脸检测与实时超分辨率的码率自适应决策方法 | |
CN116233445B (zh) | 视频的编解码处理方法、装置、计算机设备和存储介质 | |
CN113452996A (zh) | 一种视频编码、解码方法及装置 | |
CN114827617B (zh) | 一种基于感知模型的视频编解码方法及系统 | |
CN117834944A (zh) | 自适应视频语义通信的方法、装置、电子设备及存储介质 | |
Cucchiara et al. | Semantic transcoding for live video server | |
Yang et al. | Graph-convolution network for image compression | |
CN110072104B (zh) | 一种基于图像级jnd预测的感知图像压缩方法 | |
CN113628121A (zh) | 数据处理、训练多媒体数据的方法和装置 | |
Jeong et al. | Real-Time CNN Training and Compression for Neural-Enhanced Adaptive Live Streaming | |
WO2024164590A1 (zh) | 编解码网络模型的量化方法和相关装置 | |
CN117061792B (zh) | 云视频协作渲染方法、装置及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |