JP7479750B2 - 仮想ビデオライブ放送処理方法及び装置、電子機器 - Google Patents
仮想ビデオライブ放送処理方法及び装置、電子機器 Download PDFInfo
- Publication number
- JP7479750B2 JP7479750B2 JP2023521162A JP2023521162A JP7479750B2 JP 7479750 B2 JP7479750 B2 JP 7479750B2 JP 2023521162 A JP2023521162 A JP 2023521162A JP 2023521162 A JP2023521162 A JP 2023521162A JP 7479750 B2 JP7479750 B2 JP 7479750B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- image
- live broadcast
- data
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 28
- 238000000034 method Methods 0.000 claims description 69
- 230000007704 transition Effects 0.000 claims description 57
- 238000012545 processing Methods 0.000 claims description 50
- 230000008569 process Effects 0.000 claims description 47
- 230000004044 response Effects 0.000 claims description 39
- 230000008921 facial expression Effects 0.000 claims description 29
- 230000015572 biosynthetic process Effects 0.000 claims description 27
- 230000001815 facial effect Effects 0.000 claims description 27
- 238000003786 synthesis reaction Methods 0.000 claims description 27
- 238000009877 rendering Methods 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 11
- 230000002194 synthesizing effect Effects 0.000 claims description 10
- 230000007613 environmental effect Effects 0.000 claims description 8
- 238000007499 fusion processing Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 20
- 238000006243 chemical reaction Methods 0.000 description 16
- 230000009471 action Effects 0.000 description 13
- 238000013473 artificial intelligence Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000007906 compression Methods 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000006835 compression Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 230000036461 convulsion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/40—3D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23424—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234336—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by media transcoding, e.g. video is transformed into a slideshow of still pictures or audio is converted into text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234381—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the temporal resolution, e.g. decreasing the frame rate by frame skipping
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/239—Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests
- H04N21/2393—Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests involving handling client requests
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8547—Content authoring involving timestamps for synchronizing content
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Processing Or Creating Images (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
データ決定モジュール1010は、テキストデータを取得し、且つ上記テキストデータに対応する合成すべきビデオデータを決定することに用いられ、
第1ビデオ合成モジュール1020は、上記合成すべきビデオデータに基づきライブ放送ビデオストリームをリアルタイムに合成し、且つ上記ライブ放送ビデオストリームをライブ放送クライアントにプッシュすることに用いられ、
中断応答モジュール1030は、ライブ放送中断要求を受信すると、上記ライブ放送中断要求に応答してライブ放送ビデオストリームを合成していない上記合成すべきビデオデータの中からターゲットビデオデータを決定することに用いられ、
第2ビデオ合成モジュール1040は、上記ターゲットビデオデータに基づき中断移行ビデオストリームを合成し、且つ上記中断移行ビデオストリームを上記ライブ放送クライアントにプッシュすることに用いられる。
101 端末機器
102 端末機器
103 端末機器
104 ネットワーク
105 サーバ
200 コンピュータシステム
201 中央処理ユニット(CPU)
202 専用メモリ(ROM)
203 ランダムアクセスメモリ(RAM)
204 バス
205 I/Oインタフェース
206 入力部分
207 出力部分
208 記憶部分
209 通信部分
210 ドライバ
211 リムーバブル媒体
410 ライブ放送クライアント
420 仮想ビデオライブ放送サーバ端末
421 テキスト音声変換モジュール
422 三次元レンダリングモジュール
423 ビデオストリームプッシュモジュール
1000 仮想ビデオライブ放送処理装置
1010 データ決定モジュール
1020 第1ビデオ合成モジュール
1030 中断応答モジュール
1040 第2ビデオ合成モジュール
Claims (15)
- 電子機器により実行される、仮想ビデオライブ放送処理方法であって、前記方法は、
テキストデータを取得し、且つ前記テキストデータに対応する合成すべきビデオデータを決定するステップと、
前記合成すべきビデオデータに基づきライブ放送ビデオストリームをリアルタイムに合成し、且つ前記ライブ放送ビデオストリームをライブ放送クライアントにプッシュするステップと、
ライブ放送中断要求を受信すると、前記ライブ放送中断要求に応答してライブ放送ビデオストリームを合成していない前記合成すべきビデオデータの中からターゲットビデオデータを決定するステップと、
前記ターゲットビデオデータに基づき中断移行ビデオストリームを合成し、且つ前記中断移行ビデオストリームを前記ライブ放送クライアントにプッシュするステップと、を含む、仮想ビデオライブ放送処理方法。 - 前記合成すべきビデオデータはオーディオデータ及びビデオ出力画像を含み、
テキストデータを取得し、且つ前記テキストデータに対応する合成すべきビデオデータを決定する前記ステップは、
前記テキストデータに関する関連テキストデータを決定し、前記テキストデータと前記関連テキストデータをターゲットテキストとするステップと、
前記ターゲットテキストを対応するターゲット単語ベクトルに転換し、前記ターゲット単語ベクトルに対して符号化処理及び復号処理を行うことによって、前記ターゲット単語ベクトルのオーディオ特徴を生成するステップと、
前記オーディオ特徴に対して合成処理を行うことによって、前記オーディオデータを生成するステップと、
前記ターゲットテキストに対応する表情特徴データを決定し、且つ前記表情特徴データに基づき前記ビデオ出力画像を生成するステップと、を含む、請求項1に記載の仮想ビデオライブ放送処理方法。 - 前記ターゲットテキストに対応する表情特徴データを決定し、且つ前記表情特徴データに基づき前記ビデオ出力画像を生成する前記ステップは、
前記表情特徴データに対してレンダリング処理を行うことによって、仮想オブジェクトに対応する顔画像を生成するステップと、
前記顔画像にマッチングする背景画像を決定するステップであって、前記背景画像は前記仮想オブジェクトの肢体動作情報及び環境背景情報を含む、ステップと、
前記顔画像と前記背景画像とに対して画像融合処理を行うことによって、前記ビデオ出力画像を生成するステップと、を含む、請求項2に記載の仮想ビデオライブ放送処理方法。 - 前記顔画像にマッチングする背景画像を決定する前記ステップは、
前記顔画像の時系列に揃えられた前記オーディオデータのオーディオ時間長さを決定するステップと、
前記オーディオ時間長さに基づき出力ビデオのビデオ時間長さを決定するステップと、
前記ビデオ時間長さに基づき、予め記憶された背景画像セットから前記顔画像にマッチングする背景画像を決定するステップと、を含む、請求項3に記載の仮想ビデオライブ放送処理方法。 - 前記ビデオ時間長さに基づき、予め記憶された背景画像セットから前記顔画像にマッチングする背景画像を決定する前記ステップは、
前記ビデオ時間長さにおける前記出力ビデオに含まれる前記仮想オブジェクトのオブジェクト動作数を決定するステップと、
前記オブジェクト動作数に基づき前記背景画像セットから同数のグループの背景画像を、前記顔画像にマッチングする背景画像として決定するステップと、を含む、請求項4に記載の仮想ビデオライブ放送処理方法。 - ライブ放送中断要求を受信すると、前記ライブ放送中断要求に応答してライブ放送ビデオストリームを合成していない前記合成すべきビデオデータの中からターゲットビデオデータを決定する前記ステップは、
前記ライブ放送中断要求に応答して、ライブ放送ビデオストリームを合成していない前記合成すべきビデオデータの中から残りビデオ出力データを決定し、且つ前記残りビデオ出力データに基づきターゲットビデオ画像を決定するステップと、
前記ライブ放送中断要求に応答して、ライブ放送ビデオストリームを合成していない前記合成すべきビデオデータの中から残りオーディオデータを決定し、且つ前記残りオーディオデータ及び前記ターゲットビデオ画像に基づきターゲットオーディオデータを決定するステップと、
前記ターゲットビデオ画像及び前記ターゲットオーディオデータを前記ターゲットビデオデータとするステップと、を含む、請求項1に記載の仮想ビデオライブ放送処理方法。 - 前記残りビデオ出力データは残りビデオ出力画像を含み、
前記ライブ放送中断要求に応答して、ライブ放送ビデオストリームを合成していない前記合成すべきビデオデータの中から残りビデオ出力データを決定し、且つ前記残りビデオ出力データに基づきターゲットビデオ画像を決定する前記ステップは、
前記残りビデオ出力画像に対応する残り画像フレーム時間長さを決定するステップと、
前記残り画像フレーム時間長さが時間長さ閾値よりも大きければ、フレームスキップ歩長を決定するステップと、
前記フレームスキップ歩長に基づき前記残りビデオ出力画像の中から前記ターゲットビデオ画像を決定するステップと、を含む、請求項6に記載の仮想ビデオライブ放送処理方法。 - 前記残り画像フレーム時間長さが時間長さ閾値よりも大きければ、フレームスキップ歩長を決定する前記ステップは、
前記残りビデオ出力画像に対応する画像フレームレートを取得し、且つ前記残りビデオ出力画像の残り画像数を決定するステップと、
前記残り画像数及び前記画像フレームレートに基づき前記フレームスキップ歩長を決定するステップと、を含み、
前記フレームスキップ歩長に基づき前記残りビデオ出力画像の中から前記ターゲットビデオ画像を決定する前記ステップは、
時間順序に従い、且つ前記フレームスキップ歩長に基づき前記残りビデオ出力画像の中から前記ターゲットビデオ画像を決定するステップを含む、請求項7に記載の仮想ビデオライブ放送処理方法。 - 時間順序に従い、且つ前記フレームスキップ歩長に基づき前記残りビデオ出力画像の中から前記ターゲットビデオ画像を決定する前記ステップは、
前記残りビデオ出力画像中の最初フレーム画像及び最終フレーム画像を取得するステップと、
前記時間順序に従い前記最初フレーム画像から開始し、前記フレームスキップ歩長おきに前記残りビデオ出力画像の中から中間画像を決定するステップと、
前記最初フレーム画像、前記中間画像及び前記最終フレーム画像を前記ターゲットビデオ画像とするステップと、を含む、請求項8に記載の仮想ビデオライブ放送処理方法。 - 時間順序に従い、且つ前記フレームスキップ歩長に基づき前記残りビデオ出力画像の中から前記ターゲットビデオ画像を決定する前記ステップは、
前記フレームスキップ歩長に基づき前記ターゲットビデオ画像のターゲット画像数を決定するステップと、
前記残りビデオ出力画像のうち隣接する2つの画像間の画像類似度を決定するステップと、
前記画像類似度に基づき前記残りビデオ出力画像の中から前記ターゲット画像数を超えない前記ターゲットビデオ画像を決定するステップと、を含む、請求項7に記載の仮想ビデオライブ放送処理方法。 - 前記ライブ放送中断要求に応答して、ライブ放送ビデオストリームを合成していない前記合成すべきビデオデータの中から残りオーディオデータを決定し、且つ前記残りオーディオデータ及び前記ターゲットビデオ画像に基づきターゲットオーディオデータを決定する前記ステップは、
前記残りオーディオデータの残りオーディオ時間長さを決定するステップと、
前記残りオーディオ時間長さが前記時間長さ閾値よりも大きければ、前記残りオーディオデータを削除するステップと、
前記ターゲットビデオ画像に対応するターゲット画像フレーム時間長さを決定するステップと、
前記ターゲット画像フレーム時間長さに基づき前記ターゲットオーディオデータを生成するステップと、を含む、請求項6に記載の仮想ビデオライブ放送処理方法。 - 前記ターゲットビデオデータは中断移行アニメーションを含み、
ライブ放送中断要求を受信すると、前記ライブ放送中断要求に応答してライブ放送ビデオストリームを合成していない前記合成すべきビデオデータの中からターゲットビデオデータを決定する前記ステップは、
前記ライブ放送中断要求に応答してライブ放送ビデオストリームを合成していない前記合成すべきビデオデータ中の1番目のビデオ出力画像を第1中断画像とするステップと、
前記ライブ放送中断要求に応答してライブ放送ビデオストリームを合成していない前記合成すべきビデオデータ中の最後の1つのビデオ出力画像を第2中断画像とするステップと、
前記第1中断画像及び前記第2中断画像に基づき予め設定された時間長さの前記中断移行アニメーションを生成するステップと、を含む、請求項1に記載の仮想ビデオライブ放送処理方法。 - 仮想ビデオライブ放送処理装置であって、前記装置は電子機器内に配備され、前記装置は、
テキストデータを取得し、且つ前記テキストデータに対応する合成すべきビデオデータを決定することに用いられるデータ決定モジュールと、
前記合成すべきビデオデータに基づきライブ放送ビデオストリームをリアルタイムに合成し、且つ前記ライブ放送ビデオストリームをライブ放送クライアントにプッシュすることに用いられる第1ビデオ合成モジュールと、
ライブ放送中断要求を受信すると、前記ライブ放送中断要求に応答してライブ放送ビデオストリームを合成していない前記合成すべきビデオデータの中からターゲットビデオデータを決定することに用いられる中断応答モジュールと、
前記ターゲットビデオデータに基づき中断移行ビデオストリームを合成し、且つ前記中断移行ビデオストリームを前記ライブ放送クライアントにプッシュすることに用いられる第2ビデオ合成モジュールと、を含む、仮想ビデオライブ放送処理装置。 - 仮想ビデオライブ放送処理用の電子機器であって、
プロセッサと、
メモリと、を含み、前記メモリにコンピュータ可読命令が記憶されており、前記コンピュータ可読命令が前記プロセッサにより実行されると、請求項1~12のいずれか一項に記載の仮想ビデオライブ放送処理方法を実現する、仮想ビデオライブ放送処理用の電子機器。 - 請求項1~12のいずれか一項に記載の仮想ビデオライブ放送処理方法を実現するように構成された、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011356995.7A CN112543342B (zh) | 2020-11-26 | 2020-11-26 | 虚拟视频直播处理方法及装置、存储介质、电子设备 |
CN202011356995.7 | 2020-11-26 | ||
PCT/CN2021/123818 WO2022111110A1 (zh) | 2020-11-26 | 2021-10-14 | 虚拟视频直播处理方法及装置、存储介质、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023545050A JP2023545050A (ja) | 2023-10-26 |
JP7479750B2 true JP7479750B2 (ja) | 2024-05-09 |
Family
ID=75017011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023521162A Active JP7479750B2 (ja) | 2020-11-26 | 2021-10-14 | 仮想ビデオライブ放送処理方法及び装置、電子機器 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11991423B2 (ja) |
EP (1) | EP4195668A4 (ja) |
JP (1) | JP7479750B2 (ja) |
CN (1) | CN112543342B (ja) |
WO (1) | WO2022111110A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112543342B (zh) | 2020-11-26 | 2023-03-14 | 腾讯科技(深圳)有限公司 | 虚拟视频直播处理方法及装置、存储介质、电子设备 |
CN113490054B (zh) * | 2021-07-01 | 2024-07-09 | 网易(杭州)网络有限公司 | 虚拟角色控制方法、装置、设备及存储介质 |
CN113891133B (zh) * | 2021-12-06 | 2022-04-22 | 阿里巴巴达摩院(杭州)科技有限公司 | 多媒体信息的播放方法、装置、设备及存储介质 |
CN114125569B (zh) * | 2022-01-27 | 2022-07-15 | 阿里巴巴(中国)有限公司 | 直播处理方法以及装置 |
CN114866802B (zh) * | 2022-04-14 | 2024-04-19 | 青岛海尔科技有限公司 | 视频流的发送方法和装置、存储介质及电子装置 |
CN115022655B (zh) * | 2022-05-19 | 2024-07-16 | 咪咕文化科技有限公司 | 直播卡顿处理方法、装置、电子设备及可读存储介质 |
CN115002088B (zh) * | 2022-06-09 | 2023-06-02 | 厦门熵基科技有限公司 | 一种视频流的推流和存储方法及系统 |
CN115767115A (zh) * | 2022-09-30 | 2023-03-07 | 广州安思创信息技术有限公司 | 直播画面处理方法、装置、设备及存储介质 |
CN115426536B (zh) * | 2022-11-02 | 2023-01-20 | 北京优幕科技有限责任公司 | 音视频生成方法及装置 |
CN116958331B (zh) * | 2023-09-20 | 2024-01-19 | 四川蜀天信息技术有限公司 | 一种音画同步的调整方法、装置和电子设备 |
CN118338092B (zh) * | 2024-06-12 | 2024-08-09 | 江苏物润船联网络股份有限公司 | 一种语音驱动数字人的方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090044112A1 (en) | 2007-08-09 | 2009-02-12 | H-Care Srl | Animated Digital Assistant |
JP2009060353A (ja) | 2007-08-31 | 2009-03-19 | Mitsubishi Electric Corp | コンテンツ配信装置、及び移動端末装置、並びにコンテンツ配信システム、コンテンツ配信方法、コンテンツ受信方法、及びコンテンツ配信プログラム |
JP2017076028A (ja) | 2015-10-14 | 2017-04-20 | 富士通株式会社 | 音声合成装置及び音声合成方法 |
JP2018133664A (ja) | 2017-02-14 | 2018-08-23 | 日本放送協会 | 配信装置およびプログラム |
CN110298906A (zh) | 2019-06-28 | 2019-10-01 | 北京百度网讯科技有限公司 | 用于生成信息的方法和装置 |
US20200359104A1 (en) | 2018-04-25 | 2020-11-12 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for pushing subtitle data, subtitle display method and apparatus, device and medium |
JP2021533400A (ja) | 2018-08-23 | 2021-12-02 | グーグル エルエルシーGoogle LLC | マルチアシスタント環境の特性によるアシスタント応答性の規制 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4820136B2 (ja) * | 2005-09-22 | 2011-11-24 | パナソニック株式会社 | 映像音声記録装置及び映像音声記録方法 |
US9031381B2 (en) * | 2006-07-20 | 2015-05-12 | Panopto, Inc. | Systems and methods for generation of composite video from multiple asynchronously recorded input streams |
CN103997680B (zh) * | 2014-06-06 | 2017-10-24 | 上海众源网络有限公司 | 一种视频码流的切换方法及装置 |
CN107370980A (zh) * | 2016-05-11 | 2017-11-21 | 中兴通讯股份有限公司 | 视频切换方法、装置及系统 |
CN107277599A (zh) * | 2017-05-31 | 2017-10-20 | 珠海金山网络游戏科技有限公司 | 一种虚拟现实的直播方法、装置和系统 |
US10467792B1 (en) * | 2017-08-24 | 2019-11-05 | Amazon Technologies, Inc. | Simulating communication expressions using virtual objects |
CN108307248B (zh) * | 2018-02-01 | 2019-10-29 | 腾讯科技(深圳)有限公司 | 视频播放方法、装置、计算设备及存储介质 |
SE1851667A1 (en) * | 2018-12-21 | 2020-06-22 | Net Insight Intellectual Property Ab | Method for ad pod handling in live media streaming |
CN109889914B (zh) * | 2019-03-08 | 2021-04-02 | 腾讯科技(深圳)有限公司 | 视频画面推送方法、装置、计算机设备及存储介质 |
CN109922355B (zh) * | 2019-03-29 | 2020-04-17 | 广州虎牙信息科技有限公司 | 虚拟形象直播方法、虚拟形象直播装置和电子设备 |
CN110868635B (zh) * | 2019-12-04 | 2021-01-12 | 深圳追一科技有限公司 | 视频处理方法、装置、电子设备及存储介质 |
CN111050187B (zh) * | 2019-12-09 | 2020-12-15 | 腾讯科技(深圳)有限公司 | 一种虚拟视频处理的方法、装置及存储介质 |
CN111010586B (zh) * | 2019-12-19 | 2021-03-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的直播方法、装置、设备及存储介质 |
CN111010589B (zh) * | 2019-12-19 | 2022-02-25 | 腾讯科技(深圳)有限公司 | 基于人工智能的直播方法、装置、设备及存储介质 |
CN111182358B (zh) * | 2019-12-30 | 2021-09-28 | 腾讯科技(深圳)有限公司 | 视频处理方法、视频播放方法、装置、设备和存储介质 |
CN111866529A (zh) * | 2020-06-05 | 2020-10-30 | 江苏遨信科技有限公司 | 一种在视频直播时混合使用虚拟真人的方法及其系统 |
US11683538B2 (en) * | 2020-09-03 | 2023-06-20 | Meta Platforms, Inc. | Live group video streaming |
CN112543342B (zh) * | 2020-11-26 | 2023-03-14 | 腾讯科技(深圳)有限公司 | 虚拟视频直播处理方法及装置、存储介质、电子设备 |
-
2020
- 2020-11-26 CN CN202011356995.7A patent/CN112543342B/zh active Active
-
2021
- 2021-10-14 EP EP21896612.5A patent/EP4195668A4/en active Pending
- 2021-10-14 WO PCT/CN2021/123818 patent/WO2022111110A1/zh active Application Filing
- 2021-10-14 JP JP2023521162A patent/JP7479750B2/ja active Active
-
2022
- 2022-10-06 US US17/961,133 patent/US11991423B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090044112A1 (en) | 2007-08-09 | 2009-02-12 | H-Care Srl | Animated Digital Assistant |
JP2009060353A (ja) | 2007-08-31 | 2009-03-19 | Mitsubishi Electric Corp | コンテンツ配信装置、及び移動端末装置、並びにコンテンツ配信システム、コンテンツ配信方法、コンテンツ受信方法、及びコンテンツ配信プログラム |
JP2017076028A (ja) | 2015-10-14 | 2017-04-20 | 富士通株式会社 | 音声合成装置及び音声合成方法 |
JP2018133664A (ja) | 2017-02-14 | 2018-08-23 | 日本放送協会 | 配信装置およびプログラム |
US20200359104A1 (en) | 2018-04-25 | 2020-11-12 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for pushing subtitle data, subtitle display method and apparatus, device and medium |
JP2021533400A (ja) | 2018-08-23 | 2021-12-02 | グーグル エルエルシーGoogle LLC | マルチアシスタント環境の特性によるアシスタント応答性の規制 |
CN110298906A (zh) | 2019-06-28 | 2019-10-01 | 北京百度网讯科技有限公司 | 用于生成信息的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
EP4195668A1 (en) | 2023-06-14 |
JP2023545050A (ja) | 2023-10-26 |
CN112543342A (zh) | 2021-03-23 |
CN112543342B (zh) | 2023-03-14 |
US11991423B2 (en) | 2024-05-21 |
EP4195668A4 (en) | 2024-05-29 |
WO2022111110A1 (zh) | 2022-06-02 |
US20230033378A1 (en) | 2023-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7479750B2 (ja) | 仮想ビデオライブ放送処理方法及び装置、電子機器 | |
WO2022166709A1 (zh) | 虚拟视频直播处理方法及装置、存储介质、电子设备 | |
CN111010586B (zh) | 基于人工智能的直播方法、装置、设备及存储介质 | |
CN111010589B (zh) | 基于人工智能的直播方法、装置、设备及存储介质 | |
CN112333179B (zh) | 虚拟视频的直播方法、装置、设备及可读存储介质 | |
CN113392201A (zh) | 信息交互方法、装置、电子设备、介质和程序产品 | |
CN112669417B (zh) | 虚拟形象的生成方法、装置、存储介质及电子设备 | |
WO2022106654A2 (en) | Methods and systems for video translation | |
CN107979763B (zh) | 一种虚拟现实设备生成视频、播放方法、装置及系统 | |
CN114895817B (zh) | 交互信息处理方法、网络模型的训练方法及装置 | |
CN110931042A (zh) | 同声传译方法、装置、电子设备以及存储介质 | |
CN110880198A (zh) | 动画生成方法和装置 | |
CN112652041B (zh) | 虚拟形象的生成方法、装置、存储介质及电子设备 | |
CN115272537A (zh) | 基于因果卷积的音频驱动表情方法及装置 | |
CN112668407A (zh) | 人脸关键点生成方法、装置、存储介质及电子设备 | |
CN110047121A (zh) | 端到端的动画生成方法、装置及电子设备 | |
CN116168108A (zh) | 文本生成图像的方法及装置、存储介质及电子设备 | |
CN116524924A (zh) | 数字人交互控制方法、装置、电子设备和存储介质 | |
CN113282791B (zh) | 视频生成方法和装置 | |
CN117370605A (zh) | 一种虚拟数字人驱动方法、装置、设备和介质 | |
WO2024174414A1 (zh) | 视频合成方法、装置、存储介质和电子设备 | |
CN117893652A (zh) | 视频生成方法以及参数生成模型训练方法 | |
CN117292022A (zh) | 基于虚拟对象的视频生成方法、装置及电子设备 | |
CN115690277A (zh) | 视频生成方法、系统、装置、电子设备和计算机存储介质 | |
CN117373455B (zh) | 一种音视频的生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230405 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230405 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240418 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7479750 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |