[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR102335096B1 - 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템 - Google Patents

전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템 Download PDF

Info

Publication number
KR102335096B1
KR102335096B1 KR1020210065272A KR20210065272A KR102335096B1 KR 102335096 B1 KR102335096 B1 KR 102335096B1 KR 1020210065272 A KR1020210065272 A KR 1020210065272A KR 20210065272 A KR20210065272 A KR 20210065272A KR 102335096 B1 KR102335096 B1 KR 102335096B1
Authority
KR
South Korea
Prior art keywords
video
background
foreground
image
unit
Prior art date
Application number
KR1020210065272A
Other languages
English (en)
Inventor
손승호
Original Assignee
손승호
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 손승호 filed Critical 손승호
Priority to KR1020210065272A priority Critical patent/KR102335096B1/ko
Application granted granted Critical
Publication of KR102335096B1 publication Critical patent/KR102335096B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/50Lighting effects
    • G06T15/503Blending, e.g. for anti-aliasing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/265Mixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/272Means for inserting a foreground image in a background image, i.e. inlay, outlay

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Graphics (AREA)
  • Processing Or Creating Images (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템이 제공되며, 적어도 하나의 사진 또는 텍스트가 입력되면, 적어도 하나의 사진 또는 텍스트가 원의 외주연을 따라 반복배치되어 회전하는 전경 동영상으로 생성하고, 배경 동영상을 입력받아 전경 동영상을 앞으로 배치하고 배경 동영상이 전경 동영상의 배경으로 위치하도록 배치하여 합성한 후 하나의 영상을 생성하는 사용자 단말 및 사용자 단말로부터 적어도 하나의 사진 또는 텍스트를 입력받는 입력부, 입력된 적어도 하나의 사진 또는 텍스트를 원의 외주연을 따라 반복배치되어 회전하는 효과를 제공하여 전경 동영상을 생성하는 회전효과부, 사용자 단말로부터 배경이 되는 배경 동영상을 입력받고 사운드를 설정받는 배경설정부, 회전효과부에서 생성한 전경 동영상과, 배경설정부에서 입력된 배경 동영상을 합성하는 합성부, 합성부에서 합성된 하나의 영상을 사용자 단말로 제공하는 제공부를 포함하는 제작 서비스 제공 서버를 포함한다.

Description

전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템{SYSTEM FOR PROVIDING VIDEO PRODUCTION SERVICE COMPOSITING FIGURE VIDEO AND GROUND VIDEO}
본 발명은 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템에 관한 것으로, 텍스트나 사진을 반복배열한 후 회전하는 전경 동영상을 생성하고 배경 동영상을 전경 동영상과 합성하여 독특한 영상을 제작할 수 있는 플랫폼을 제공한다.
최근 영상콘텐츠가 증가함에 따라 스마트폰 내에서 쉽게 이미지나 영상을 검색하여 영상편집이 가능하도록 제공해주는 애플리케이션들이 증가하고 있다. 이러한 증가추세는 스마트폰 카메라 기능의 발달과 영상을 활용한 콘텐츠 사업들이 급증하고 있기 때문이다. 아이폰의 IMOVIE, 구글 PHOTO, 네이버의 블로그앱 등이 맞춤형 동영상 편집이 가능하고 플랫폼에 쉽게 업로드할 수 있는 기능을 포함하고 있다. 아이폰의 IMOVIE는 공포, 드라마 등의 장르 형식 편집이 가능하도록 스토리보드 제공 및 추천하는 기능이 탑재되어 있다. 구글 PHOTO는 사용자의 스마트폰에서 촬영된 사진과 동영상을 수집하고 앨범 기능을 활용하여 사진과 동영상을 시각적으로 배치하는 타임라인 기능을 제공한다. 또한, 네이버의 블로그앱은 동영상 촬영, 음성 분리, 자막 편집, 스틸 이미지 추출이 가능하도록 되어 있다. 이들의 공통된 기술지원은 딥러닝(Deep Learning)기술이다.
이때, 사진을 이용하여 동영상을 제작하거나 편집하는 방법이 연구 및 개발되었는데, 이와 관련하여, 선행기술인 한국등록특허 제10-1359623호(2014년02월07일 공고) 및 한국공개특허 제2017-0061836호(2017년06월07일 공개)에는, 유무선 인터넷망이 연결된 상태에서 개방형 표준 플랫폼인 HTML 기반에서 SaaS형태의 콘텐츠 저작 도구를 이용하여 동영상과 이미지 및 목차가 하나의 화면으로 연동되는 콘텐츠를 저작한 다음 업로드하고, 개방형 마켓을 통해 불특정 다수의 PC와 스마트기기에서 앱방식이 아닌 모바일 웹방식으로 제공하거나 판매할 수 있도록 하는 구성과, 동영상 제작서버로부터 제공된 동영상 템플릿 중 사용자에 의해 선택된 어느 하나의 동영상 템플릿에 대응되는 엑셀 템플릿을 제공받아 엑셀 템플릿의 양식에 맞도록 사용자의 데이터 입력에 의해 사용자 맞춤형 엑셀 템플릿을 생성 및 전송하고, 동영상 제작서버는, 각 사용자 단말로부터 사용자에 의해 선택된 동영상 템플릿의 사용자 맞춤형 엑셀 템플릿을 제공받아 사용자에 의해 선택된 동영상 템플릿의 양식에 맞게 사용자 맞춤형 엑셀 템플릿 내의 사용자 입력 데이터를 적용하여 적어도 하나의 사용자 맞춤형 동영상 데이터를 생성하며, 생성된 사용자 맞춤형 동영상 데이터를 사용자 단말로 제공함으로써, 사용자 맞춤형 엑셀 템플릿 및 동영상 템플릿에 의해 동일한 그래픽의 움직임으로서로 다른 내용을 갖는 수십, 수백 개의 사용자 맞춤형 동영상을 한 번에 제작할 수 있는 구성이 각각 개시되어 있다.
다만, 상술한 구성은 사진이나 이미지로부터 하나의 동영상을 생성하거나 편집하는 방법만을 개시할 뿐, 두 개의 동영상을 합성하는 방법은 개시되어 있지 않다. 사용자의 사진을 특수효과를 입혀 움직이는 사진으로 동영상을 만든 후, 생성된 동영상을 다시 배경화면의 역할을 하는 동영상과 함께 합성할 수 있는 방법이 개시되어 있지 않기 때문에, 두 개의 동영상을 합성하여 독특한 영상을 생성하고자 하는 사용자의 니즈가 충족되고 있지 않다. 이에, 동영상을 생성할 때 사진이 회전되는 전경 동영상을 생성하고, 배경 동영상에 전경 동영상을 합성하여 새로운 동영상을 생성하는 방법의 연구 및 개발이 요구된다.
본 발명의 일 실시예는, 어도 하나의 사진, 텍스트 및 이미지를 포함하는 전경 콘텐츠를 이용하여 전경에서 전경 콘텐츠가 회전하는 전경 동영상을 생성하고, 전경 동영상과 합성될 배경 동영상을 배경 콘텐츠로 배치하여 전경 콘텐츠가 전경에, 배경 콘텐츠가 배경에 위치하도록 두 개의 동영상을 합성함으로써, 전문가가 아닌 일반인이라도 결혼식, 돌, 환갑이나 칠순과 같은 가족모임이나 가족잔치에 이용되거나 광고영상으로 이용될 수 있도록 손 쉽게 제작하고 흥미를 끌 수 있도록 하는, 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 방법을 제공할 수 있다. 다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예는, 적어도 하나의 사진 또는 텍스트가 입력되면, 적어도 하나의 사진 또는 텍스트가 원의 외주연을 따라 반복배치되어 회전하는 전경 동영상으로 생성하고, 배경 동영상을 입력받아 전경 동영상을 앞으로 배치하고 배경 동영상이 전경 동영상의 배경으로 위치하도록 배치하여 합성한 후 하나의 영상을 생성하는 사용자 단말 및 사용자 단말로부터 적어도 하나의 사진 또는 텍스트를 입력받는 입력부, 입력된 적어도 하나의 사진 또는 텍스트를 원의 외주연을 따라 반복배치되어 회전하는 효과를 제공하여 전경 동영상을 생성하는 회전효과부, 사용자 단말로부터 배경이 되는 배경 동영상을 입력받고 사운드를 설정받는 배경설정부, 회전효과부에서 생성한 전경 동영상과, 배경설정부에서 입력된 배경 동영상을 합성하는 합성부, 합성부에서 합성된 하나의 영상을 사용자 단말로 제공하는 제공부를 포함하는 제작 서비스 제공 서버를 포함한다.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 적어도 하나의 사진, 텍스트 및 이미지를 포함하는 전경 콘텐츠를 이용하여 전경에서 전경 콘텐츠가 회전하는 전경 동영상을 생성하고, 전경 동영상과 합성될 배경 동영상을 배경 콘텐츠로 배치하여 전경 콘텐츠가 전경에, 배경 콘텐츠가 배경에 위치하도록 두 개의 동영상을 합성함으로써, 전문가가 아닌 일반인이라도 결혼식, 돌, 환갑이나 칠순과 같은 가족모임이나 가족잔치에 이용되거나 광고영상으로 이용될 수 있도록 손 쉽게 제작하고 흥미를 끌 수 있도록 한다.
도 1은 본 발명의 일 실시예에 따른 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템을 설명하기 위한 도면이다.
도 2는 도 1의 시스템에 포함된 제작 서비스 제공 서버를 설명하기 위한 블록 구성도이다.
도 3 및 도 4는 본 발명의 일 실시예에 따른 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스가 구현된 일 실시예를 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 방법을 설명하기 위한 동작 흐름도이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
명세서 전체에서 사용되는 정도의 용어 "약", "실질적으로" 등은 언급된 의미에 고유한 제조 및 물질 허용오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본 발명의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다. 본 발명의 명세서 전체에서 사용되는 정도의 용어 "~(하는) 단계" 또는 "~의 단계"는 "~ 를 위한 단계"를 의미하지 않는다.
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체 지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.
본 명세서에 있어서 단말, 장치 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말, 장치 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말, 장치 또는 디바이스에서 수행될 수도 있다.
본 명세서에서 있어서, 단말과 매핑(Mapping) 또는 매칭(Matching)으로 기술된 동작이나 기능 중 일부는, 단말의 식별 정보(Identifying Data)인 단말기의 고유번호나 개인의 식별정보를 매핑 또는 매칭한다는 의미로 해석될 수 있다.
이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템을 설명하기 위한 도면이다. 도 1을 참조하면, 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템(1)은, 적어도 하나의 사용자 단말(100), 제작 서비스 제공 서버(300), 적어도 하나의 빔 프로젝터(400)를 포함할 수 있다. 다만, 이러한 도 1의 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템(1)은, 본 발명의 일 실시예에 불과하므로, 도 1을 통하여 본 발명이 한정 해석되는 것은 아니다.
이때, 도 1의 각 구성요소들은 일반적으로 네트워크(Network, 200)를 통해 연결된다. 예를 들어, 도 1에 도시된 바와 같이, 적어도 하나의 사용자 단말(100)은 네트워크(200)를 통하여 제작 서비스 제공 서버(300)와 연결될 수 있다. 그리고, 제작 서비스 제공 서버(300)는, 네트워크(200)를 통하여 적어도 하나의 사용자 단말(100), 적어도 하나의 빔 프로젝터(400)와 연결될 수 있다. 또한, 적어도 하나의 빔 프로젝터(400)는, 네트워크(200)를 통하여 제작 서비스 제공 서버(300)와 연결될 수 있다.
여기서, 네트워크는, 복수의 단말 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크의 일 예에는 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷(WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), 5GPP(5th Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), RF(Radio Frequency), 블루투스(Bluetooth) 네트워크, NFC(Near-Field Communication) 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.
하기에서, 적어도 하나의 라는 용어는 단수 및 복수를 포함하는 용어로 정의되고, 적어도 하나의 라는 용어가 존재하지 않더라도 각 구성요소가 단수 또는 복수로 존재할 수 있고, 단수 또는 복수를 의미할 수 있음은 자명하다 할 것이다. 또한, 각 구성요소가 단수 또는 복수로 구비되는 것은, 실시예에 따라 변경가능하다 할 것이다.
적어도 하나의 사용자 단말(100)은, 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 전경 동영상을 만들기 위한 이미지, 사진, 텍스트를 입력하고, 모션이나 효과의 종류를 선택하며, 배경 동영상을 업로드하고 사운드나 배경음악을 선택하거나 입력한 후, 전경 동영상 및 배경 동영상을 합성한 결과물인 영상을 제작하는 단말일 수 있다.
여기서, 적어도 하나의 사용자 단말(100)은, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다. 이때, 적어도 하나의 사용자 단말(100)은, 네트워크를 통해 원격지의 서버나 단말에 접속할 수 있는 단말로 구현될 수 있다. 적어도 하나의 사용자 단말(100)은, 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 네비게이션, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(Smartphone), 스마트 패드(Smartpad), 타블렛 PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.
제작 서비스 제공 서버(300)는, 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 제공하는 서버일 수 있다. 그리고, 제작 서비스 제공 서버(300)는, 적어도 하나의 모션 또는 효과를 제공하고, 사용자 단말(100)에서 업로드한 사진, 텍스트 및 이미지에 선택된 모션이나 효과를 적용하여 전경 동영상을 생성하고, 배경 동영상을 전경 동영상과 합성한 후 영상을 제작하는 서버일 수 있다.
여기서, 제작 서비스 제공 서버(300)는, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다.
적어도 하나의 빔 프로젝터(400)는, 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 사용자 단말(100) 또는 제작 서비스 제공 서버(300)와 연결되고, 사용자 단말(100)에서 제작한 영상을 입력받아 출력하는 장치일 수 있다.
여기서, 적어도 하나의 빔 프로젝터(400)는, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다. 이때, 적어도 하나의 빔 프로젝터(400)는, 네트워크를 통해 원격지의 서버나 단말에 접속할 수 있는 단말로 구현될 수 있다. 적어도 하나의 빔 프로젝터(400)는, 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 네비게이션, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(Smartphone), 스마트 패드(Smartpad), 타블렛 PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.
도 2는 도 1의 시스템에 포함된 제작 서비스 제공 서버를 설명하기 위한 블록 구성도이고, 도 3 및 도 4는 본 발명의 일 실시예에 따른 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스가 구현된 일 실시예를 설명하기 위한 도면이다.
도 2를 참조하면, 제작 서비스 제공 서버(300)는, 입력부(310), 회전부(320), 배경설정부(330), 합성부(340), 제공부(350), 연계부(360), 제어부(370), 색차제거부(380) 및 리듬반영부(390)를 포함할 수 있다.
본 발명의 일 실시예에 따른 제작 서비스 제공 서버(300)나 연동되어 동작하는 다른 서버(미도시)가 적어도 하나의 사용자 단말(100) 및 적어도 하나의 빔 프로젝터(400)로 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 전송하는 경우, 적어도 하나의 사용자 단말(100) 및 적어도 하나의 빔 프로젝터(400)는, 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 설치하거나 열 수 있다. 또한, 웹 브라우저에서 실행되는 스크립트를 이용하여 서비스 프로그램이 적어도 하나의 사용자 단말(100) 및 적어도 하나의 빔 프로젝터(400)에서 구동될 수도 있다. 여기서, 웹 브라우저는 웹(WWW: World Wide Web) 서비스를 이용할 수 있게 하는 프로그램으로 HTML(Hyper Text Mark-up Language)로 서술된 하이퍼 텍스트를 받아서 보여주는 프로그램을 의미하며, 예를 들어 넷스케이프(Netscape), 익스플로러(Explorer), 크롬(Chrome) 등을 포함한다. 또한, 애플리케이션은 단말 상의 응용 프로그램(Application)을 의미하며, 예를 들어, 모바일 단말(스마트폰)에서 실행되는 앱(App)을 포함한다.
도 2를 참조하면, 도 2를 설명하기 이전에 도 2에 설명될 구성의 기본 개념을 이하에서 설명하기로 한다. 도 2를 설명하면서 이하의 기본 개념은 중복하여 설명하지 않는다.
영상 합성 기술은 소스 영상(Source Image)에서 객체를 추출하는 영상분할(Image Segmentation) 과정과 추출된 객체를 목표 영상에 조합하는 영상 블랜딩(Image Blending) 과정으로 구성된다. 동영상에 대한 영상 합성의 경우, 먼저 소스 동영상의 첫 프레임에 대해 사용자가 컴퓨터 마우스 등을 이용하여 대략적인 객체 영역을 선정한다. 이어서 주변 영역에 대해 영상분할 알고리즘을 적용하여 보다 세밀한 형태의 영상분할 마스크를 생성한 후 이를 이용하여 객체를 추출하게 된다. 첫 번째 프레임이 아닌 나머지 프레임들에 대해서는 첫 번째 프레임에서 추출된 객체에 대해 광류(Optical Flow) 등 움직임 추정 기술을 적용하여 움직이는 객체를 추출한다. 영상 블랜딩 과정에서는 먼저 목표 영상(Target Image)에 대해 소스 영상에서 추출된 객체가 이동할 경로를 설정한다. 그리고 다양한 영상 블랜딩 방법들 중 목적에 맞는 블랜딩 방법을 적용하여 최종적인 합성 영상(Composite Image)을 생성한다.
영상 블랜딩 방법은 합성 영상에서 객체와 배경의 경계에 나타나는 이음매(Seam)의 발생 정도에 따라 구분될 수 있다. 이음매 없는(Seamless) 영상 블랜딩 방법 중 대표적인 것은 포아송 방정식(Poisson equation)을 기반으로 P.Perez 등이 제안한 포아송 블랜딩이다. 이 방식의 기본적인 개념은 인간 시각 시스템의 특성을 고려하여 그레디언트(Gradient) 영역에서 블랜딩을 수행한다는 것이다. 이러한 과정을 통해 생성된 합성 영상은 객체와 배경이 자연스럽게 조합되는 특성이 있다.
이음매가 있는(Seamy) 영상 블랜딩 방식은 소스 영상의 객체를 목표 영상에 바로 삽입하는 방식으로서 가장 간단한 형태의 블랜딩 방법이라고 할 수 있다. 그리고 알파 블랜딩(Alpha Blending)에서는 영상 분할을 위한 이진 마스크의 경계 영역에 대해 1에서 0으로 점진적으로 감소하는 가중치를 부여하여 경계 영역에서의 이음매를 감소시킨다. 본 발명의 일 실시예에서는, 포아송 블랜딩과 알파 블랜딩의 장점들을 갖는 동영상 혼합 브랜딩 방식을 이용할 수 있다. 이는 합성 영상에서 객체와 배경의 이음매가 없을 뿐 아니라 객체 내부의 색상 왜곡이 현저히 감소되어 합성 영상의 자연성(Naturalness)이 향상되는 특징을 가질 수 있다. 그리고 합성 영상의 색상 왜곡을 감소하기 위한 기존 기법들에 비해 알고리즘이 간단하며, 이로 인해 동영상 합성을 위한 계산량이 상대적으로 매우 적다.
도 2를 참조하면, 입력부(310)는, 사용자 단말(100)로부터 적어도 하나의 사진 또는 텍스트를 입력받을 수 있다.
회전효과부(320)는, 입력된 적어도 하나의 사진 또는 텍스트를 원의 외주연을 따라 반복배치되어 회전하는 효과를 제공하여 전경 동영상을 생성할 수 있다. 이때, 회전하는 효과 이외에도 다양한 모션 또는 효과(Effect)가 적용될 수 있다. 사용자 단말(100)은 적어도 하나의 사진 또는 텍스트가 입력되면, 적어도 하나의 사진 또는 텍스트가 원의 외주연을 따라 반복배치되어 회전하는 전경 동영상으로 생성할 수 있다.
배경설정부(330)는, 사용자 단말(100)로부터 배경이 되는 배경 동영상을 입력받고 사운드를 설정받을 수 있다.
합성부(340)는, 회전효과부(320)에서 생성한 전경 동영상과, 배경설정부(330)에서 입력된 배경 동영상을 합성할 수 있다. 사용자 단말(100)은, 배경 동영상을 입력받아 전경 동영상을 앞으로 배치하고 배경 동영상이 전경 동영상의 배경으로 위치하도록 배치하여 합성한 후 하나의 영상을 생성할 수 있다.
사용자가 상세한 디자인을 제작하지 않으면서도 고품질의 영상을 제작할 수 있게 하는 방식이 바로 템플릿 기반의 동영상 제작 기법이다. 이렇게 사전에 디자인된 템플릿을 이용하면 제작을 위한 시간이 줄고, 인터페이스도 단순해 지며, 전문적인 디자이너의 노력이 포함되어 있어 결과물의 품질도 높아지는 경향이 있다. 다만 기존의 템플릿 기반 동영상 제작 방식의 공통적인 특징은 사전에 템플릿을 디자인하고, 여기에 사용자가 제공하는 사진, 동영상, 사운드를 대치하는 방식으로 영상을 합성한다는 것이다. 이는 템플릿에 따라 재생시간과 품질이 크게 의존했으며, 결과적으로 서비스를 위한 템플릿 수가 부족한 경우 결과물 간의 유사성이 증가하여 개성 있는 동영상 제작에 제약으로 작용할 수 있다. 이런 문제를 해결하기 위해서는 분위기와 주제 등에 따른 방대한 템플릿이 필요하며, 이를 위해 템플릿 디자인을 위해 많은 시간과 고비용을 필요로 한다.
이에 따라, 본 발명의 일 실시예에서는, 주제를 표출할 수 있는 짧은 길이의 장면템플릿들을 준비하고, 이를 상위 수준의 재조합 규칙에 따라 장면들을 배치하고 영상 전환 효과나 필터 효과를 부가할 수 있는 장면템플릿 재조합 방법을 이용할 수 있다. 장면템플릿 재조합에 따른 동영상 생성 방법의 핵심 아이디어는 고정된 장면템플릿이 아니라 의미와 주제를 갖는 작은 장면템플릿들로 세분화하여 이를 유연하게 조합하는 방식이다. 장면템플릿의 제작을 위해 MLT(Media Lovin’Toolkit)를 이용할 수 있다. MLT는 방송계 종사자(Broadcasters), 비디오 편집자 (Video Editors), 미디어 재생기(Media PLayers), 변환부호화기(Transcoders), 웹스트리머(Web Streamers)와 같이 다양한 응용에 대응할 수 있도록 하는 멀티미디어 프레임워크이다. MLT Framework에서는 사전에 정의된 XML 스키마에 따라 미디어 자원(Asset, Resource)들을 시간 및 공간적으로 배치하고, 전환 효과나 필터 효과를 부가하여 동영상을 기술할 수 있다. 이를 비디오 파일로 렌더링 함으로써 다양한 멀티미디어 서비스가 가능해진다.
상술한 서비스를 위하여, 우선 스토리보드에 정의된 자원, 배경음악, 효과 등의 영상 메타 데이터를 MLT 스키마를 따르는 XML 파일로 디자인한다. 이러한 디자인은 Kdenlive, Openshot, Shotcut 과 같은 그래픽 사용자 인터페이스(GUI) 방식의 공개소스 비디오 편집기에서 사용할 수 있다. 작성된 스토리보드를 이용하여 MLT 문법으로 정의된 장면템플릿 XML 파일을 파싱(Parsing)한다. MLT XML 파싱은 시간에 따라 요소(Element) 간 의존성이 높기 때문에 DOM(Document Object Model) 방식으로 처리하는 것이 용이하다. 스토리보드의 정보에 따라 제작된 MLT 파일은 Melt 툴킷을 이용하여 렌더링(Rendering) 과정을 통해 동영상이 생성될 수 있다.
MLT 모델을 파싱하여 동영상을 합성하는 방식은, 영상에 필요한 스토리 보드에 정의된 자원, 재생 시간, 효과 정보 등의 메타 데이터로 여러 트랙을 생성한다. 그 후에 각 트랙을 시간적, 공간적 순서에 맞게 합성(Composite)하여 하나의 MLT 모델로 생성한다. MLT 모델은 각각 장면템플릿이 되고, 여러 개의 장면템플릿을 조합하여 전체적인 동영상 템플릿 모델이 된다. 예를 들어, 장면템플릿들을 조합 시 가이드라인을 제공하는 스토리보드는 상위 수준에서 동영상의 시간에 따른 이야기 전개를 서술하고, 요구하는 분위기나 의도에 따라 효과를 부가하는 데 목적이 있다. 이를 위해 스토리보드 메타데이터는 여러 장의 장면템플릿을 시간에 따라 배치할 수 있고, 각각의 장면템플릿 내부에서 객체별로 다수의 트랙(Track)을 배치할 수 있도록 정의할 수 있다. 그리고 각 장면템플릿 사이에 추가되는 BGM(Background music), 장면 전환 효과(Transition Effect), 필터 효과(Filter Effect) 정보를 포함할 수 있다.
예를 들어, 스토리보드 내부에 정의된 메타데이터는 각각 “BGM”은 배경음악 데이터, “Transition”은 장면 전환 데이터, “ mlt_info ” 는 장면템플릿 내부의 트랙 데이터를 나타낼 수 있다. 이러한 메타 데이터를 이용하여 MLT XML 파일을 파싱한다. MLT Framework는 근본적으로 mlt_frame(예: 이미지, 오디오 등)을 생성하는 MLT 객체들의 목록(List)이다. 이 MLT 객체들은 XML 파일에서 Producer 태그로 표현이 되고, Playlists, Multiple Tracks 태그를 이용하여 Producer 태그들을 MLT 문법에 맞게 구조화하고, Filters,Transitions 태그를 이용하여 필터 효과, 영상 전환 효과를 나타낼 수 있다.
이를 위해 스토리보드와 장면구성요소들 사이에 메타정보 기반의 연결 인터페이스를 정의하고, 상호 연결시킬 수 있는 알고리즘이 미리 설정되어야 한다. 하나의 스토리보드는 복수 개의 장면(Scene)으로 구성되고, 장면템플릿, 리소스, 각종효과 등의 장면요소들이 각각 복수 개씩 준비되는 경우, 스토리보드를 구성하는 각각의 장면(Storyboard Scene)들과 장면요소(Scene Element)들은 각 각 정형메타태그들(RegularTags)과 비정형메타태그들(IrregularTags)을 포함한다. 여기서 정형메타태그들은 사전에 스토리보드와 장면요소를 연계하기 위해 정의한 전체 메타태그집합의 부분집합으로써 플롯 혹은 스토리구조에 맞게 장면요소들을 추출하기 위해 사용한다. 비정형메타태그들은 사전에 정의되지 않고 동적으로 갱신되는 사전(Dictionary)에 포함된 단어들의 집합이다. 비정형메타태그들을 기반으로 주제모델링 방법을 사용하여 스토리보드의 장면과 장면요소들 사이의 유사성을 계산할 수 있고, 유사도는 LSA(Latent Sematic Analysis/Indexing)을 이용하여 코사인 유사도나 유클라디안 거리를 이용할 수 있다.
LSA는, 입력된 문서들을 벡터공간(Vector Space)에 표현하고 SVD(Singular Value Decomposition)를 수행하여 주제(Topic)들을 찾고, 이를 통해 벡터공간에서 문서들을 표현하는 차원을 줄이거나, 유사도를 분석하여 주제별로 분류 및 추천하는 기능을 제공한다. 주제모델링이 완료된 상태에서 각종 전략메타정보에 따라 장면템플릿을 추천하기 위해서는 유사도 분석이 필요한데, 두 벡터 사이의 유사도(Similarity)를 계산하기 위해서는 코사인 유사도(Cosine Similarity) 공식을 이용하지만 이에 한정되지는 않는다. 만약, 코사인 유사도를 사용한다면, 유사도가 1 인 경우 완전히 다름, 0 인 경우 상관도 없음으로 표시될 수 있고, 그 사이의 숫자의 크기에 따라 유사도와 상관도가 달라진다.
연관 방식에 따라 스토리보드가 주어졌을 때 스토리보드 각각의 장면에 맞는 장면요소들을 선택함으로써 추상적인 스토리보드가 동영상 합성을 위한 구체적인 프로젝트 파일로 변환될 수 있다. 예를 들어 스토리보드의 정형메타태그가 "인트로"라고 기재되어 있으면, 장면요소의 정형메타태그를 검사하여 "인트로"가 전체 또는 부분적으로 검색되는 경우 후보 장면요소로 추출될 수 있다. 이렇게 추출된 후보 장면요소들에 대해서 주제모델링 방식에 따른 유사도 계산을 수행하여 가장 근사한 장면요소를 선정할 수 있다. 예를 들어, 사전에 마련된 특정 장면요소의 전체 집합(Entire Set of Specific Scene Elements)에서 정형메타태그들의 검색을 통해 부분집합이 선택되고, 마지막으로 비정형메타태그들을 통해 유사도 계산이 완료된 최종 장면요소의 부분집합을 추출하면, 정형메타태그들의 경우는 단순 단어 검색을 통해 간단하게 추출이 가능하지만 비정형메타태그들은 여러 단어들의 가중치를 종합적으로 반영할 수 있도록 하기 위해 상술한 LSA를 사용할 수 있다. 스토리보드에 포함된 특정 장면을 결정하기 위해 장면요소 중에서 장면템플릿을 정형메타태그와 비정형메타태그를 선정하고, 이후 해당 장면에 들어갈 리소스, 배경음악, 필터효과, 마스크효과를 동일 방법으로 선정할 수 있다. 장면요소 중에서 배경음악, 필터효과, 마스크효과는 동영상 분위기의 일관성을 위해 동영상이 재생되는 전체 시간에 대해 전역적으로 반영되도록 구성할 수 있다.
제공부(350)는, 합성부(340)에서 합성된 하나의 영상을 사용자 단말(100)로 제공할 수 있다.
연계부(360)는, 전경 동영상을 생성할 때 키네마스터(KineMaster) 애플리케이션을 이용하도록 연계할 수 있다. 물론, 키네마스터 애플리케이션 이외에도 다양한 모션과 효과를 제공하는 애플리케이션을 이용할 수도 있음은 자명하다 할 것이다. 키네틱 타이포그래피의 기술연구는 MIT와 CMU 등에서 활발하게 진행되고 있다. 키네틱 타이포그래피의 실행을 위한 엔진 구현과 기반으로 한 타이포그래피의 활용을 위한 제작 기술 등에 대해 주로 연구하고 있다. 이러한 연구는 키네틱 타이포그래피가 다양한 응용 서비스 시스템에서 인간의 표현력이 보다 풍부해질 수 있음을 보여주고 있다. KineticJS는 데스크탑이나 모바일 애플리케이션에서 고성능의 애니메이션, 필터링, 이벤트 처리 등을 편리하게 할 수 있도록 하는 HTML5 Canvas Java-Script framework이다. 캔버스 API를 확장한 오픈소스 라이브러리로서 그래픽과 상호작용하는 데에 미흡한 점이 있는 HTML5 캔버스를 보완한다. Stage 위에 그래픽을 그릴 수 있으며, 이벤트 리스너를 추가하여 각 그래픽의 이벤트를 독립적으로 수행할 수 있다. Stage 위에 추가된 각 Layer는 Shape 또는 Shape 그룹을 포함하고 있으며 HTML 페이지 안의 DOM 형식과 유사하게 가상 노드로 구성되어 있다.
텍스트를 입력하면, 자막의 시작 시간에 해당하는 동영상 스틸컷이 배경처럼 FrameLayout 형식으로 나오고, 그 위에 Draggable ImageView라는 이름의 뷰 객체가 올라간다. 뷰 객체 위에 비트맵 이미지 형식의 자막 이미지가 그려지고 이 객체는 OnTouchListener의 Motion 이벤트를 이용하여 드래그 방향에 따라 자막이 이동할 수 있게 효과를 주게 된다. 이로서 사용자가 자신이 원하는 위치에 자막이 나오게 설정하는 것을 편리하게 할 수 있다. 자막의 위치를 지정한 후에는 자막의 모션을 설정할 수 있다. 추후 모션이 추가될 경우를 고려해서 갤러리(Gallery) 뷰로 구현하여 좌우로 이동하며 모션을 선택할 수 있도록 한다. 자막 모션은 예를 들어, 오른쪽으로 이동, 왼쪽으로 이동, 확대, 축소, 회전 등이 존재할 수 있다. 각각의 모션을 누르면 해당 모션이 어떻게 적용되는지 애니메이션 효과를 이용하여 화면에서 바로 확인할 수 있다. 여러 모션들을 적용하여 어느 것이 각 장면에 가장 잘 어울리는지 비교해가면서 모션을 편리하게 설정할 수 있다.
이때, 전경 동영상에 포함되는 적어도 하나의 콘텐츠에 모션그래픽(Motion Graphics)이 포함될 수 있다. 이때, 모션그래픽은, 디지털 기술을 기반으로 실사 촬영에서 복잡한 모션그래픽에 이르기까지 영상 기술의 발전은 프로젝션 매핑에도 반영될 수 있다. 다양한 소프트웨어로 실사 영상과 2D 및 3D 모션그래픽을 제작하여 렌더링 거친 후 avi, mov와 같은 동영상 컨테이너에 영상 데이터를 담아 프로젝션 매핑에 사용할 수 있다.
<실시간 모션그래픽>
실시간 모션그래픽은 실시간 생성(Generate)의 개념으로 렌더링 없이 영상을 제작하는 방법이다. 디지털 영상은 사진, 영상과 같은 비트맵 소스 및 벡터 그래픽 이미지 등을 편집하고 애니메이션 및 각종 효과를 적용한 후 렌더링을 거처 동영상 포맷에 담긴 최종 영상 파일을 만든다. 그러나 생성 기반의 영상은 프로그래밍 코드에 의해 이미지를 생성시키고 변형시키며 움직이는 영상이다.
실시간 모션그래픽은 보통 가상의 공간에서 스크립트로 생성시킨 원시 도형, 파티클 및 라이브로 촬영된 영상 또는 녹화된 영상을 받아서 기초 소스로 사용하고 여러 값을 생성시키는 생성 장치(Generator)에서 생성된 값을 이용하여 움직임과 변형을 준다. 추가로 외부에서 센서 등을 통해 들어오는 실시간 값을 추가해 반영시킬 수 있으며 프로그래밍에 의해 다양한 방식으로 효과를 더하여 실시간 렌더러를 바탕으로 즉시 출력을 한다. 필요에 의해 결과물을 동영상 파일이 아닌 컴파일 또는 패키지의 과정을 거처 exe와 같이 컴퓨터에서 바로 실행되는 실행파일로 출력을 할 수 있다.
원시 이미지의 생성부터 움직임, 효과 적용 등에 필요한 각종 설정 값이 사전에 설정한 대로 만들어지고 반영이 가능하지만 여러 경로를 통해 들어오는 다양한 값을 즉시 반영하여 또 다른 변수를 만들 수 있는데 이러한 속성들을 통해 실시간 모션그래픽은 초기 구상을 넘어 새로운 변형과 창발, 제한 없는 재생 시간 등 또 다른 가능성을 가질 수 있다. 실시간 렌더링을 지원하는 대표적인 프로그램은 유니티와 언리얼(Unreal) 등 게임 엔진들이 있으며 직접 코딩을 통해 이미지를 구현하는 프로그래밍 언어도 사용된다. 프로세싱(Processing), 맥스/MSP(Max/MSP), 퓨어 데어터(Pure Data), 쿼츠 컴포저(Quartz Composer), 터치디자이너(TouchDesigner), VVVV 등이 사용되며 이들은 일반적인 스크립트 언어들보다 더 간단한 문법을 사용하거나 VPL(Visual Programming Language)의 구조로 프로그래밍을 할 수 있어 실시간 영상 및 각종 상호작용 기법을 구현하기 편리하다.
제어부(370)는, 사용자 단말(100)에서 생성한 영상을 사용자 단말(100)과 무선 네트워크로 연결된 빔 프로젝터(400)로 전송하여 출력되도록 제어할 수 있다.
색차제거부(380)는, 전경 동영상과 배경 동영상 간의 색차를 줄이기 위한 적어도 하나의 영상 블랜딩 알고리즘을 이용할 수 있다. 색차제거부(380)는, 전경 동영상의 객체를 포아송 블랜딩 방법으로 배경 동영상에 합성한 후, 블랜딩한 배경 동영상과 전경 동영상 간의 색차를 비교하고, 색차가 기 설정된 임계값 이상인 경우, 전경 동영상의 객체에 대해 알파 블랜딩을 수행한 후, 포아송 블랜딩 방법으로 블랜딩된 배경 동영상과 가중치를 부여하여 합성하는 것을 특징으로 하는 전경 동영상 및 배경 동영상을 합성할 수 있다.
포아송 블랜딩 방식에서는 소스 영상 객체의 색상이 목표 영상의 색상에 의해 왜곡될 수 있다. 그 이유는 포아송 블랜딩 과정에서 수학식 1의 디리클레 경계 조건(Dirichlet Boundary Condition)으로 인해 합성 영역의 경계에서 목표 영상의 화소값을 합성 영상의 화소값으로 사용하기 때문이다. 색상 왜곡의 종류는 색 번짐(Color Bleeding) 현상과 색 오류(Color Artifact) 현상으로 구분할 수 있다. 색 번짐 현상은 목표 영상의 경계 화소값이 합성된 객체 영역 전체로 번지는 형태의 왜곡을 의미한다. 그리고 색 오류 현상은 합성 영역의 경계 영역이 부분적으로 목표 영상 경계의 색상으로 얼룩지게 보이는 현상을 의미한다.
Figure 112021058452652-pat00001
이에 따라, 포아송 블랜딩에 의해 발생하는 색상 왜곡 현상을 억제하여 합성 영상의 자연성을 향상시키기 위해, 합성 영상에서 소스 영상(전경 동영상)의 객체가 가지고 있는 색상 및 텍스처를 보존하는 알파 블랜딩의 특징과 소스 영상의 객체와 목표 영상(배경 동영상)의 배경이 이음매 없이 조합되는 포아송 블랜딩의 특징을 동시에 활용하는 방식으로 이루어질 수 있다. 이는 색차에 기반하며, 색차는 RGB와 색성분, 합성영역에 포함된 화소 수, 알파 블랜딩된 객체의 화소값에 기초하여 계산될 수 있다. 다양한 수학식이 적용될 수 있으나 본 발명의 일 실시예에서는 어느 하나의 수학식으로 한정하지는 않는다.
리듬반영부(390)는, 사용자 단말(100)에서 배경음악이 선택된 경우, 배경음악의 BPM(Beat Per Minute)에 대응하도록 전경 동영상의 회전 속도를 제어할 수 있다.
이하, 상술한 도 2의 제작 서비스 제공 서버의 구성에 따른 동작 과정을 도 3 및 도 4를 예로 들어 상세히 설명하기로 한다. 다만, 실시예는 본 발명의 다양한 실시예 중 어느 하나일 뿐, 이에 한정되지 않음은 자명하다 할 것이다.
도 3을 참조하면, (a) 제작 서비스 제공 서버(300)는 사용자 단말(100)로부터 수집한 텍스트, 사진 등을 조합하여 전경 동영상을 생성하고, (b) 배경 동영상을 받을 때 배경음악이 있다면 이 또한 업로드받는다. 그리고, (c) 이 두 개의 동영상(배경 동영상+전경 동영상)을 합성하고, (d) 색차를 제거할 수 있다. 이때 도 4a는 영상의 어느 한 프레임이고, 배경 동영상 앞에 전경 동영상인 글씨가 원 형태로 회전하면서 돌고 있는 것이 합성된 화면이다. 도 4b와 같이 사진이 원 형태로 반복배열되어 회전할 수도 있고, 도 4c와 같이 배경 동영상만 플레이되는 구간도 존재한다. 도 4d와 같이 사진을 전경에 두고 배경 동영상에 합성할 수도 있고, 도 4e와 같이 사진을 합성할 수도 있다. 도 4f는 다른 꽃을 촬영한 배경 동영상인데, 도 4g와 같은 사진을 효과를 주어 회전하도록 할 수도 있고, 도 4h와 같은 효과를줄 수도 있다. 도 4i와 같이 꽃과 도 4j의 신부를 투명 및 겹치게 표현할 수도 있고, 도 4k와 같이 꽃과 두 부부를 오버레이되도록 할 수도 있다. 도 4l과 같이 글씨, 그림, 사진, 효과가 모두 들어갈 수도 있고, 도 4m과 같이 배경 동영상과 글씨만 효과가 입혀져 모션그래픽으로 들어갈 수도 있다.
이와 같은 도 2 내지 도 4의 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 방법에 대해서 설명되지 아니한 사항은 앞서 도 1을 통해 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 방법에 대하여 설명된 내용과 동일하거나 설명된 내용으로부터 용이하게 유추 가능하므로 이하 설명을 생략하도록 한다.
도 5는 본 발명의 일 실시예에 따른 도 1의 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템에 포함된 각 구성들 상호 간에 데이터가 송수신되는 과정을 나타낸 도면이다. 이하, 도 5를 통해 각 구성들 상호간에 데이터가 송수신되는 과정의 일 예를 설명할 것이나, 이와 같은 실시예로 본원이 한정 해석되는 것은 아니며, 앞서 설명한 다양한 실시예들에 따라 도 5에 도시된 데이터가 송수신되는 과정이 변경될 수 있음은 기술분야에 속하는 당업자에게 자명하다.
도 5를 참조하면, 제작 서비스 제공 서버는, 사용자 단말로부터 적어도 하나의 사진 또는 텍스트를 입력한다(S5100).
그리고, 제작 서비스 제공 서버는, 입력된 적어도 하나의 사진 또는 텍스트를 원의 외주연을 따라 반복배치되어 회전하는 효과를 제공하여 전경 동영상을 생성한다(S5200).
또한, 제작 서비스 제공 서버는, 사용자 단말로부터 배경이 되는 배경 동영상을 입력받고 사운드를 설정받고(S5300), 생성한 전경 동영상과, 배경설정부에서 입력된 배경 동영상을 합성한다(S5400).
마지막으로, 제작 서비스 제공 서버는, 합성된 하나의 영상을 사용자 단말로 제공한다(S5500).
상술한 단계들(S5100~S5500)간의 순서는 예시일 뿐, 이에 한정되지 않는다. 즉, 상술한 단계들(S5100~S5500)간의 순서는 상호 변동될 수 있으며, 이중 일부 단계들은 동시에 실행되거나 삭제될 수도 있다.
이와 같은 도 5의 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 방법에 대해서 설명되지 아니한 사항은 앞서 도 1 내지 도 4를 통해 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 방법에 대하여 설명된 내용과 동일하거나 설명된 내용으로부터 용이하게 유추 가능하므로 이하 설명을 생략하도록 한다.
도 5를 통해 설명된 일 실시예에 따른 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 방법은, 컴퓨터에 의해 실행되는 애플리케이션이나 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
전술한 본 발명의 일 실시예에 따른 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 방법은, 단말기에 기본적으로 설치된 애플리케이션(이는 단말기에 기본적으로 탑재된 플랫폼이나 운영체제 등에 포함된 프로그램을 포함할 수 있음)에 의해 실행될 수 있고, 사용자가 애플리케이션 스토어 서버, 애플리케이션 또는 해당 서비스와 관련된 웹 서버 등의 애플리케이션 제공 서버를 통해 마스터 단말기에 직접 설치한 애플리케이션(즉, 프로그램)에 의해 실행될 수도 있다. 이러한 의미에서, 전술한 본 발명의 일 실시예에 따른 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 방법은 단말기에 기본적으로 설치되거나 사용자에 의해 직접 설치된 애플리케이션(즉, 프로그램)으로 구현되고 단말기에 등의 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (6)

  1. 적어도 하나의 사진 또는 텍스트가 입력되면, 상기 적어도 하나의 사진 또는 텍스트가 원의 외주연을 따라 반복배치되어 회전하는 전경 동영상으로 생성하고, 배경 동영상을 입력받아 상기 전경 동영상을 앞으로 배치하고 상기 배경 동영상이 상기 전경 동영상의 배경으로 위치하도록 배치하여 합성한 후 하나의 영상을 생성하는 사용자 단말; 및
    상기 사용자 단말로부터 적어도 하나의 사진 또는 텍스트를 입력받는 입력부, 상기 입력된 적어도 하나의 사진 또는 텍스트를 원의 외주연을 따라 반복배치되어 회전하는 효과를 제공하여 전경 동영상을 생성하는 회전효과부, 상기 사용자 단말로부터 배경이 되는 배경 동영상을 입력받고 사운드를 설정받는 배경설정부, 상기 회전효과부에서 생성한 전경 동영상과, 배경설정부에서 입력된 배경 동영상을 합성하는 합성부, 상기 합성부에서 합성된 하나의 영상을 상기 사용자 단말로 제공하는 제공부를 포함하는 제작 서비스 제공 서버;를 포함하되,
    상기 제작 서비스 제공 서버는,
    상기 전경 동영상과 배경 동영상 간의 색차를 줄이기 위한 적어도 하나의 영상 블랜딩 알고리즘을 이용하는 색차제거부;를 더 포함하고,
    상기 색차제거부는,
    상기 전경 동영상의 객체를 포아송 블랜딩 방법으로 상기 배경 동영상에 합성한 후, 블랜딩한 배경 동영상과 상기 전경 동영상 간의 색차를 비교하고, 상기 색차가 기 설정된 임계값 이상인 경우, 상기 전경 동영상의 객체에 대해 알파 블랜딩을 수행한 후, 상기 포아송 블랜딩 방법으로 블랜딩된 배경 동영상과 가중치를 부여하여 합성하는 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템.
  2. 제 1 항에 있어서,
    상기 제작 서비스 제공 서버는,
    상기 전경 동영상을 생성할 때 키네마스터(KineMaster) 애플리케이션을 이용하도록 연계하는 연계부;
    를 더 포함하는 것을 특징으로 하는 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템.
  3. 제 1 항에 있어서,
    상기 제작 서비스 제공 서버는,
    상기 사용자 단말에서 생성한 영상을 상기 사용자 단말과 무선 네트워크로 연결된 빔 프로젝터로 전송하여 출력되도록 제어하는 제어부;
    를 더 포함하는 것을 특징으로 하는 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템.
  4. 삭제
  5. 삭제
  6. 제 1 항에 있어서,
    상기 제작 서비스 제공 서버는,
    상기 사용자 단말에서 배경음악이 선택된 경우, 상기 배경음악의 BPM(Beat Per Minute)에 대응하도록 상기 전경 동영상의 회전 속도를 제어하는 리듬반영부;
    를 더 포함하는 것을 특징으로 하는 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템.

KR1020210065272A 2021-05-21 2021-05-21 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템 KR102335096B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210065272A KR102335096B1 (ko) 2021-05-21 2021-05-21 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210065272A KR102335096B1 (ko) 2021-05-21 2021-05-21 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템

Publications (1)

Publication Number Publication Date
KR102335096B1 true KR102335096B1 (ko) 2021-12-03

Family

ID=78866728

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210065272A KR102335096B1 (ko) 2021-05-21 2021-05-21 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템

Country Status (1)

Country Link
KR (1) KR102335096B1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130066121A (ko) * 2011-12-12 2013-06-20 주식회사 케이티 단말들간의 영상 공유 요청에 대응하여 단말들로 3d 영상 데이터를 제공하는 서버 및 방법, 그리고 단말
KR20130140904A (ko) * 2011-05-02 2013-12-24 후아웨이 테크놀러지 컴퍼니 리미티드 비디오 적응 및 재타겟팅을 위한 비디오 캡션 재-오버레이 시스템 및 방법
KR20140147597A (ko) * 2013-06-20 2014-12-30 엘지전자 주식회사 이동 단말기 및 이의 제어방법
KR20190018919A (ko) * 2017-08-16 2019-02-26 삼성전자주식회사 디스플레이장치, 서버 및 그 제어방법
KR20200006517A (ko) * 2019-12-31 2020-01-20 류상민 학습 내용을 동영상으로 공개하는 학습 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130140904A (ko) * 2011-05-02 2013-12-24 후아웨이 테크놀러지 컴퍼니 리미티드 비디오 적응 및 재타겟팅을 위한 비디오 캡션 재-오버레이 시스템 및 방법
KR20130066121A (ko) * 2011-12-12 2013-06-20 주식회사 케이티 단말들간의 영상 공유 요청에 대응하여 단말들로 3d 영상 데이터를 제공하는 서버 및 방법, 그리고 단말
KR20140147597A (ko) * 2013-06-20 2014-12-30 엘지전자 주식회사 이동 단말기 및 이의 제어방법
KR20190018919A (ko) * 2017-08-16 2019-02-26 삼성전자주식회사 디스플레이장치, 서버 및 그 제어방법
KR20200006517A (ko) * 2019-12-31 2020-01-20 류상민 학습 내용을 동영상으로 공개하는 학습 방법

Similar Documents

Publication Publication Date Title
JP6861454B2 (ja) 共有アセット及び個別化アセットからのストーリーボード指示ビデオ制作
CN116233491B (zh) 视频生成的方法及服务器
CN105765990B (zh) 通过分布式网络分布视频内容的方法、系统及计算机介质
CN101300567B (zh) 在Web上的媒体共享和创作的方法
Li et al. Fundamentals of multimedia
KR20230042523A (ko) 멀티미디어 데이터의 처리 방법, 생성 방법 및 관련 기기
KR102434832B1 (ko) 인공지능 기반 실시간 배경분리 및 객체합성을 이용한 가상여행 서비스 제공 방법
US20110113334A1 (en) Experience streams for rich interactive narratives
US11978148B2 (en) Three-dimensional image player capable of real-time interaction
CN111930289B (zh) 一种处理图片和文本的方法和系统
CN107402985A (zh) 视频特效输出控制方法、装置及计算机可读存储介质
CN104616331A (zh) 移动设备上的图像处理方法和装置
US20180143741A1 (en) Intelligent graphical feature generation for user content
CN103986980A (zh) 一种超媒体编辑制作方法及系统
CN105653284A (zh) 一种生成安卓平台的场景文件的方法和装置
US9530453B2 (en) Apparatus, method, and computer-readable recording medium for creating and reproducing live picture file
CN113099288A (zh) 视频制作方法及装置
CN114466222B (zh) 一种视频合成方法、装置、电子设备及存储介质
US9620167B2 (en) Broadcast-quality graphics creation and playout
KR102335096B1 (ko) 전경 동영상 및 배경 동영상을 합성하는 영상 제작 서비스 제공 시스템
KR20170090856A (ko) 오픈 시나리오 생성 방법
EP4276828A1 (en) Integrated media processing pipeline
Castro et al. Cognition inspired format for the expression of computer vision metadata
US7610554B2 (en) Template-based multimedia capturing
JP2007519068A (ja) 変換技術を用いて意味記述を生成するコンピュータによる計算方法及びコンピュータシステム

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant