[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR20210104247A - Ppt 추천방법 및 그 장치 - Google Patents

Ppt 추천방법 및 그 장치 Download PDF

Info

Publication number
KR20210104247A
KR20210104247A KR1020200018720A KR20200018720A KR20210104247A KR 20210104247 A KR20210104247 A KR 20210104247A KR 1020200018720 A KR1020200018720 A KR 1020200018720A KR 20200018720 A KR20200018720 A KR 20200018720A KR 20210104247 A KR20210104247 A KR 20210104247A
Authority
KR
South Korea
Prior art keywords
ppt
information
input
output
condition
Prior art date
Application number
KR1020200018720A
Other languages
English (en)
Inventor
최호진
이동건
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020200018720A priority Critical patent/KR20210104247A/ko
Priority to PCT/KR2021/001010 priority patent/WO2021167257A1/ko
Publication of KR20210104247A publication Critical patent/KR20210104247A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0475Generative networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/096Transfer learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

본 실시예는, 변경 대상이 되는 입력 PPT 정보 및 입력 PPT 정보에 상응하는 변경 조건이 정의된 조건 PPT 정보를 PPT 생성 모델에 입력하여 변경 조건을 기반으로 입력 PPT 정보의 구조를 재구성한 출력 PPT 정보를 생성함으로써 PPT 디자인을 생성하는 데 있어서 사용자의 편의성을 증진시키고 중복 작업을 줄여 작업 속도를 빠르게 수행 가능토록 하는 PPT 추천방법 및 그 장치에 관한 것이다.

Description

PPT 추천방법 및 그 장치{Method and Apparatus for Recommending PowerPoint}
본 실시예는 PPT 추천방법 및 그 장치에 관한 것이다. 더욱 상세하게는, 딥러닝을 활용하여 PPT의 구조를 조건부로 추천하고 조언해주는 PPT 추천방법 및 그 장치에 관한 것이다.
이 부분에 기술된 내용은 단순히 본 실시예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.
최근 딥러닝 기법이 소개되면서 다양한 분야에서 폭넓게 활용되고 있다. 특히 CNN(Convolutional Neural Network)과 같은 신경망 모델의 사용이 늘며, 얼굴 인식, 지능화된 실시간 감시 및 예측 시스템, 이미지 및 사운드 생성 모델 등의 여러 분야에서 사용되고 있다. 하지만, 최근의 연구들은 설명 능력과 모델의 성능 사이에 간극이 존재하며, 설명 능력이 신뢰도 있는 인공지능 시스템을 위해서는 필수적임을 시사하였다.
이의 원인 중 하나는 사용자가 인식하는 정답과 모델이 정답으로 받아들이는 입력 사이에서 발생하는 것이 일반적이다. 이러한 정답과 입력 사이의 간극을 줄이며, 동시에 적은 노동력으로 효율적으로 학습할 수 있는 시스템을 위하여 모델과 사용자와의 의사소통 능력을 늘리는 것이 바람직하다.
한편으로 발표자료(PPT: PowerPoint) 디자인은 많은 단순 노동이 소모되고 힘든 일이지만, 가독성을 위해서는 꼭 필요한 작업이다. 기계학습은 이를 대체할 수단이 될 수 있지만, 사용자가 이를 받아들이기 위해서는 현재 설명 생성 수준은 부족한 실정이다.
이를 위하여 모델이 사용자가 이해할 수 있는 수준의 설명을 생성하는 것을 강제하며, 기존의 성능을 유지할 수 있는 신경망이 필요하다. 이 밖에도, 이를 위한 PPT 프로그램, 신경망 모델 및 사용자 간의 입출력을 중계하는 시스템 또한 동시에 요구된다.
본 실시예는, 변경 대상이 되는 입력 PPT 정보 및 입력 PPT 정보에 상응하는 변경 조건이 정의된 조건 PPT 정보를 PPT 생성 모델에 입력하여 변경 조건을 기반으로 입력 PPT 정보의 구조를 재구성한 출력 PPT 정보를 생성함으로써 PPT 디자인을 생성하는 데 있어서 사용자의 편의성을 증진시키고 중복 작업을 줄여 작업 속도를 빠르게 수행 가능토록 하는 데 주된 목적이 있다.
본 실시예는, 변경 대상이 되는 입력 PPT 정보 및 상기 입력 PPT 정보에 상응하는 변경 조건이 정의된 조건 PPT 정보를 수집하는 데이터 수집부; 사전에 트레이닝된 PPT 생성 모델을 포함하고, 상기 입력 PPT 정보 및 상기 조건 PPT 정보를 상기 PPT 생성 모델에 입력하여 상기 변경 조건을 기반으로 상기 입력 PPT 정보의 구조를 재구성한 출력 PPT 정보를 생성하는 PPT 생성부; 및 상기 출력 PPT 정보를 추천 PPT 정보로서 사용자에게 제공하는 출력부를 포함하는 것을 특징으로 하는 PPT 추천장치를 제공한다.
또한, 본 실시예의 다른 측면에 의하면, 변경 대상이 되는 입력 PPT 정보 및 상기 입력 PPT 정보에 상응하는 변경 조건이 정의된 조건 PPT 정보를 수집하는 과정; 상기 입력 PPT 정보 및 상기 조건 PPT 정보를 사전에 트레이닝된 PPT 생성 모델에 입력하여 상기 변경 조건을 기반으로 상기 입력 PPT 정보의 구조를 재구성한 출력 PPT 정보를 생성하는 과정; 및 상기 출력 PPT 정보를 추천 PPT 정보로서 사용자에게 제공하는 과정을 포함하는 것을 특징으로 하는 PPT 추천방법을 제공한다.
이상에서 설명한 바와 같이 본 실시예에 의하면, PPT presentation DB와 신경망 및 서버를 통해서 PPT 디자인을 생성하는데 있어서 소요되는 비용과 시간을 획기적으로 줄여줄 수 있는 효과가 있다.
또한, 본 발명의 시스템이 실제로 구축되면 PPT의 종류에 관계 없이 DB만을 구축하여 추천 시스템을 생성하는 것이 가능하며, PPT 학습 후 조건부 재학습 과정을 거쳐서 사용자 요구에 따라 재학습의 정도를 조절하는 것도 가능한 효과가 있다.
아울러 학습되지 않은 PPT를 조건부 인식으로 사용함으로써 One-Shot Learning을 통해 환경에 무관하게 PPT 생성에 있어서 사용자 편의성을 증진시키고 중복 작업을 줄여 작업 속도를 빠르게 하는 효과가 있다.
도 1은 본 실시예에 따른 PPT 추천 시스템을 개략적으로 나타낸 블록 구성도이다.
도 2는 본 실시예에 따른 PPT 추천장치를 개략적으로 나타낸 블록 구성도이다.
도 3은 본 실시예에 따른 출력 PPT 정보 생성방법을 설명하기 위한 흐름도이다.
도 4는 본 실시예에 따른 PPT 생성 모델 학습방법을 설명하기 위한 흐름도이다.
도 5는 본 실시예에 따른 PPT 생성 모델 재학습방법을 설명하기 위한 흐름도이다.
도 6은 본 실시예에 따른 PPT 추천방법을 설명하기 위한 순서도이다.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의하여야 한다. 또한, 본 발명의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
도 1은 본 실시예에 따른 PPT 추천 시스템을 개략적으로 나타낸 블록 구성도이다.
본 실시예에 따른 PPT 추천 시스템은 사용자 단말기(100), PPT 추천장치(110), PPT 생성모델(112) 및 DB(120)를 포함하여 이루어질 수 있다. 한편, 도 1에서는 PPT 생성모델(112)이 PPT 추천장치(110)와 연동되는 별개의 장치로서 구현된 것으로 예시하였으나, 이는, PPT 생성모델(112)에 대한 학습방법을 설명하기 위한 일 실시예에 불과하며, 본 실시예에 있어서, PPT 생성모델(112)은 PPT 추천장치(110)의 구성요소로서 구현될 수 있다.
본 실시예에 따른 PPT 추천 시스템은 PPT presentation 발표자료의 구조를 조건부로 추천하고 조언해주는 시스템을 의미한다.
PPT 추천 시스템 상에는 사용자 설명을 포함하는 PPT를 수집하여 제공하는 DB(120)가 구축될 수 있으며, 이 DB(120)를 이용하여 초기 설명 생성 신경망(ex: PPT 생성모델(112))을 학습하게 된다. 한편, DB(120) 상에는 입력 PPT 정보-조건 PPT 정보-출력 PPT 정보의 쌍으로 이루어진 PPT 데이터셋이 학습을 위한 학습 데이터로서 기 수집되어 저장될 수 있다.
본 실시예에 따른 PPT 추천 시스템에 의하는 경우 PPT 추천장치(110)는 사용자 단말기(100)로부터 입력 PPT 정보 및 조건 PPT 정보를 전송받고, 이를 PPT 생성모델(112)에 입력하여 출력 PPT 정보를 생성함으로써 사용자에게 추천 PPT 정보를 제공할 수 있다.
이후, 사용자 단말기(100)는 제공받은 출력 PPT 정보에 대한 사용자의 피드백을 PPT 추천장치(110)로 전송하고, PPT 추천장치(110)는 이를 적용하여 PPT 생성모델(112)을 재학습시킴으로써 PPT 추천 시스템을 구축할 수 있다.
즉, 본 실시예에 있어서, PPT 생성모델(112)은 적대 예제 학습을 통해 빠른 초기 학습 속도를 가지고 재학습을 통해 반복적인 성능 개선이 가능한 것이 특징인 조언 PPT 생성 신경망(이하 생성모델)일 수 있다.
도 2는 본 실시예에 따른 PPT 추천장치를 개략적으로 나타낸 블록 구성도이다.
본 실시예에 따른 PPT 추천장치(110)는 데이터 수집부(200), 학습부(210), PPT 생성부(220) 및 출력부(230)를 포함한다. 여기서 PPT 추천장치(110)에 포함되는 구성요소는 반드시 이에 한정되는 것은 아니다. 예컨대, 본 실시예에 있어서, 학습부(210)는 PPT 추천장치(110) 및 DB(120)와 연동되는 별개의 장치로 구현될 수 있다. 이 경우, 학습부(210)는 DB(120) 상에 저장된 학습 데이터를 기반으로 학습이 완료된 PPT 생성모델(112)을 PPT 추천장치(110)로 제공할 수 있다.
데이터 수집부(200)는 PPT 추천을 위한 관련 데이터를 수집하는 기능을 수행한다.
본 실시예에 있어서, 데이터 수집부(200)는 사용자 단말기(100)와 연동되어 입력 PPT 정보 및 입력 PPT 정보에 상응하는 조건 PPT 정보를 수집한다. 여기서, 입력 PPT 정보는 사용자가 수정하고자 하는 PPT로서, 스타일 변경 대상이 되는 콘텐츠 정보를 포함한다.
조건 PPT 정보는 입력 PPT 정보의 변경을 위한 참고 PPT로서, 입력 PPT 정보에 상응하는 변경 조건을 정의한다. 이러한, 조건 PPT 정보는 입력 PPT 정보와 관련하여 사용자가 변경하고자 하는 스타일 정보를 기반으로 하여 기 작성된 PPT 정보인 것이 바람직하나 반드시 이에 한정되는 것은 아니다.
데이터 수집부(200)는 수집한 입력 PPT 정보 및 조건 PPT 정보를 PPT 생성부(220)로 제공한다.
PPT 생성부(210)는 사전에 트레이닝된 PPT 생성모델(112)을 포함하고, 이를 기반으로 한 기계학습을 통해 사용자를 위한 추천 PPT의 구조를 조건부로 추천하고 조언해주는 기능을 수행한다.
PPT 생성부(210)는 입력 PPT 정보 및 조건 PPT 정보를 PPT 생성 모델(112)에 적용시켜 학습을 수행하고, 학습결과에 따라 출력 PPT 정보를 생성한다.
보다 자세하게는, PPT 생성부(210)는 입력 PPT 정보 및 조건 PPT 정보를 PPT 생성 모델(112)에 적용시켜, 조건 PPT 정보의 변경 조건을 기반으로 입력 PPT 정보의 구조를 재구성한 출력 PPT 정보를 생성한다. 예컨대, PPT 생성부(210)는 입력 PPT 정보 상의 콘텐츠는 유지하되 위치, 색깔 및 폰트 중 적어도 하나의 스타일 정보를 조건 PPT 정보의 스타일 정보에 기반하여 변경한 출력 PPT 정보를 생성할 수 있다.
이를 위해, 본 실시예에 따른 PPT 생성 모델(112)은 입력 PPT 정보-조건 PPT 정보-출력 PPT 정보의 쌍으로 이루어진 데이터 셋 PPT를 학습하여 입력 PPT 정보 및 조건 PPT 정보로부터 출력 PPT 정보를 생성하도록 사전 학습된다. 이에, 대한 자세한 설명은 학습부(230)를 설명하는 과정에서 후술토록 한다.
이하, 도 3을 함께 참조하여, 본 실시예에 따른 PPT 생성부(210)가 PPT 생성모델(112)을 통해 출력 PPT 정보를 생성하는 방법에 대해 설명하도록 한다.
도 3에 도시하듯이, 본 실시예에 따른 PPT 생성모델(112)은 적어도 하나 이상의 네트워크 구조로 이루어지며, 이상적으로는 이러한, 네트워크 구조를 통해 크게 입력 전처리, 심층 특질 생성, 출력 후처리의 세 가지의 단계를 거쳐 출력 PPT 정보를 생성하도록 구현된다.
이하, 입력 및 출력 특질은 PPT 프레젠테이션 파일의 각 슬라이드에 존재하는 한개 이상의 객체의 위치, 크기 및 회전 상태의 정수 정의(이하 레이아웃), 각 객체의 RGBA 색감값, 각 객체의 폰트를 포함하는 고정된 실수형태로 표현 가능한 입력, 그리고 슬라이드 별 설명을 위한 자연어 문장 입력으로 학습용 PPT 데이터베이스(이하 DB)에 저장된다.
입력 특질의 한 예를 들자면, 도 3과 같이 각 레이아웃의 형태를 다음과 같은 리스트로 표현 가능하다. [obj1: w:10, h:10 x:0 y:0, obj2: w:20, h:25 x:25 y:25 ] 또한 주어진 각 오브젝트에 대한 색감 [obj1 전경 0x000000, 배경 : FFFFFF], 폰트 [obj1 font: 휴먼 명조, 전경: 0x000000, 배경 : FFFFFF] 및 전체 슬라이드에 대한 자연어 설명[“본 슬라이드는 벌에 대한 설명입니다.”]을 생성 할 수 있다.
먼저, 입력 전처리 단계는, 입력 PPT 정보 및 조건 PPT 정보를 레이아웃, 색감, 폰트, 자연어 설명 단위로 세분화하여 입력 특질 정보를 산출하는 단계를 의미한다.
입력 전처리 단계에서, PPT 생성모델(112)은 입력 PPT 정보 및 조건 PPT 정보를 각각 미리 학습된 트리 구조 오토 인코더 신경망에 입력시켜 사전에 정의된 입력 특질 정보를 산출할 수 있다. 오토 인코더 신경망은 인공신경망을 이용하여 특정 신호를 압축 한 뒤 같은 신호를 출력으로 발생시키는 것을 목표로 하는 자율학습(Unsupervised learning) 방법이다. 이 압축 과정을 이하 특질 추출이라 칭한다.
오토 인코더 신경망은 특질 추출을 통해서 인공신경망의 입력 차원의 증가에 따른 모델 부하를 줄인다. 또한 상기 트리 구조 오토 인코더는 PPT 객체간의 상호 의존관계를 트리 구조로 생성하도록 강제한다. 이를 통해 압축 과정 중 각 오브젝트 간의 상관 관계 정보 및 개별 객체 정보가 소실되지 않도록 해 일반적인 오토 인코더 신경망과 구분된다.
심층 특질 생성 단계는 입력 전처리 단계에서 산출한 입력 특질 정보를 기반으로 심층 특질 정보를 생성하는 단계를 의미한다.
심층 특질 생성 단계에서, PPT 생성모델(112)은 입력 전처리 단계에서 산출한 입력 특질 정보를 기반으로 입력 PPT 정보의 스타일을 조건 PPT정보의 스타일로 변경시키기 위한 함수정보를 정의한 심층 특질 정보를 생성할 수 있다.
출력 후처리 단계는 심층 특질 정보를 기반으로 출력 후처리를 수행하여 출력 PPT 정보를 생성하는 단계를 의미한다.
출력 후처리 단계에서, PPT 생성모델(112)은 트리 구조 디코더 신경망을 통해 심층 특질 정보로부터 기 정의된 출력 특징 정보를 추출하고, 이를 기반으로 출력 PPT 정보를 생성할 수 있다.
한편, 앞서 설명한 바와 같이 본 실시예에 따른 PPT 추천 시스템 상에는 사용자 설명을 포함하는 PPT를 수집하여 제공하는 DB(120)가 구축될 수 있으며, 이 DB(120)를 이용하여 초기 설명 생성 신경망(ex: PPT 생성모델(112))을 학습하게 된다.
이에, 본 실시예에 따른 PPT 생성부(210)는 입력 PPT 정보 및 조건 PPT 정보를 PPT 생성 모델(112)에 적용시켜 출력 PPT 정보를 생성하되, 이러한, 출력 PPT 정보는 PPT를 구성하는 슬라이드별로 슬라이드에 대한 사용자 설명정보를 포함할 수 있다.
즉, 본 실시예에 의하는 경우 PPT 생성모델(112)은 학습 과정에서 사용자 설명을 포함하는 PPT 데이터 셋 쌍을 학습함으로써 기존의 성능을 유지하면서도 사용자가 이해할 수 있는 수준의 설명을 생성하는 것이 가능한 효과가 있다.
출력부(220)는 PPT 생성부(210)에서 생성한 출력 PPT 정보를 추천 PPT 정보로서 사용자에게 제공한다.
학습부(230)는 출력 PPT 정보의 추정을 위한 PPT 생성 모델을 트레이닝하는 기능을 수행한다.
본 실시예에 있어서, 학습부(230)는 입력 PPT 정보-조건 PPT 정보-출력 PPT 정보로 이루어진 PPT 데이터셋 쌍을 학습 데이터로서 활용하여 PPT 생성 모델을 트레이닝시킨다. 즉, 학습부(230)는 PPT 데이터셋 쌍을 학습하여 입력 PPT 정보 및 조건 PPT 정보로부터 출력 PPT 정보를 생성가능하도록 PPT 생성 모델을 사전 학습시킨다.
이하, 도 4를 함께 참조하여, 본 실시예에 따른 학습부(230)의 PPT 생성 모델 학습방법에 대해 설명하도록 한다.
본 실시예에 있어서, 학습부(230)는 PPT 데이터셋 쌍을 기반으로 학습을 위한 입력 PPT 정보, 참 조건 입력 PPT 정보 및 적대적 조건 입력 PPT 정보를 선정하고, 선정된 각 PPT 정보들을 학습 데이터로서 활용하여 PPT 생성 모델을 트레이닝시킨다.
학습부(230)는 PPT 데이터셋 쌍 내 조건 PPT 정보를 참 조건 입력 PPT 정보로, 참 조건 입력 PPT 정보에 대항하여 무작위 함수를 통해서 선별된 임의의 조건 PPT 정보를 적대적 조건 입력 PPT 정보로서 활용할 수 있다.
한편, 적대적 조건은 참조건과 대비되어 정규분포함수나 균등분포함수나 무작위 변수로 데이터베이스의 임의 PPT를 입력으로 선택된 입력이다. 즉, 모델 학습 시, 무작위 변수로 선택된 PPT가 목적 PPT과 일치할 확률은 낮은 값을 갖게 된다.
이 점에 기인하여, 학습부(230)는 참 조건 입력 PPT 정보를 기반으로 하여 생성되는 출력 PPT 정보와 PPT 데이터셋 쌍 내 기 정의된 출력 PPT 정보와의 사이에 로스 함수가 최소화되도록 PPT 생성 모델을 트레이닝시킨다.
반대로, 학습부(230)는 적대적 조건 입력 PPT 정보를 기반으로 하여 생성되는 출력 PPT 정보와 PPT 데이터셋 쌍 내 기 정의된 출력 PPT 정보와의 사이에 로스 함수가 최대가 되도록 PPT 생성 모델을 트레이닝시킨다.
즉, 학습부(230)는 적대예제 학습 및 일반 학습을 통해 초기단계 신경망을 학습한다. 적대예제 학습은 대적 조건 입력에 의해서 모델이 조건과 일치되지 않는 무작위 한 출력이 발생될 때 음수 로스 함수를 사용하여 이를 억압한다. 즉, 데이터내의 상식적인 출력과 비상식적인 출력에 대한 통념을 생성 모델에 학습한다. 이를 통해 PPT 생성모델은 PPT 디자인 상식을 일반적인 지도학습에 비해 빠르게 학습할 수 있다.
예컨대, 도 4를 참조하면, 본 실시예에 있어서, 학습부(230)는 PPT 가정 단계, PPT 전처리 단계, 심층 PPT 특질 생성 단계 및 모델 학습 적용 단계를 통해 PPT 생성모델을 학습할 수 있다. 이때, PPT 가정 단계는 무작위 함수를 통해서 적대적 조건 PPT와 참 조건 PPT를 가정하는 단계를 의미한다.
PPT 전처리 단계는 입력 PPT 및 상기 적대적 조건 PPT와 조건 PPT를 레이아웃, 색감, 폰트, 자연어 조언 단위로 세분화하여 입력 PPT 특질, 조건 PPT 특질 및 적대적 조건 PPT 특질을 세분화하는 단계를 의미한다.
심층 PPT 특질 생성 단계는 입력 PPT 특질, 적대적 조건 PPT 특질 및 조건 PPT 특질을 기반으로 심층 PPT 특질을 생성하는 단계를 의미한다.
모델 학습 적용 단계는 심층 PPT 특질을 기반으로 출력 PPT를 세분화하여 PPT 레이아웃, 색감, 폰트, 자연어 조언 특질을 생성하고 이를 기반으로 로스 함수를 적용하는 단계를 의미한다.
한편, 학습부(230)는 PPT 생성부(210)에서 생성된 출력 PPT 정보 및 출력 PPT 정보에 상응하여 수집된 피드백 PPT 정보를 토대로 PPT 생성 모델을 재학습시킨다.
이하, 도 5를 함께 참조하여, 본 실시예에 따른 학습부(230)의 PPT 생성 모델 재학습방법을 설명하기 위한 흐름도에 대해 설명하도록 한다.
본 실시예에 있어서, 학습부(230)는 사용자로부터 새로 입력 받은 PPT(ex: 피드백 PPT 정보)를 토대로 학습한다. 이를 통해 모델 I/O를 최소화하여 학습과정이 PPT 작업을 지연시키지 않도록 한다.
학습부(230)는 사용자 PPT 입력의 상기 수정 필요성의 진리 값이 사전 정의된 수정 필요 진릿값과 같아졌을 때 수정 데이터를 메모리 또는 HDD에 저장한다. 예컨대, 학습부(230)는 피드백 PPT 정보를 기반으로 출력 PPT 정보에 대한 유사도가 기 설정된 임계치 미만인 경우 피드백 PPT 정보를 재학습을 위한 학습 데이터로서 활용한다. 이때, 수정 필요성은 필요성 도출 신경망의 출력 결과와 미리 정의된 실수 필요성 경계 및 대소관계에 대한 진리 값일 수 있다.
필요성 경계는 사용자의 선택에 따라 하나의 실수로 미리 부여된다. 필요성 도출 신경망에서는 먼저, 오토 인코더 신경망을 통해 출력 PPT 정보와 피드백 PPT를 압축한다. 그 후, 압축된 각 벡터에 대한 코사인 유사도를 미리 정의된 실수 필요성 경계와 비교한다. 이를 통해 사용자의 반응이 미리 정의된 정상 범위에서 벗어났는지에 따라서 모델의 수정여부를 결정한다.
이후, 학습부(230)는 사용자 피드백 카운트 단계를 통해 사용자 피드백 카운트를 연산한다. 이 사용자 피드백 카운트가 미리 정의된 값에 도달하거나 작업이 조언 프로그램 종료나 장기간의 자리 비움으로 장기간 중단 될 것이 예상되는 경우 재학습을 수행한다.
예컨대, 도 5를 참조하면, 학습부(230)는 PPT 전처리 단계, 피드백 유효성 검사단계 및 학습 적용 단계를 통해 PPT 생성모델을 재학습할 수 있다.
PPT 전처리 단계는 피드백 PPT를 레이아웃, 색감, 폰트, 자연어 조언 단위로 세분화하여 피드백 PPT 특질을 세분화하는 단계를 의미한다.
피드백 유효성 검사단계는 피드백 PPT 특질과 PPT 생성 모델을 기반으로 수정 필요성 여부를 검증하는 단계를 의미한다.
학습 적용 단계는 PPT 생성 모델에 로스를 적용하는 단계를 의미한다.
도 6은 본 실시예에 따른 PPT 추천방법을 설명하기 위한 순서도이다.
PPT 추천장치(110)는 PPT 데이터 셋 쌍을 기반으로 PPT 생성 모델을 트레이닝시킨다(S602). 단계 S602에서 PPT 추천장치(110)는 PPT 데이터셋 쌍을 기반으로 학습을 위한 입력 PPT 정보, 참 조건 입력 PPT 정보 및 적대적 조건 입력 PPT 정보를 선정하고, 선정된 각 PPT 정보들을 학습 데이터로서 활용하여 PPT 생성 모델을 트레이닝시킨다.
PPT 추천장치(110)는 변경 대상이 되는 입력 PPT 정보 및 입력 PPT 정보에 상응하는 변경 조건이 정의된 조건 PPT 정보를 수집한다(S604).
PPT 추천장치(110)는 단계 S604에서 수집한 입력 PPT 정보 및 조건 PPT 정보를 단계 S602에서 트레이닝된 PPT 생성 모델에 입력하여 조건 PPT 정보의 변경 조건을 기반으로 입력 PPT 정보의 구조를 재구성한 출력 PPT 정보를 생성한다(S606). 단계 S606에서 PPT 추천장치(110)는 입력 PPT 정보 상의 콘텐츠는 유지하되 위치, 색깔 및 폰트 중 적어도 하나의 스타일 정보를 조건 PPT 정보의 스타일 정보에 기반하여 변경한 출력 PPT 정보를 생성할 수 있다.
PPT 추천장치(110)는 PPT를 구성하는 슬라이드별로 슬라이드에 대한 사용자 설명정보를 포함하는 출력 PPT 정보를 생성할 수 있다.
PPT 추천장치(110)는 단계 S606에서 생성한 출력 PPT 정보를 추천 PPT 정보로서 사용자에게 제공한다(S608).
PPT 추천장치(110)는 단계 S608의 출력 PPT 정보 및 해당 출력 PPT 정보에 상응하여 수집된 피드백 PPT 정보를 토대로 PPT 생성 모델을 재학습시킨다(S610). 단계 S610에서 PPT 추천장치(110)는 피드백 PPT 정보를 기반으로 출력 PPT 정보에 대한 유사도가 기 설정된 임계치 미만인 경우 상기 피드백 PPT 정보를 재학습을 위한 학습 데이터로서 활용한다.
PPT 추천장치(110)는 학습 데이터로서 수집되는 상기 피드백 PPT 정보의 카운트를 연산하고, 연산결과가 기 정의된 값에 도달하는 경우 상기 피드백 PPT 정보를 기반으로 한 재학습을 수행한다.
여기서, 단계 S602 내지 S610은 앞서 설명된 PPT 추천장치(110)의 각 구성요소의 동작에 대응되므로 더 이상의 상세한 설명은 생략한다.
한편, 도 6에서는 각각의 과정을 순차적으로 실행하는 것으로 기재하고 있으나, 반드시 이에 한정되는 것은 아니다. 다시 말해, 도 6에 기재된 과정을 변경하여 실행하거나 하나 이상의 과정을 병렬적으로 실행하는 것으로 적용 가능할 것이므로, 도 6은 시계열적인 순서로 한정되는 것은 아니다.
전술한 바와 같이 도 6에 기재된 PPT 추천장치(110)의 PPT 추천방법은 프로그램으로 구현되고 컴퓨터의 소프트웨어를 이용하여 읽을 수 있는 기록매체(CD-ROM, RAM, ROM, 메모리 카드, 하드 디스크, 광자기 디스크, 스토리지 디바이스 등)에 기록될 수 있다.
이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100: 사용자 단말기 110: PPT 추천장치
112: PPT 생성모델 120: DB
200: 데이터 수집부 210: PPT 생성부
220: 출력부 230: 학습부

Claims (16)

  1. 변경 대상이 되는 입력 PPT 정보 및 상기 입력 PPT 정보에 상응하는 변경 조건이 정의된 조건 PPT 정보를 수집하는 데이터 수집부;
    사전에 트레이닝된 PPT 생성 모델을 포함하고, 상기 입력 PPT 정보 및 상기 조건 PPT 정보를 상기 PPT 생성 모델에 입력하여 상기 변경 조건을 기반으로 상기 입력 PPT 정보의 구조를 재구성한 출력 PPT 정보를 생성하는 PPT 생성부; 및
    상기 출력 PPT 정보를 추천 PPT 정보로서 사용자에게 제공하는 출력부
    를 포함하는 것을 특징으로 하는 PPT 추천장치.
  2. 제 1항에 있어서,
    상기 데이터 수집부는,
    상기 입력 PPT 정보에 상응하여 변경하고자 하는 스타일 정보를 기반으로 하여 작성된 상기 조건 PPT 정보를 수집하는 것을 특징으로 하는 PPT 추천장치.
  3. 제 1항에 있어서,
    상기 PPT 생성 모델은
    입력 PPT 정보-조건 PPT 정보-출력 PPT 정보의 쌍으로 이루어진 데이터셋 PPT를 학습하여 상기 입력 PPT 정보 및 상기 조건 PPT 정보로부터 상기 출력 PPT 정보를 생성하도록 사전 학습된 것을 특징으로 하는 PPT 추천장치.
  4. 제 3항에 있어서,
    상기 PPT 생성 모델은
    적어도 하나 이상의 네트워크 구조로 이루어지며 상기 네트워크 구조를 기반으로,
    상기 입력 PPT 정보 및 상기 조건 PPT 정보를 레이아웃, 색감, 폰트, 자연어 설명 단위로 세분화하여 입력 특질 정보를 산출하는 입력 전처리 단계;
    상기 입력 특질 정보를 기반으로 상기 입력 PPT 정보의 스타일을 상기 조건 PPT 정보의 스타일로 변경시키기 위한 함수정보를 정의한 심층 특질 정보를 생성하는 심층 특질 생성 단계; 및
    상기 심층 특질 정보를 기반으로 출력 후처리를 수행하여 상기 출력 PPT 정보를 생성하는 출력 후처리 단계를 수행하도록 구현된 것을 특징으로 하는 PPT 추천장치.
  5. 제 1항에 있어서,
    상기 PPT 생성부는,
    상기 입력 PPT 정보 및 상기 조건 PPT 정보를 상기 PPT 생성 모델에 적용시켜, 상기 입력 PPT 정보 상의 콘텐츠는 유지하되 위치, 색깔 및 폰트 중 적어도 하나의 스타일 정보를 상기 조건 PPT 정보의 스타일 정보에 기반하여 변경한 상기 출력 PPT 정보를 생성하는 것을 특징으로 하는 PPT 추천장치.
  6. 제 5항에 있어서,
    상기 PPT 생성부는,
    PPT를 구성하는 슬라이드별로 상기 슬라이드에 대한 사용자 설명정보를 포함한 상기 출력 PPT 정보를 생성하는 것을 특징으로 하는 PPT 추천장치.
  7. 제 1항에 있어서,
    입력 PPT 정보-조건 PPT 정보-출력 PPT 정보로 이루어진 PPT 데이터셋 쌍을 기반으로 상기 PPT 생성 모델을 트레이닝시키는 학습부를 더 포함하는 것을 특징으로 하는 PPT 추천장치.
  8. 제 7항에 있어서,
    상기 학습부는,
    상기 PPT 데이터셋 쌍을 기반으로 학습을 위한 입력 PPT 정보, 참 조건 입력 PPT 정보 및 적대적 조건 입력 PPT 정보를 선정하고, 선정된 각 PPT 정보들을 학습 데이터로서 활용하여 상기 PPT 생성 모델을 트레이닝시키는 것을 특징으로 하는 PPT 추천장치.
  9. 제 8항에 있어서,
    상기 학습부는,
    상기 PPT 데이터셋 쌍 내 조건 PPT 정보를 상기 참 조건 입력 PPT 정보로, 상기 참 조건 입력 PPT 정보에 대항하여 무작위 함수를 통해서 선별된 임의의 조건 PPT 정보를 적대적 조건 입력 PPT 정보로서 활용하는 것을 특징으로 하는 PPT 추천장치.
  10. 제 8항에 있어서,
    상기 학습부는,
    상기 참 조건 입력 PPT 정보를 기반으로 하여 생성되는 출력 PPT 정보와 상기 PPT 데이터셋 쌍 내 기 정의된 출력 PPT 정보와의 사이에 로스 함수가 최소화되도록,
    상기 적대적 조건 입력 PPT 정보를 기반으로 하여 생성되는 출력 PPT 정보와 상기 PPT 데이터셋 쌍 내 기 정의된 출력 PPT 정보와의 사이에 로스 함수가 최대가 되도록 상기 PPT 생성 모델을 트레이닝시키는 것을 특징으로 하는 PPT 추천장치.
  11. 제 7항에 있어서,
    상기 학습부는,
    상기 PPT 생성부에서 생성된 상기 출력 PPT 정보 및 상기 출력 PPT 정보에 상응하여 수집된 피드백 PPT 정보를 토대로 상기 PPT 생성 모델을 재학습시키는 것을 특징으로 하는 PPT 추천장치.
  12. 제 11항에 있어서,
    상기 학습부는,
    상기 피드백 PPT 정보를 기반으로 상기 출력 PPT 정보에 대한 유사도가 기 설정된 임계치 미만인 경우 상기 피드백 PPT 정보를 재학습을 위한 학습 데이터로서 활용하는 것을 특징으로 하는 PPT 추천장치.
  13. 제 12항에 있어서,
    상기 학습부는.
    상기 학습 데이터로서 수집되는 상기 피드백 PPT 정보의 카운트를 연산하고, 연산결과가 기 정의된 값에 도달하는 경우 상기 피드백 PPT 정보를 기반으로 한 재학습을 수행하는 것을 특징으로 하는 PPT 추천장치.
  14. 변경 대상이 되는 입력 PPT 정보 및 상기 입력 PPT 정보에 상응하는 변경 조건이 정의된 조건 PPT 정보를 수집하는 과정;
    상기 입력 PPT 정보 및 상기 조건 PPT 정보를 사전에 트레이닝된 PPT 생성 모델에 입력하여 상기 변경 조건을 기반으로 상기 입력 PPT 정보의 구조를 재구성한 출력 PPT 정보를 생성하는 과정; 및
    상기 출력 PPT 정보를 추천 PPT 정보로서 사용자에게 제공하는 과정
    을 포함하는 것을 특징으로 하는 PPT 추천방법.
  15. 제 14항에 있어서,
    입력 PPT 정보-조건 PPT 정보-출력 PPT 정보로 이루어진 PPT 데이터셋 쌍을 기반으로 상기 PPT 생성 모델을 트레이닝시키는 과정을 더 포함하는 것을 특징으로 하는 PPT 추천방법.
  16. 제 14항에 있어서,
    상기 출력 PPT 정보 및 상기 출력 PPT 정보에 상응하여 수집된 피드백 PPT 정보를 토대로 상기 PPT 생성 모델을 재학습시키는 과정을 더 포함하는 것을 특징으로 하는 PPT 추천방법.
KR1020200018720A 2020-02-17 2020-02-17 Ppt 추천방법 및 그 장치 KR20210104247A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020200018720A KR20210104247A (ko) 2020-02-17 2020-02-17 Ppt 추천방법 및 그 장치
PCT/KR2021/001010 WO2021167257A1 (ko) 2020-02-17 2021-01-26 Ppt 추천방법 및 그 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200018720A KR20210104247A (ko) 2020-02-17 2020-02-17 Ppt 추천방법 및 그 장치

Publications (1)

Publication Number Publication Date
KR20210104247A true KR20210104247A (ko) 2021-08-25

Family

ID=77391396

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200018720A KR20210104247A (ko) 2020-02-17 2020-02-17 Ppt 추천방법 및 그 장치

Country Status (2)

Country Link
KR (1) KR20210104247A (ko)
WO (1) WO2021167257A1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100021062A (ko) * 2008-08-14 2010-02-24 (주)카카오소프트 맞춤형 디자인 템플릿 제공시스템 및 그 방법
KR102149835B1 (ko) * 2013-07-09 2020-10-26 한국과학기술원 문서 서식 교정 방법
JP5963328B2 (ja) * 2014-10-30 2016-08-03 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 生成装置、生成方法、およびプログラム
US11481550B2 (en) * 2016-11-10 2022-10-25 Google Llc Generating presentation slides with distilled content
KR20190001894A (ko) * 2017-06-28 2019-01-07 주식회사 오리지널메이커스 웹 문서 생성 방법 및 그 장치

Also Published As

Publication number Publication date
WO2021167257A1 (ko) 2021-08-26

Similar Documents

Publication Publication Date Title
US11967151B2 (en) Video classification method and apparatus, model training method and apparatus, device, and storage medium
CN111079532B (zh) 一种基于文本自编码器的视频内容描述方法
US20180268296A1 (en) Machine learning-based network model building method and apparatus
CN112418292B (zh) 一种图像质量评价的方法、装置、计算机设备及存储介质
CN110555896B (zh) 一种图像生成方法、装置以及存储介质
CN116363261B (zh) 图像编辑模型的训练方法、图像编辑方法和装置
JP2024501986A (ja) 3次元顔再構築の方法、3次元顔再構築の装置、デバイスおよび記憶媒体
CN115797606B (zh) 基于深度学习的3d虚拟数字人交互动作生成方法及系统
CN111080746A (zh) 图像处理方法、装置、电子设备和存储介质
KR20230015430A (ko) 얼굴 정보를 처리하기 위한 방법 및 장치, 전자 디바이스 및 저장 매체
CN114037003A (zh) 问答模型的训练方法、装置及电子设备
CN112990222A (zh) 一种基于图像边界知识迁移的引导语义分割方法
CN106204597A (zh) 一种基于自步式弱监督学习的视频物体分割方法
CN113763385A (zh) 视频目标分割方法、装置、设备及介质
CN112817563B (zh) 目标属性配置信息确定方法、计算机设备和存储介质
CN115690276A (zh) 虚拟形象的视频生成方法、装置、计算机设备和存储介质
CN113657272B (zh) 一种基于缺失数据补全的微视频分类方法及系统
CN114399424A (zh) 模型训练方法及相关设备
CN118131917A (zh) 基于脑电信号的多用户实时互动方法以及计算机设备
CN110163049B (zh) 一种人脸属性预测方法、装置及存储介质
KR20210104247A (ko) Ppt 추천방법 및 그 장치
CN114565964B (zh) 情绪识别模型的生成方法、识别方法、装置、介质和设备
CN117455757A (zh) 图像处理方法、装置、设备及存储介质
CN114332561A (zh) 超分辨率模型的训练方法、装置、设备及介质
KR102663160B1 (ko) 효율적인 생성형 인공지능 모델의 압축을 위한 프루닝 방법 및 시스템

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application