[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN109493401B - 演示文稿生成方法、装置以及电子设备 - Google Patents

演示文稿生成方法、装置以及电子设备 Download PDF

Info

Publication number
CN109493401B
CN109493401B CN201811237315.2A CN201811237315A CN109493401B CN 109493401 B CN109493401 B CN 109493401B CN 201811237315 A CN201811237315 A CN 201811237315A CN 109493401 B CN109493401 B CN 109493401B
Authority
CN
China
Prior art keywords
information
presentation
training
elements
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811237315.2A
Other languages
English (en)
Other versions
CN109493401A (zh
Inventor
俞亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Douyin Vision Beijing Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201811237315.2A priority Critical patent/CN109493401B/zh
Publication of CN109493401A publication Critical patent/CN109493401A/zh
Application granted granted Critical
Publication of CN109493401B publication Critical patent/CN109493401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本公开提出一种演示文稿生成方法、装置、电子设备以及非暂态计算机可读存储介质,其中,方法包括:通过获取用于描绘演示文稿的绘制图片,根据绘制图片,以及待生成演示文稿中包含的已知元素的信息,生成预测元素的信息,进一步的,根据已知元素的信息确定已知元素内容在演示文稿中的展示位置,以及根据预测元素的信息确定预测元素内容在演示文稿中的展示位置,最终,根据已知元素内容在演示文稿中的展示位置,以及预测元素内容在演示文稿中的展示位置生成演示文稿。由此,根据绘制图片自动生成演示文稿,解决了现有技术中根据模板生成演示文稿,使得灵活性差、无法自主设计的问题,提高了演示文稿的制作效率,实现了自主设计的功能。

Description

演示文稿生成方法、装置以及电子设备
技术领域
本公开涉及移动终端技术领域,尤其涉及一种演示文稿生成方法、装置以及电子设备。
背景技术
随着互联网技术的不断发展,演示文稿的制作水平逐步提高,应用领域越来越广,正成为人们工作生活的重要组成部分,并在工作汇报、企业宣传、产品推介、婚礼庆典、项目竞标、管理咨询、教育培训等领域占着举足轻重的地位。演示文稿的应用领域日益广泛,人们对幻灯片的制作需求也越来越多。
目前,演示文稿的制作主要是通过人工将图片、文字等元素填充到预设的模板,但是,这种方式需要耗费较高的人力成本,而且在一些情况下模板与内容无法很好的融合,从而导致演示文稿生成效率较低。
发明内容
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本公开提出一种演示文稿生成方法,以解决现有技术中通过人工将图片、文字等元素填充到预设的模板,再根据模板生成幻灯片,灵活性差、无法实现自主设计的技术问题,提高了幻灯片制作效率。
本公开提出一种演示文稿生成装置。
本公开提出一种电子设备。
本公开提出一种非暂态存储介质。
本公开一方面实施例提出了一种演示文稿生成方法,包括:
获取用于描绘演示文稿的绘制图片;
根据所述绘制图片,以及待生成演示文稿中包含的已知元素的信息,生成预测元素的信息;其中,所述信息包括位置和内容;
根据所述已知元素的信息确定已知元素内容在演示文稿中的展示位置,以及根据所述预测元素的信息确定预测元素内容在所述演示文稿中的展示位置;
根据已知元素内容在演示文稿中的展示位置,以及预测元素内容在所述演示文稿中的展示位置生成演示文稿。
本公开又一方面实施例提出了一种演示文稿生成装置,包括:
获取模块,用于获取用于描绘演示文稿的绘制图片;
信息生成模块,用于根据所述绘制图片,以及待生成演示文稿中包含的已知元素的信息,生成预测元素的信息;其中,所述信息包括位置和内容;
确定模块,用于根据所述已知元素的信息确定已知元素内容在演示文稿中的展示位置,以及根据所述预测元素的信息确定预测元素内容在所述演示文稿中的展示位置;
演示文稿生成模块,用于根据已知元素内容在演示文稿中的展示位置,以及预测元素内容在所述演示文稿中的展示位置生成演示文稿。
本公开又一方面实施例提出了一种电子设备,其特征在于,包括至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述实施例中所述的演示文稿生成方法。
本公开又一方面实施例提出了一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述实施例中所述的演示文稿生成方法。
本公开实施例提供的技术方案可以包含如下的有益效果:
通过获取用于描绘演示文稿的绘制图片,根据绘制图片,以及待生成演示文稿中包含的已知元素的信息,生成预测元素的信息,进一步的,根据已知元素的信息确定已知元素内容在演示文稿中的展示位置,以及根据预测元素的信息确定预测元素内容在演示文稿中的展示位置,最终,根据已知元素内容在演示文稿中的展示位置,以及预测元素内容在演示文稿中的展示位置生成演示文稿。由此,根据绘制图片自动生成演示文稿,解决了现有技术中根据模板生成演示文稿,使得灵活性差、无法自主设计的问题,提高了演示文稿的制作效率,实现了自主设计的功能。
附图说明
本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本公开实施例所提供的一种演示文稿生成方法的流程示意图;
图2为本公开实施例所提供的一种生成预测元素的信息方法的流程示意图;
图3为本公开实施例所提供的一种训练预测模型的流程示例图;
图4为本公开实施例所提供的另一种演示文稿生成方法的流程示意图;
图5为本公开实施例所提供的一种演示文稿生成装置的结构示意图;
图6是图示根据本公开的实施例的电子设备的硬件结构示意图;以及
图7是图示根据本公开实施例的非暂态存储介质的示意图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
下面参考附图描述本公开实施例的演示文稿生成方法和装置。
图1为本公开实施例所提供的一种演示文稿生成方法的流程示意图。
如图1所示,该演示文稿生成方法包括以下步骤:
步骤101,获取用于描绘演示文稿的绘制图片。
其中,绘制图片,可以是通过电子设备直接绘制的用于描绘演示文稿图片,也可以是在纸上绘制的,再通过相机拍摄得到的图片。绘制图片的具体获取方式,本公开实施例中不做限定。其中,演示文稿,是指把静态文件制作成动态文件浏览,把复杂的问题变的通俗易懂,使之更加生动,给人留下更为深刻印象的幻灯片。一套完整的演示文稿一般包含:片头动画、PPT封面、前言、目录、过渡页、图表页、图片页、文字页、封底、片尾动画等。演示文稿正成为人们工作生活的重要组成部分,已经广泛的应用在工作汇报、企业宣传、产品推介、婚礼庆典、项目竞标、管理咨询等领域。
本公开实施例中,如果用于描绘演示文稿的绘制图片是在纸上绘制的,可以通过拍摄将纸质的图片转换为用于描绘演示文稿的绘制图片;如果在电子设备上绘制的,只需要读取用户输入的绘制图片,即可获得用于演示文稿的绘制图片。
需要说明的是,演示文稿的格式为XML格式,XML是一种标记语言,结构化的信息中包含了一些内容(例如文字,图片等)和一些指示出内容的重现手段的标记。每个演示文稿的XML包含了设定的在特定域语言(Domain-specific Language,DSL)中的标识(token),另外,每个token都可以有对应的一个序列号。
步骤102,根据绘制图片,以及待生成演示文稿中包含的已知元素的信息,生成预测元素的信息。
其中,已知元素,是指绘制图片所描绘的演示文稿中已知包含的元素,具体已知元素一般是演示文稿的开始元素,在XML格式中对应<START>。预测元素,是指预测出的绘制图片所描绘的演示文稿中可能包含的元素。
无论是已知元素的信息还是预测元素的信息,这里的信息具体包含两方面内容,一方面是位置,一方面是内容。具体来说,位置是用于指示对应元素在演示文稿中的展示位置,内容是用于指示对应元素的内容,例如图像内容或者是文本内容,又或者是控件内容等等。
本公开实施例中,为了基于绘制图片,和绘制图片描绘的演示文稿中包含的已知元素,预测出绘制图片描绘的演示文稿中包含的其他预测元素,作为一种可能的实现方式,可以对绘制图片进行特征提取,得到图像特征,以及,对已知元素的信息进行特征提取,得到已知元素的元素特征,进而将图像特征和已知元素的元素特征输入预先训练的预测模型中,得到预测元素的信息。由于该预测模型已经过预先训练,学习得到输入的特征与输出的信息之间的对应关系,基于该对应关系,可以预测出预测元素的信息。
具体生成预测元素的信息的过程如图2所示,并在后续进行详细介绍。
步骤103,根据已知元素的信息确定已知元素内容在演示文稿中的展示位置,以及根据预测元素的信息确定预测元素内容在演示文稿中的展示位置。
本公开实施例中,已知元素和预测元素的信息可以是通过XML格式的演示文稿中的token来表示的,其中,token中包含多种信息,可以为用于指示位置的坐标,以及用于指示内容的文本字体、文本内容、图片内容、控件内容等信息,其中,文本内容具体可以表示为文本字符,也可以是文本字符的替代表示。
因此,可以根据已知元素的信息确定已知元素内容在演示文稿中的展示位置。同理,也可以根据预测元素的信息确定预测元素内容在演示文稿中的展示位置。已知元素和预测元素如前述提及的,可以是字符、控件、图片等多种形式,本实施例中对此不作限定。
例如,待生成演示文稿中包含的已知元素或预测元素的信息为<a>、x、y、width、height、content,</a>,其中<a>为文本内容,x,y为该元素的坐标,用来确定该元素在演示文稿的展示位置,width,height为该已知元素的宽和高,</a>代表该内容文本结束。
又例如,待生成演示文稿中包含的已知元素或预测元素的信息为<PAD>,<START>,<a>,20,30,10,40,test,</a>,<END>,其中<PAD>表示空白,起到占位符的作用,<a>为该元素的文本内容,<START>表示XML格式的演示文稿的开始元素,<END>表示XML格式的演示文稿的结束元素,20和30为该元素的坐标,用来确定该元素在演示文稿的展示位置,10和40为该元素的宽和高。同时,文本内容可以有自己对应的序列号,例如,<a>对应的序列号可能为1,在文本内容较长时,可以起到简化表示的作用。
步骤104,根据已知元素内容在演示文稿中的展示位置,以及预测元素内容在演示文稿中的展示位置生成演示文稿。
本公开实施例中,由于已经确定了已知元素内容在演示文稿中的展示位置和预测元素内容在演示文稿中的展示位置,进而可以根据已知元素内容在演示文稿中的展示位置,以及预测元素内容在演示文稿中的展示位置对应的生成演示文稿。
本公开实施例的演示文稿生成方法,通过获取用于描绘演示文稿的绘制图片,根据绘制图片,以及待生成演示文稿中包含的已知元素的信息,生成预测元素的信息,进一步的,根据已知元素的信息确定已知元素内容在演示文稿中的展示位置,以及根据预测元素的信息确定预测元素内容在演示文稿中的展示位置,最终,根据已知元素内容在演示文稿中的展示位置,以及预测元素内容在演示文稿中的展示位置生成演示文稿。由此,根据绘制图片自动生成演示文稿,解决了现有技术中根据模板生成演示文稿,使得灵活性差、无法自主设计的问题,提高了演示文稿的制作效率,实现了自主设计的功能。
作为一种可能的实现方式,在图1所述实施例的基础上,参见图2,步骤102还可以包括:
步骤201,对绘制图片进行特征提取,得到图像特征。
作为一种可能的实现方式,本公开中,可以使用卷积神经网络(ConvolutionalNeural Network,CNN)的计算机视觉模型,对绘制图片进行特征提取,进而得到图像特征。
其中,卷积神经网络,是一种深度前馈人工神经网络,已成功地应用于图像识别中。它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网络通过特征提取层对绘制图片进行特征提取,得到图像特征。特征提取层,是每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来。
具体地,根据绘制图片中各像素点,生成像素值矩阵,其中,像素值矩阵中的元素用于指示绘制图片中对应像素点的取值,进而采用卷积神经网络对像素值矩阵进行特征提取,得到图像特征。其中,像素点,是指能够单独显示颜色的最小单元。图像特征,是指图像的垂直边缘、水平边缘、颜色、纹理等等。
本公开实施例中,特征提取,是指使用卷积神经网络提取绘制图片的信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。并且,不同的绘制图片所提取的特征应该是相同的。
需要说明的是,由于图像是由一个个像素点构成,每个像素点有三个通道,分别代表RGB颜色,因此,为了将图片转化为数字矩阵,可将绘制图片中每一个像素点转化为统一的X*Y*Z的像素值矩阵中的一个元素。其中,X、Y为预先设定的矩阵的大小,每个图像先调整到X*Y的大小,然后将每个像素点的RGB值输入到对应的每个矩阵单元中,Z即为填入的RGB值。举例说明,如果一个像素值矩阵为28*28*1,即代表这个像素值矩阵是一个长宽均为28,亮度值为1的图像。
步骤202,对已知元素的信息进行特征提取,得到已知元素的元素特征。
作为本公开实施例的一种可能的实现方式,可以采用循环神经网络(RecurrentNeural Network,RNN)对已知元素的信息进行特征提取,得到已知元素的元素特征。
其中,循环神经网络,是一类用于处理序列数据的神经网络,一个序列到序列的模型。序列数据,可以是时间序列、文字序列等,具有后面的数据跟前面的数据有关系的特点。其中,时间序列数据是指在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。
步骤203,将图像特征和已知元素的元素特征输入预先训练的预测模型中,得到预测元素的信息。
具体地,将在步骤201和步骤202中提出的图像特征和已知元素的元素特征输入预先训练的预测模型中,可以得到预测元素的信息。
进一步的,继续循环执行将预测模型前次输出的预测元素的信息进行特征提取得到的元素特征,以及将图像特征输入预测模型中,得到预测模型本次输出的预测元素的信息,直至预测模型输出预设结束元素的信息为止。
需要说明的是,首次输入预测模型中的已知元素为预设起始元素。
作为一种示例,假设预测模型为h(i,t),首次使用预测模型时,对绘制图片进行特征提取得到的图像特征为i,对已知元素的信息进行特征提取得到的已知元素的元素特征为t,此时的已知元素为预设起始元素<START>,然后用h(i,t)的输出值作为第二次输入的t,直到某一次h(i,t)的输出值为结束元素<END>为止,最终,收集该模型从第一次输入到结束输出的所有结果,即为我们需要的演示文稿在XML格式下包含的token序列,然后将token序列转为XML格式表示的演示文稿,进而还可以根据需要转化为其他格式表示的演示文稿。
本公开实施例中,通过对绘制图片进行特征提取,得到图像特征,对已知元素的信息进行特征提取,得到已知元素的元素特征,最终将图像特征和已知元素的元素特征输入预先训练的预测模型中,得到预测元素的信息。由此,根据绘制图片和已知元素的信息,得到预测元素的信息,从而实现根据绘制图片自动生成演示文稿,提高了制作效率。
上述实施例中的预测模型,是根据大量的训练图片和演示文档采用机器学习方面的知识和模型训练得到的。下面结合图3,对如何训练得到预测模型进行详细介绍,具体步骤如下:
步骤301,获取用于描绘训练演示文稿的训练图片,以及训练演示文稿中包含的各训练元素。
本公开实施例中,用于描绘训练演示文稿的训练图片,可以是通过电子设备直接绘制的图片,也可以是在纸上绘制的,再通过相机拍摄得到的图片。具体获取方式,本公开实施例中不做限定。
其中,训练演示文稿中包含的各训练元素,是指用于输入预测模型的信息。
由于预测模型是根据大量的训练图片和演示文档采用机器学习方面的知识和模型训练得到的,因此首先获取用于描绘训练演示文稿的训练图片,以及训练演示文稿中包含的各训练元素。
步骤302,根据各训练元素在训练演示文稿中的展示位置,以及各训练元素内容生成各训练元素的信息。
本公开实施例中,各训练元素的信息都可以通过XML格式的训练演示文稿中的token来表示,其中,token中包含多种信息,可以为用于指示位置的坐标,以及用于指示内容的文本字体、文本内容、图片内容、控件内容等信息,其中,文本内容具体可以表示为文本字符,也可以是文本字符的替代表示。因此,可以根据训练元素的信息确定各训练元素在训练演示文稿中的展示位置。
由于根据各训练元素在训练演示文稿中的展示位置可知各训练元素的坐标和该元素的高和宽,并且token包含有各训练元素的文本字体、文本内容、图片内容、控件内容等信息,进一步的,可以根据各训练元素在训练演示文稿中的展示位置,以及各训练元素内容生成各训练元素的信息。
步骤303,对各训练元素的信息提取出的元素特征顺序排列得到训练序列。
作为一种可能的实现方式,可以采用循环神经网络对各训练元素的信息进行元素特征提取,并对提取到的元素特征的顺序进行排列得到训练序列。其中,预设起始元素的信息提取出的元素特征位于训练序列的首位,预设结束元素的信息提取出的元素特征位于训练序列的末位。
其中,训练序列,是对各训练元素的信息进行元素特征提取的顺序进行排列得到的序列。
步骤304,根据训练图片提取出的图像特征,以及训练序列中各元素特征,训练预测模型,以学习得到图像特征和训练序列中的元素特征组合,与训练元素的信息之间的对应关系。
作为一种可能的实现方式,本公开中,可以使用卷积神经网络的计算机视觉模型,对训练图片进行特征提取,进而得到图像特征。
进一步的,根据各训练图片提取出的图像特征,以及训练序列中各元素特征,训练预测模型。具体地,根据训练图片提取出的图像特征,以及对训练元素的信息提取的元素特征,可以学习得到图像特征和元素特征组合,进而,将得到的图像特征和元素特征组合再输入另一个循环神经网络中,得到训练预测元素的信息。
同理,根据各训练图片提取出的图像特征,以及训练序列中各元素特征,训练预测模型,可以学习得到图像特征和训练序列中的元素特征组合,与训练元素的信息之间的对应关系。由此,训练得到预测模型。
本公开实施例中,可以通过训练图片和已知的根据该训练图片生成的训练演示文稿,检验该训练模型的准确性。具体地,对该绘制图片进行图片特征提取,将提取到的图片特征输入到训练得到的预测模型,并对根据该绘制图片生成的演示文稿的元素信息进行特征提取,将提取到的元素特征也输入到训练得到的预测模型,进而输出得到演示文稿的已知元素的信息。然后使用交叉熵代价函数来衡量该输出值和前述预测之间的差距,并据此差距对训练得到的预测模型进行参数调整,进而得到一个准确的预测模型。
其中,交叉熵代价函数(Cross Entropy Cost Function)是用来衡量人工神经网络的预测值与实际值的一种方式。
本公开实施例中,通过获取用于描绘训练演示文稿的训练图片,以及训练演示文稿中包含的各训练元素,根据各训练元素在训练演示文稿中的展示位置,以及各训练元素内容生成各训练元素的信息,对各训练元素的信息提取出的元素特征顺序排列得到训练序列,根据训练图片提取出的图像特征,以及训练序列中各元素特征,训练预测模型,以学习得到图像特征和训练序列中的元素特征组合,与训练元素的信息之间的对应关系。由此,通过训练图片以及训练演示文稿中包含的各训练元素,可以训练得到预测模型,进而根据预测模型实现自动生成演示文档,提高了制作效率。
为了便于理解,在一个具体的实施例中通过算法对本公开的演示文稿生成方法进行描述,如图4所示,具体实现过程如下:
步骤401,获取绘制图片。
步骤402,通过卷积神经网络对绘制图片进行图片特征提取,得到图片特征。
步骤403,获取待生成演示文稿的已知元素的初始元素的信息。
步骤404,获取待生成演示文稿的已知元素的信息。
步骤405,通过循环神经网络对已知元素的信息进行特征提取,得到已知元素的元素特征。
步骤406,将在步骤402和步骤405中得到的图片特征和已知元素的元素特征,进行合并,得到元素特征组合。
步骤407,将步骤406中合并得到的元素特征组合输入另一个循环神经网络。
步骤408,输出预测元素的信息。
步骤409,判断输出的是否为预设结束元素的信息。
具体地,判断输出的预测元素信息是否为预设结束元素的信息,如果不是预设结束元素的信息,则执行步骤410,否则,执行步骤412。
步骤410,将当前输出的元素的信息提取出的元素特征放入元素的信息序列中。
步骤411,输入当前元素的信息。
具体地,对步骤408中输出的预测元素信息进行特征提取,进一步的得到预测元素特征。并重复执行上述步骤406-409。
步骤412,输出所有的元素特征对应的序列。
具体地,在步骤409中判断预测模型输出的是预设结束元素的信息时,输出所有元素的信息提取出的元素特征顺序排列得到的序列。
步骤413,转化为演示文稿。
步骤414,输出演示文稿并结束。
本公开实施例中,通过对绘制图片进行特征提取得到图片特征,对已知元素的信息进行特征提取得到元素特征信息,将提取得到的图片特征和元素特征进行合并得到元素特征组合,输入预测模型得到预测元素信息,进一步的判断输出的预测元素信息是否为预设结束元素的信息,进而将输出的所有的元素的信息序列转化为演示文稿,并输出该演示文稿。由此,根据绘制图片自动生成演示文稿,解决了现有技术中根据模板生成演示文稿,使得灵活性差、无法自主设计的问题,提高了演示文稿的制作效率,实现了自主设计的功能。
为了实现上述实施例,本公开还提出一种演示文稿生成装置。
图5为本公开实施例提供的一种演示文稿生成装置的结构示意图。
如图5所示,该演示文稿生成装置100包括:获取模块110、信息生成模块120、确定模块130以及演示文稿生成模块140。
获取模块110,用于获取用于描绘演示文稿的绘制图片。
信息生成模块120,用于根据绘制图片,以及待生成演示文稿中包含的已知元素的信息,生成预测元素的信息,其中,所述信息包括位置和内容。
确定模块130,用于根据已知元素的信息确定已知元素内容在演示文稿中的展示位置,以及根据预测元素的信息确定预测元素内容在演示文稿中的展示位置。
演示文稿生成模块140,用于根据已知元素内容在演示文稿中的展示位置,以及预测元素内容在演示文稿中的展示位置生成演示文稿。
作为一种可能的实现方式,信息生成模块120,包括:
第一特征提取单元,用于对绘制图片进行特征提取,得到图像特征。
第二特征提取单元,用于对已知元素的信息进行特征提取,得到已知元素的元素特征。
输入单元,用于将图像特征和已知元素的元素特征输入预先训练的预测模型中,得到预测元素的信息。
作为一种可能的实现方式,信息生成模块120,还包括:
循环执行单元,用于循环执行将预测模型前次输出的预测元素的信息进行特征提取得到的元素特征,以及将图像特征输入预测模型中,得到预测模型本次输出的预测元素的信息,直至预测模型输出预设结束元素的信息为止。
作为一种可能的实现方式,信息生成模块120,还包括:
获取单元,用于获取用于描绘训练演示文稿的训练图片,以及训练演示文稿中包含的各训练元素。
生成单元,用于根据各训练元素在训练演示文稿中的展示位置,以及各训练元素内容生成各训练元素的信息。
排列单元,用于对各训练元素的信息提取出的元素特征顺序排列得到训练序列;其中,预设起始元素的信息提取出的元素特征位于训练序列的首位,预设结束元素的信息提取出的元素特征位于训练序列的末位。
学习单元,用于根据训练图片提取出的图像特征,以及训练序列中各元素特征,训练预测模型,以学习得到图像特征和训练序列中的元素特征组合,与训练元素的信息之间的对应关系。
作为另一种可能的实现方式,第一特征提取单元,还用于根据绘制图片中各像素点,生成像素值矩阵;像素值矩阵中的元素用于指示绘制图片中对应像素点的取值;
采用卷积神经网络CNN对像素值矩阵进行特征提取,得到图像特征。
作为另一种可能的实现方式,第二特征提取单元,还用于采用循环神经网络RNN对已知元素的信息进行特征提取,得到已知元素的元素特征。
作为另一种可能的实现方式,获取模块110,还可以包括:
拍摄单元,用于拍摄得到用于描绘演示文稿的绘制图片。
读取单元,用于读取输入的绘制图片。
本公开实施例的演示文稿生成装置,通过获取用于描绘演示文稿的绘制图片,根据绘制图片,以及待生成演示文稿中包含的已知元素的信息,生成预测元素的信息,进一步的,根据已知元素的信息确定已知元素内容在演示文稿中的展示位置,以及根据预测元素的信息确定预测元素内容在演示文稿中的展示位置,最终,根据已知元素内容在演示文稿中的展示位置,以及预测元素内容在演示文稿中的展示位置生成演示文稿。由此,根据绘制图片自动生成演示文稿,解决了现有技术中根据模板生成演示文稿,使得灵活性差、无法自主设计的问题,提高了演示文稿的制作效率,实现了自主设计的功能。
需要说明的是,前述对演示文稿生成方法实施例的解释说明也适用于该实施例的演示文稿生成装置,此处不再赘述。
为了实现上述实施例,本公开还提出一种电子设备,该电子设备包括至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述实施例所述的演示文稿生成方法。下面参考图6,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备800可以包括处理装置(例如中央处理器、图形处理器等)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储装置808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有电子设备800操作所需的各种程序和数据。处理装置801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
通常,以下装置可以连接至I/O接口805:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置806;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置807;包括例如磁带、硬盘等的存储装置808;以及通信装置809。通信装置809可以允许电子设备800与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备800,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置809从网络上被下载和安装,或者从存储装置808被安装,或者从ROM 802被安装。在该计算机程序被处理装置801执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取至少两个网际协议地址;向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求,其中,所述节点评价设备从所述至少两个网际协议地址中,选取网际协议地址并返回;接收所述节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从所述至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本公开为了实现上述实施例,本公开还提出一种非暂态存储介质,其特征在于,所述非暂态存储介质存储有非暂态计算机可读指令,所述非暂态计算机可读指令用于使计算机执行上述实施例所述的演示文稿生成方法。
图7是图示根据本公开的实施例的非暂态存储介质的示意图。如图7所示,根据本公开实施例的非暂态存储介质300,其上存储有非暂态计算机可读指令301。当该非暂态计算机可读指令301由处理器运行时,执行前述的本公开各实施例的演示文稿生成方法的全部或部分步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在非暂态存储介质中,如磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围。

Claims (16)

1.一种演示文稿生成方法,其特征在于,所述方法包括以下步骤:
获取用于描绘演示文稿的绘制图片;
对所述绘制图片进行特征提取,得到图像特征;对已知元素的信息进行特征提取,得到所述已知元素的元素特征;将所述图像特征和所述已知元素的元素特征输入预先训练的预测模型中,得到预测元素的信息;其中,所述已知元素的信息包括已知元素内容和对应展示位置,所述预测元素的信息包括预测元素内容和对应展示位置;
根据所述已知元素的信息确定已知元素内容在演示文稿中的展示位置,以及根据所述预测元素的信息确定预测元素内容在所述演示文稿中的展示位置;
根据已知元素内容在演示文稿中的展示位置,以及预测元素内容在所述演示文稿中的展示位置生成演示文稿。
2.根据权利要求1所述的演示文稿生成方法,其特征在于,所述将所述图像特征和所述已知元素的元素特征输入预先训练的预测模型中之后,还包括:
循环执行将所述预测模型前次输出的预测元素的信息进行特征提取得到的元素特征,以及将所述图像特征输入所述预测模型中,得到所述预测模型本次输出的预测元素的信息,直至所述预测模型输出预设结束元素的信息为止。
3.根据权利要求2所述的演示文稿生成方法,其特征在于,所述将所述图像特征和所述已知元素的元素特征输入预先训练的预测模型中之前,还包括:
获取用于描绘训练演示文稿的训练图片,以及所述训练演示文稿中包含的各训练元素;
根据各训练元素在所述训练演示文稿中的展示位置,以及各训练元素内容生成各训练元素的信息;
对各训练元素的信息提取出的元素特征顺序排列得到训练序列;其中,预设起始元素的信息提取出的元素特征位于所述训练序列的首位,预设结束元素的信息提取出的元素特征位于所述训练序列的末位;
根据所述训练图片提取出的图像特征,以及所述训练序列中各元素特征,训练所述预测模型,以学习得到所述图像特征和所述训练序列中的元素特征组合,与所述训练元素的信息之间的对应关系。
4.根据权利要求3所述的演示文稿生成方法,其特征在于,所述已知元素为预设起始元素。
5.根据权利要求1所述的演示文稿生成方法,其特征在于,所述对所述绘制图片进行特征提取,得到图像特征,包括:
根据所述绘制图片中各像素点,生成像素值矩阵;所述像素值矩阵中的元素用于指示所述绘制图片中对应像素点的取值;
采用卷积神经网络CNN对所述像素值矩阵进行特征提取,得到所述图像特征。
6.根据权利要求1所述的演示文稿生成方法,其特征在于,所述对所述已知元素的信息进行特征提取,得到所述已知元素的元素特征,包括:
采用循环神经网络RNN对所述已知元素的信息进行特征提取,得到所述已知元素的元素特征。
7.根据权利要求1-6任一项所述的演示文稿生成方法,其特征在于,所述获取用于描绘演示文稿的绘制图片,包括:
拍摄得到用于描绘演示文稿的绘制图片;
或者,读取输入的绘制图片。
8.一种演示文稿生成装置,其特征在于,所述装置包括:
获取模块,用于获取用于描绘演示文稿的绘制图片;
信息生成模块,所述信息生成模块包括第一特征提取单元、第二特征提取单元和输出单元,所述第一特征提取单元用于对所述绘制图片进行特征提取,得到图像特征;所述第二特征提取单元用于对已知元素的信息进行特征提取,得到所述已知元素的元素特征;所述输出单元将所述图像特征和所述已知元素的元素特征输入预先训练的预测模型中,得到预测元素的信息;其中,所述信息包括位置和内容;
确定模块,用于根据所述已知元素的信息确定已知元素内容在演示文稿中的展示位置,以及根据所述预测元素的信息确定预测元素内容在所述演示文稿中的展示位置;
演示文稿生成模块,用于根据已知元素内容在演示文稿中的展示位置,以及预测元素内容在所述演示文稿中的展示位置生成演示文稿。
9.根据权利要求8所述的演示文稿生成装置,其特征在于,所述信息生成模块,还包括:
循环执行单元,用于循环执行将所述预测模型前次输出的预测元素的信息进行特征提取得到的元素特征,以及将所述图像特征输入所述预测模型中,得到所述预测模型本次输出的预测元素的信息,直至所述预测模型输出预设结束元素的信息为止。
10.根据权利要求8所述的演示文稿生成装置,其特征在于,所述信息生成模块,还包括:
获取单元,用于获取用于描绘训练演示文稿的训练图片,以及所述训练演示文稿中包含的各训练元素;
生成单元,用于根据各训练元素在所述训练演示文稿中的展示位置,以及各训练元素内容生成各训练元素的信息;
排列单元,用于对各训练元素的信息提取出的元素特征顺序排列得到训练序列;其中,预设起始元素的信息提取出的元素特征位于所述训练序列的首位,预设结束元素的信息提取出的元素特征位于所述训练序列的末位;
学习单元,用于根据所述训练图片提取出的图像特征,以及所述训练序列中各元素特征,训练所述预测模型,以学习得到所述图像特征和所述训练序列中的元素特征组合,与所述训练元素的信息之间的对应关系。
11.根据权利要求10所述的演示文稿生成装置,其特征在于,所述已知元素为预设起始元素。
12.根据权利要求8所述的演示文稿生成装置,其特征在于,所述第一特征提取单元,还用于:
根据所述绘制图片中各像素点,生成像素值矩阵;所述像素值矩阵中的元素用于指示所述绘制图片中对应像素点的取值;
采用卷积神经网络CNN对所述像素值矩阵进行特征提取,得到所述图像特征。
13.根据权利要求8所述的演示文稿生成装置,其特征在于,所述第二特征提取单元,还用于:
采用循环神经网络RNN对所述已知元素的信息进行特征提取,得到所述已知元素的元素特征。
14.根据权利要求8-13任一项所述的演示文稿生成装置,其特征在于,所述获取模块,包括:
拍摄单元,用于拍摄得到用于描绘演示文稿的绘制图片;
或者,
读取单元,用于读取输入的绘制图片。
15.一种电子设备,其特征在于,包括
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述权利要求1-7任一项所述的演示文稿生成方法。
16.一种非暂态存储介质,其特征在于,所述非暂态存储介质存储有非暂态计算机可读指令,所述非暂态计算机可读指令用于使所述计算机执行权利要求1-7任一项所述的演示文稿生成方法。
CN201811237315.2A 2018-10-23 2018-10-23 演示文稿生成方法、装置以及电子设备 Active CN109493401B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811237315.2A CN109493401B (zh) 2018-10-23 2018-10-23 演示文稿生成方法、装置以及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811237315.2A CN109493401B (zh) 2018-10-23 2018-10-23 演示文稿生成方法、装置以及电子设备

Publications (2)

Publication Number Publication Date
CN109493401A CN109493401A (zh) 2019-03-19
CN109493401B true CN109493401B (zh) 2019-11-22

Family

ID=65692579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811237315.2A Active CN109493401B (zh) 2018-10-23 2018-10-23 演示文稿生成方法、装置以及电子设备

Country Status (1)

Country Link
CN (1) CN109493401B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117272965B (zh) * 2023-09-11 2024-04-12 中关村科学城城市大脑股份有限公司 演示稿件生成方法、装置、电子设备和计算机可读介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699426A (zh) * 2009-11-06 2010-04-28 上海传知信息科技发展有限公司 文档格式转化系统及方法
CN103258197A (zh) * 2012-02-17 2013-08-21 柯尼卡美能达商用科技株式会社 图像处理装置及其控制方法
CN104217170A (zh) * 2014-09-26 2014-12-17 广州金山移动科技有限公司 一种文档只读方法及装置
CN107908608A (zh) * 2017-11-13 2018-04-13 付则宇 文稿的转换及在三维空间中展现的方法、存储介质和设备
CN108073680A (zh) * 2016-11-10 2018-05-25 谷歌有限责任公司 生成具有提炼内容的演示幻灯片
US9990694B2 (en) * 2013-12-05 2018-06-05 Google Llc Methods and devices for outputting a zoom sequence

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11611595B2 (en) * 2011-05-06 2023-03-21 David H. Sitrick Systems and methodologies providing collaboration among a plurality of computing appliances, utilizing a plurality of areas of memory to store user input as associated with an associated computing appliance providing the input
CN104199911A (zh) * 2014-08-28 2014-12-10 天脉聚源(北京)教育科技有限公司 Ppt演示文稿的保存方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699426A (zh) * 2009-11-06 2010-04-28 上海传知信息科技发展有限公司 文档格式转化系统及方法
CN103258197A (zh) * 2012-02-17 2013-08-21 柯尼卡美能达商用科技株式会社 图像处理装置及其控制方法
US9990694B2 (en) * 2013-12-05 2018-06-05 Google Llc Methods and devices for outputting a zoom sequence
CN104217170A (zh) * 2014-09-26 2014-12-17 广州金山移动科技有限公司 一种文档只读方法及装置
CN108073680A (zh) * 2016-11-10 2018-05-25 谷歌有限责任公司 生成具有提炼内容的演示幻灯片
CN107908608A (zh) * 2017-11-13 2018-04-13 付则宇 文稿的转换及在三维空间中展现的方法、存储介质和设备

Also Published As

Publication number Publication date
CN109493401A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
CN110458918B (zh) 用于输出信息的方法和装置
CN109618222B (zh) 一种拼接视频生成方法、装置、终端设备及存储介质
CN110189246B (zh) 图像风格化生成方法、装置及电子设备
CN109740018B (zh) 用于生成视频标签模型的方法和装置
CN111399729A (zh) 图像的绘制方法、装置、可读介质和电子设备
CN110210532B (zh) 背景色生成方法、装置及电子设备
CN110069191B (zh) 基于终端的图像拖拽变形实现方法和装置
CN112651475B (zh) 二维码显示方法、装置、设备及介质
CN112487883B (zh) 智能笔书写行为特征分析方法、装置及电子设备
CN109815448B (zh) 幻灯片生成方法及装置
CN110472558B (zh) 图像处理方法和装置
CN109816023B (zh) 用于生成图片标签模型的方法和装置
CN115209215B (zh) 视频处理方法、装置及设备
CN111738316A (zh) 零样本学习的图像分类方法、装置及电子设备
CN112487871B (zh) 笔迹数据处理方法、装置及电子设备
CN109493401B (zh) 演示文稿生成方法、装置以及电子设备
CN115937356A (zh) 图像处理方法、装置、设备及介质
CN112492399B (zh) 信息显示方法、装置及电子设备
CN109871465B (zh) 一种时间轴计算方法、装置、电子设备及存储介质
CN112486337A (zh) 笔迹图形分析方法、装置及电子设备
CN110197459A (zh) 图像风格化生成方法、装置及电子设备
CN115988255A (zh) 特效生成方法、装置、电子设备及存储介质
CN113641853A (zh) 动态封面生成方法、装置、电子设备、介质及程序产品
CN114786069A (zh) 视频生成方法、装置、介质及电子设备
CN113655933A (zh) 文本标注方法及装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20190515

Address after: Room B0035, 2nd floor, No. 3 Courtyard, 30 Shixing Street, Shijingshan District, Beijing, 100041

Applicant after: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.

Address before: 300000 Tianjin Binhai High-tech Zone Binhai Science Park, No. 39, No. 6 High-tech Road, 9-3-401

Applicant before: TIANJIN BYTEDANCE TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: Tiktok vision (Beijing) Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP03 Change of name, title or address

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Tiktok vision (Beijing) Co.,Ltd.

Address before: Room B0035, 2nd floor, No. 3 Courtyard, 30 Shixing Street, Shijingshan District, Beijing, 100041

Patentee before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address