WO2020015220A1

WO2020015220A1 - 基于pdf文档的数据下载方法及装置、存储介质、终端

Info

Publication number: WO2020015220A1
Application number: PCT/CN2018/111697
Authority: WO
Inventors: 罗先贤; 龙觉刚; 孙成; 叶俊锋; 赖云辉
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-07-19
Filing date: 2018-10-24
Publication date: 2020-01-23
Also published as: CN109284453A; CN109284453B

Abstract

本申请公开了一种基于PDF文档的数据下载方法及装置、存储介质、终端，涉及数据处理技术领域，主要目的在于现有网站需要下载的数据的格式及内容都是不固定，将这些数据添加至固定的PDF文档模板时增大了网站处理压力的问题。包括：当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据；将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板；按照所述第一类对象、第二类对象匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流；将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中。

Description

基于PDF文档的数据下载方法及装置、存储介质、终端

本申请要求与2018年7月19日提交中国专利局、申请号为2018107965600、申请名称为“基于PDF文档的数据下载方法及装置、存储介质、终端”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及一种数据处理技术领域，特别是涉及一种基于PDF文档的数据下载方法及装置、存储介质、终端。

背景技术

随着数据信息的无纸化传播的普及，越来越多的用户使用互联网网站下载数据信息进行查看。例如，在一些大数据网站中，为了获取网站中的相关数据，用户从网站中下载具有PDF格式的文档，以便用户进行打印。

目前，现有数据在生成并下载PDF文档的过程中，通常互联网网站在接收到数据下载请求后，网站预先建立一个固定的PDF文档模板，将需要下载的数据添加至PDF文档模板中，但是，由于网站需要下载的数据的格式及内容都是不固定的，将这些数据添加至固定的PDF文档模板时增大了网站处理压力，扩大了数据下载时间，而更换PDF文档模板又会增加数据下载的复杂程度，降低数据下载的效率。

发明内容

有鉴于此，本申请提供一种基于PDF文档的数据下载方法及装置、存储介质、终端，主要目的在于现有由于网站需要下载的数据的格式及内容都是不固定的，将这些数据添加至固定的PDF文档模板时增大了网站处理压力，扩大了数据下载时间，而更换PDF文档模板又会增加数据下载的复杂程度，降低数据下载的效率的问题。

依据本申请一个方面，提供了一种基于PDF文档的数据下载方法，包括：

当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据；

将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板，所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y；

根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流；

将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中，以使得用户通过所述临时存储路径下载PDF文档的数据。

依据本申请一个方面，提供了一种基于PDF文档的数据下载装置，包括：

获取单元，用于当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据；

转换单元，用于将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板，所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y；

添加单元，用于根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流；

存储单元，用于将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中，以使得用户通过所述临时存储路径下载PDF文档的数据。

根据本申请的又一方面，提供了一种非易失性可读存储介质，所述非易失性可读存储介质中存储有至少一计算机可读指令，所述计算机可读指令使处理器执行如上述基于PDF文档的数据下载方法对应的操作。

根据本申请的再一方面，提供了一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一计算机可读指令，所述计算机可读指令使所述处理器执行上述基于PDF文档的数据下载方法对应的操作。

借由上述技术方案，本申请实施例提供的技术方案至少具有下列优点：

本申请提供了一种基于PDF文档的数据下载方法及装置、存储介质、终端，首先当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据；将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板，所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y；根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF 文档的输出字节流；将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中，以使得用户通过所述临时存储路径下载PDF文档的数据。与现有网站需要下载的数据的格式及内容都是不固定的相比，本申请实施例通过将请求的文本数据、图片数据转换为可添加至PDF文档模板中的第一类对象、第二类对象，然后将第一类对象、第二类对象匹配添加至对应的类对象X、类对象Y中，然后以PDF文档的输出字节流形式写入空压缩文件中，将压缩文件存储至临时存储路径中，以实现文本数据、图片数据灵活的添加至PDF文档中，降低网站处理压力，减少了数据下载时间，灵活多样的文本域、图片域可以减少PDF文档模板的添加下载数据的复杂程度，从而提高数据下载效率。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本申请实施例提供的一种基于PDF文档的数据下载方法流程图；

图2示出了本申请实施例提供的另一种基于PDF文档的数据下载方法流程图；

图3示出了本申请实施例提供的一种基于PDF文档的数据下载装置框图；

图4示出了本申请实施例提供的另一种基于PDF文档的数据下载装置框图；

图5示出了本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本申请实施例提供了一种基于PDF文档的数据下载方法，如图1所示，所述方法包括：

101、当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据。

其中，所述请求内容为需要进行下载的具体数据，这些数据可以存储在数据库中，也可以存储在服务器的缓存中，本申请实施例不做具体限定。另外，所述文本数据为具体的文字、数字等数据，所述图片数据为进行展示图像数据，当接收到数据下载请求时，可以根据请求内容，如请求内容为10月3日用户登录网址a的历史浏览记录，则可以通过存储在服务器中的历史浏览记录获取到10月3日的文本数据、图片数据。

需要说明的是，获取到的文本数据为具体的文字、数字等数据，而获取到的图片数据则为图片的标识码，如条形码，条形码本身为一个英文和数字组成的字符串通过开源代码转换成相应规格的条形码，本实施例中的规格包括条形码的类型、条形码的粗细、大小、显示分辨率等，不做具体限定。

102、将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板。

其中，所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y。PDF文档模板中预先配置有不同大小、不同形式的文本域及图片域，每个文本域可以根据需要生成的文本数据的多少、大小、属性进行配置，并针对不同文本域进行命名，当将文本数据添加至文本域中时，可以根据文本域的名称进行添加。另外，图片域为带有坐标位置信息的区域，在进行添加图片数据时，可以根据坐标位置信息将图片添加至具体的位置中，且预先创建的PDF文档模板建立的是空白PDF文档，不同的文本域或者图片域配置有分别对应的文本的类对象X，以及图片的类对象Y，以便在添加文本和图片时，进行匹配添加。

需要说明的是，对于文本数据可以直接将具体的文字、数据转换为类对象，为了区分与图片数据进行转换出的类对象，文本数据转换得到第一类对象，对于图片数据可以通过标识码转换为图像的二进制码，再将二进制码转换为第二类对象。

103、根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流。

本申请实施例中，为了准确的将文本数据添加至文本域中，并将图片数据添加至图片域中，通过将文本数据转换的第一类对象匹配添加至文本域中的类对象X中，将图片数据转换的第二类对象匹配添加至图片域中的类对象Y中。其中，PDF文档模板中预先有了固定的类对象X，然后根据类对象的属性或者类型，确定出第一类对象匹配的类对象X。为了便于将添加完文本数据及图片数据的PDF文档进行输出，建立针对PDF 文档的输出字节流，以便进行步骤104中写入空压缩文件的步骤。

104、将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中。

对于本申请实施例，以使得用户通过所述临时存储路径下载PDF文档的数据。所述空压缩文件为预先建立的没有添加任何内容的空白压缩文件，并在服务器的临时存储路径中预留一个位置，当根据获取到的数据添加至PDF文档后，将PDF文档的输出字节流写入这个空白压缩文件中，并将写完的压缩文件存储在预留的位置中，以便用户随时从临时存储路径中下载PDF文档。

本申请提供了一种基于PDF文档的数据下载方法，与现有网站需要下载的数据的格式及内容都是不固定的相比，本申请实施例通过将请求的文本数据、图片数据转换为可添加至PDF文档模板中的第一类对象、第二类对象，然后将第一类对象、第二类对象匹配添加至对应的类对象X、类对象Y中，然后以PDF文档的输出字节流形式写入空压缩文件中，将压缩文件存储至临时存储路径中，以实现文本数据、图片数据灵活的添加至PDF文档中，降低网站处理压力，减少了数据下载时间，灵活多样的文本域、图片域可以减少PDF文档模板的添加下载数据的复杂程度，从而提高数据下载效率。

本申请实施例提供了另一种基于PDF文档的数据下载方法，如图2所示，所述方法包括：

201、建立所述PDF文档模板，并在所述PDF文档模板中划分文本域、图片域。

对于本申请实施例，为了避免在添加文本数据、图片数据时，需要重新建立PDF模板，所以本申请实施例预先建立已经划分好文本域、图片域的PDF文档模板，所述文本域中包含有不同名称的文本区域，所述不同名称的文本区域中分别包含不同文本数据的数量、属性，所述图片域中包含不同图片区域，每个图片区域中包含所述图片区域对应的位置坐标。

需要说明的是，由于PDF文档模板中可以包括多个文本域、多个图片域，因此，在划分文本域、图片域时，文本域的划分是根据文本数据的数量、属性命名不同大小区域的文本域，文本数据的数量为文字、数字等数据，即形成文本的数据大小，数据属性包括字符串数据、字节数据等，根据文本数据数量、属性划分出不同大小的区域，并对每个区域进行命名。另外，图片域中包含有不同位置坐标的区域，不同的位置坐标可以添加不同的图片，即一个区域中按照位置坐标可以添加多张图片，也可以在一个PDF文档模板中划分出多个图片域，本申请实施例不做具体限定。图片数据的条形码的位置是预先划分出来的，即可以利用坐标轴的形式确定出，例如，当请求内容为图片数据时，根据预先划分出来的图片数据的条形码位置将条形码添加至这个位置中。

202、提取服务器中暂停使用的所述临时存储路径，建立所述空压缩文件，并将所述空压缩文件存储至所述临时存储路径下的临时文件中。

对于本申请实施例，为了不影响其他数据的存储，以及不占用正常数据的使用，提取服务器中暂停使用的临时存储路径，在这个临时存储路径下建立空白的压缩文件，并存储至临时存储路径下的临时文件中，以便将PDF文档添加至当前空压缩文件时，直接从临时文件中提取空压缩文件。

203、当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据。

本步骤与图1所示的步骤101方法相同，在此不再赘述。

204、将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板。

本步骤与图1所示的步骤102方法相同，在此不再赘述。对于本申请实施例，步骤204具体可以为：根据所述文本数据的数据属性定义与所述文本域中类对象X匹配的第一类对象；将所述图片数据的标识码转换为二进制码，将所述二进制码转换为与所述类对象Y匹配的第二类对象；分别读取预先创建的PDF文档模板中文本域的类对象X以及图片域中的类对象Y，所述类对象X为可添加文本数据、属性的类对象，所述类对象Y为可添加图片数据的坐标位置的类对象。

对于本申请实施例，定义的第一类对象即为查询到的具体文本数据，第一类对象的各个属性即与文本数据的属性设定为相同，从而在进行匹配时，可以直接将第一类对象与类对象X进行匹配。本申请实施例中，由于图片数据在获取时，获取的即为图片数据的标识码，如条形码，为了将图片数据转换成与类对象Y匹配的第二类对象，需要将标识码转换为二进制码，然后通过二进制码转换为第二类对象。

另外，为了将第一类对象与第二类对象准确的添加在预先创建的PDF模板中，在读取到第一类对象与第二类对象之后，需要读取PDF文档模板中类对象X以及类对象Y，从而进行准确的匹配添加。

205、根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流。

本步骤与图1所示的步骤103方法相同，在此不再赘述。对于本申请实施例，步骤205具体可以为：利用AcroFields类对象将所述类对象X的属性进行初始化，将所述第一类对象中的属性与所述类对象X的属性进行配置；将所述第二类对象的标识码与所述类对象Y的坐标位置进行匹配配置，所述匹配配置为按照所述标识码与所述坐标位置之间的预置映射关系进行配置；根据按照所述PDF文档模板匹配配置类对象X、类对象Y后的PDF文档建立输出字节流。

对于本申请实施例，所述AcroFields类对象为通用的pdf文本域的java类，初始化的过程即为将类对象X的属性初始化给AcroFields类对象对应的文本域变量。其中，PDF文档模板中各个文本域字段，这部分属性字段最终又初始化给标准的AcroFields类对象的各属性字段，AcroFields的属性字段就是从指定的pdf模板中读取来的，还可以包括额外的字段，用于参数传递或记录信息，如路径名、标志位、PDF文件名等，本申请实施例不做具体限定。

另外，由于本申请实施例中的类对象为一种数据结构，存储类的基本信息：类大小，类名称，类的版本，继承层次，以及消息与函数的映射表等，类对象Y中存储有页面、坐标信息等信息，这些页面、坐标信息可以与标识码进行匹配，具体的，通过标识码与坐标位置之间的预置映射关系进行配置，如标识码1与坐标位置(a，b，c)之间存在预置映射关系，则将标识码1与坐标位置(a，b，c)进行配置，当转换后的第二类对象的标识码可以匹配配置到类对象Y页面、坐标信息，从而将图片添加至PDF文档中，例如，根据PDF文档模板中类对象Y的页面、坐标信息，将获取到的条形码对应的图片写入到页面、坐标信息的位置上。

需要说明的是，建立的输出字节流即为已经添加完文本数据、图片数据的PDF文档的输出字节流，当这个PDF文档生成输出字节流后，这个输出字节流的字节信息即为完成的PDF文档对象。

206、将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中。

本步骤与图1所示的步骤104方法相同，在此不再赘述。

207、压缩完成后，以输出流的形式将所述压缩文件转换为二进制字输出节流。

对于本申请实施例，以使得用户下载所述压缩文件。例如，当写入空压缩文件后的PDF文档得到压缩文件存储在服务器的临时路径中，读取这个压缩文件输入流中，这个输入流是指压缩文件输入到内存或缓存中，再转化为二进制字节流，并写入到输出流，这里的字节流为八位的通用字节流，即将压缩文件转换成字节数据，这里的输出流是指从内存或缓存中进行输出，从而传输至客户端进行下载。当压缩完成后，即可读取传输到输入流中的压缩文件，输入流中的压缩文件是以二进制字节流形式进行转换，以便客户端进行下载。

208、按照预设时间间隔清除所述服务器的临时存储路径下临时文件中的压缩文件。

对于本申请实施例，为了避免临时存储路径下临时文件过多、过大影响服务器处理效率，需要按照一定的时间间隔清除服务器的临时存储路径下临时文件中的压缩文件，以便使临时存储路径一直保持可存储状态。其中，预设时间间隔可以根据数据的下载量进行设定，例如，下载量过大时，设定为10分钟，下载量过小时，设定为1小时，本申请实施例不做具体限定。

本申请提供了另一种基于PDF文档的数据下载方法，本申请实施例通过将请求的文本数据、图片数据转换为可添加至PDF文档模板中的第一类对象、第二类对象，然后将第一类对象、第二类对象匹配添加至对应的类对象X、类对象Y中，然后以PDF文档的输出字节流形式写入空压缩文件中，将压缩文件存储至临时存储路径中，以实现文本数据、图片数据灵活的添加至PDF文档中，降低网站处理压力，减少了数据下载时间，灵活多样的文本域、图片域可以减少PDF文档模板的添加下载数据的复杂程度，从而提高数据下载效率。

进一步的，作为对上述图1所示方法的实现，本申请实施例提供了一种基于PDF文档的数据下载装置，如图3所示，该装置包括：获取单元31、转换单元32、添加单元33、存储单元34。

获取单元31，用于当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据；所述获取单元31为基于PDF文档的数据下载装置执行当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据的模块。转换单元32，用于将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板，所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y；所述转换单元32为基于PDF文档的数据下载装置执行将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板的模块。添加单元33，用于根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流；所述添加单元33为基于PDF文档的数据下载装置执行根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流的模块。存储单元34，用于将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中，以使得用户通过所述临时存储路径下载PDF文档的数据。所述存储单元34为基于PDF文档的数据下载装置执行将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中的模块。

本申请提供了一种基于PDF文档的数据下载装置，与现有网站需要下载的数据的格式及内容都是不固定的相比，本申请实施例通过将请求的文本数据、图片数据转换为可添加至PDF文档模板中的第一类对象、第二类对象，然后将第一类对象、第二类对象匹配添加至对应的类对象X、类对象Y中，然后以PDF文档的输出字节流形式写入空压缩文件中，将压缩文件存储至临时存储路径中，以实现文本数据、图片数据灵活的添加至PDF文档中，降低网站处理压力，减少了数据下载时间，灵活多样的文本域、图片域可以减少PDF文档模板的添加下载数据的复杂程度，从而提高数据下载效率。

进一步的，作为对上述图2所示方法的实现，本申请实施例提供了另一种基于PDF文档的数据下载装置，如图4所示，该装置包括：获取单元41、转换单元42、添加单元43、存储单元44、建立单元45、提取单元46、清除单元47。

获取单元41，用于当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据；转换单元42，用于将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板，所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y；添加单元43，用于根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流；存储单元44，用于将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中，以使得用户通过所述临时存储路径下载PDF文档的数据。

进一步地，所述装置还包括：建立单元45，用于建立所述PDF文档模板，并在所述PDF文档模板中划分文本域、图片域，所述文本域中包含有不同名称的文本区域，所述不同名称的文本区域中分别包含不同文本数据的数量、属性，所述图片域中包含不同图片区域，每个图片区域中包含所述图片区域对应的位置坐标。

进一步地，所述装置还包括：提取单元46，用于提取服务器中暂停使用的所述临时存储路径，建立所述空压缩文件，并将所述空压缩文件存储至所述临时存储路径下的临时文件中。

进一步地，所述转换单元42包括：定义模块4201，用于根据所述文本数据的数据属性定义与所述文本域中类对象X匹配的第一类对象；转换模块4202，用于将所述图片数据的标识码转换为二进制码，将所述二进制码转换为与所述类对象Y匹配的第二类对象；读取模块4203，用于分别读取预先创建的PDF文档模板中文本域的类对象X以及图片域中的类对象Y，所述类对象X为可添加文本数据、属性的类对象，所述类对象Y为可添加图片数据的坐标位置的类对象。

进一步地，所述添加单元43包括：第一配置模块4301，用于利用AcroFields类对象将所述类对象X的属性进行初始化，将所述第一类对象中的属性与所述类对象X的属性进行配置；第二配置模块4302，用于将所述第二类对象的标识码与所述类对象Y的坐标位置进行匹配配置，所述匹配配置为按照所述标识码与所述坐标位置之间的预置映射关系进行配置；建立模块4303，用于根据按照所述PDF文档模板匹配配置类对象X、类对象Y后的PDF文档建立输出字节流。

进一步地，所述转换单元42，还用于压缩完成后，以输出流的形式将所述压缩文件转换为二进制字输出节流，以使得用户下载所述压缩文件。

进一步地，所述装置还包括：清除单元47，用于按照预设时间间隔清除所述服务器的临时存储路径下临时文件中的压缩文件。

本申请提供了另一种基于PDF文档的数据下载装置，本申请实施例通过将请求的文本数据、图片数据转换为可添加至PDF文档模板中的第一类对象、第二类对象，然后将第一类对象、第二类对象匹配添加至对应的类对象X、类对象Y中，然后以PDF文档的输出字节流形式写入空压缩文件中，将压缩文件存储至临时存储路径中，以实现文本数据、图片数据灵活的添加至PDF文档中，降低网站处理压力，减少了数据下载时间，灵活多样的文本域、图片域可以减少PDF文档模板的添加下载数据的复杂程度，从而提高数据下载效率。

根据本申请一个实施例提供了一种非易失性可读存储介质，所述非易失性可读存储介质存储有至少一计算机可读指令，该计算机计算机可读指令可执行上述任意方法实施例中的基于PDF文档的数据下载方法。图5示出了根据本申请一个实施例提供的一种计算机设备的结构示意图，具体可以为一种终端，本申请具体实施例并不对终端的具体实现做限定。如图5所示，该终端可以包括：处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。其中：处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。通信接口504，用于与其它设备比如客户端或其它服务器等的网元通信。处理器502，用于执行计算机可读指令510，具体可以执行上述基于PDF文档的数据下载方法实施例中的相关步骤。

具体地，计算机可读指令510可以包括计算机可读指令代码，该计算机可读指令代码包括计算机可读指令。处理器502可能是中央处理器CPU，或者是特定集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本申请实施例的一个或多个集成电路。终端包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。存储器506，用于存放计算机可读指令510。存储器506可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。计算机可读指令510具体可以用于使得处理器502执行以下操作：当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据；将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板，所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y；根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流；将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中，以使得用户通过所述临时存储路径下载PDF文档的数据。

显然，本领域的技术人员应该明白，上述的本申请的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的计算机可读指令代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包括在本申请的保护范围之内。

Claims

一种基于PDF文档的数据下载方法，其特征在于，包括：

当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据；

将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板，所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y；

根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流；

将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中，以使得用户通过所述临时存储路径下载PDF文档的数据。
根据权利要求1所述的方法，其特征在于，所述根据所述数据下载请求中携带的请求内容获取文本数据、图片数据之前，还包括：

建立所述PDF文档模板，并在所述PDF文档模板中划分文本域、图片域，所述文本域中包含有不同名称的文本区域，所述不同名称的文本区域中分别包含不同文本数据的数量、属性，所述图片域中包含不同图片区域，每个图片区域中包含所述图片区域对应的位置坐标。
根据权利要求1所述的方法，其特征在于，所述将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中之前，还包括：

提取服务器中暂停使用的所述临时存储路径，建立所述空压缩文件，并将所述空压缩文件存储至所述临时存储路径下的临时文件中。
根据权利要求1所述的方法，其特征在于，所述将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板包括：

根据所述文本数据的数据属性定义与所述文本域中类对象X匹配的第一类对象；

将所述图片数据的标识码转换为二进制码，将所述二进制码转换为与所述类对象Y匹配的第二类对象；

分别读取预先创建的PDF文档模板中文本域的类对象X以及图片域中的类对象Y，所述类对象X为可添加文本数据、属性的类对象，所述类对象Y为可添加图片数据的坐标位置的类对象。
根据权利要求4所述的方法，其特征在于，所述根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流包括：

利用AcroFields类对象将所述类对象X的属性进行初始化，将所述第一类对象中的属性与所述类对象X的属性进行配置；

将所述第二类对象的标识码与所述类对象Y的坐标位置进行匹配配置，所述匹配配置为按照所述标识码与所述坐标位置之间的预置映射关系进行配置；

根据按照所述PDF文档模板匹配配置类对象X、类对象Y后的PDF文档建立输出字节流。
根据权利要求1所述的方法，其特征在于，所述将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中之后，所述方法还包括：

压缩完成后，以输出流的形式将所述压缩文件转换为二进制字输出节流，以使得用户下载所述压缩文件。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

按照预设时间间隔清除所述服务器的临时存储路径下临时文件中的压缩文件。
一种基于PDF文档的数据下载装置，其特征在于，包括：

获取单元，用于当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据；

转换单元，用于将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板，所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y；

添加单元，用于根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流；

存储单元，用于将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中，以使得用户通过所述临时存储路径下载PDF文档的数据。
根据权利要求8所述的装置，其特征在于，所述装置还包括：

建立单元，用于建立所述PDF文档模板，并在所述PDF文档模板中划分文本域、图片域，所述文本域中包含有不同名称的文本区域，所述不同名称的文本区域中分别包含不同文本数据的数量、属性，所述图片域中包含不同图片区域，每个图片区域中包含所述图片区域对应的位置坐标。
根据权利要求8所述的装置，其特征在于，所述装置还包括：

提取单元，用于提取服务器中暂停使用的所述临时存储路径，建立所述空压缩文件，并将所述空压缩文件存储至所述临时存储路径下的临时文件中。
根据权利要求8所述的装置，其特征在于，所述转换单元包括：

定义模块，用于根据所述文本数据的数据属性定义与所述文本域中类对象X匹配的第一类对象；

转换模块，用于将所述图片数据的标识码转换为二进制码，将所述二进制码转换为与所述类对象Y匹配的第二类对象；

读取模块，用于分别读取预先创建的PDF文档模板中文本域的类对象X以及图片域中的类对象Y，所述类对象X为可添加文本数据、属性的类对象，所述类对象Y为可添加图片数据的坐标位置的类对象。
根据权利要求11所述的装置，其特征在于，所述添加单元包括：

第一配置模块，用于利用AcroFields类对象将所述类对象X的属性进行初始化，将所述第一类对象中的属性与所述类对象X的属性进行配置；

第二配置模块，用于将所述第二类对象的标识码与所述类对象Y的坐标位置进行匹配配置，所述匹配配置为按照所述标识码与所述坐标位置之间的预置映射关系进行配置；

建立模块，用于根据按照所述PDF文档模板匹配配置类对象X、类对象Y后的PDF文档建立输出字节流。
根据权利要求8所述的装置，其特征在于，所述转换单元，还用于压缩完成后，以输出流的形式将所述压缩文件转换为二进制字输出节流，以使得用户下载所述压缩文件。
根据权利要求8所述的装置，其特征在于，所述装置还包括：

清除单元，用于按照预设时间间隔清除所述服务器的临时存储路径下临时文件中的压缩文件。
一种非易失性可读存储介质，所述非易失性可读存储介质中存储有至少一计算机可读指令，所述计算机可读指令使处理器执行基于PDF文档的数据下载方法，包括：

当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据；

将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板，所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y；

根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流；

将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中，以使得用户通过所述临时存储路径下载PDF文档的数据。
根据权利要求15所述的非易失性可读存储介质，其特征在于，所述计算机可读指令使处理器执行所述根据所述数据下载请求中携带的请求内容获取文本数据、图片数据之前，还包括：

建立所述PDF文档模板，并在所述PDF文档模板中划分文本域、图片域，所述文本域中包含有不同名称的文本区域，所述不同名称的文本区域中分别包含不同文本数据的数量、属性，所述图片域中包含不同图片区域，每个图片区域中包含所述图片区域对应的位置坐标。
根据权利要求15所述的非易失性可读存储介质，其特征在于，所述计算机可读指令使处理器执行所述将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中之前，还包括：

提取服务器中暂停使用的所述临时存储路径，建立所述空压缩文件，并将所述空压缩文件存储至所述临时存储路径下的临时文件中。
一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一计算机可读指令，所述计算机可读指令使所述处理器执行基于PDF文档的数据下载方法，包括：

当接收到数据下载请求时，根据所述数据下载请求中携带的请求内容获取文本数据、图片数据；

将所述文本数据、图片数据分别转换为第一类对象、第二类对象，并读取预先创建的PDF文档模板，所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y；

根据所述第一类对象和所述第二类对象的类对象属性，将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y，并建立匹配后的PDF文档的输出字节流；

将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中，并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中，以使得用户通过所述临时存储路径下载PDF文档的数据。
根据权利要求18所述的计算机设备，其特征在于，所述计算机可读指令使所述处理器执行所述根据所述数据下载请求中携带的请求内容获取文本数据、图片数据之前，还包括：

建立所述PDF文档模板，并在所述PDF文档模板中划分文本域、图片域，所述文本域中包含有不同名称的文本区域，所述不同名称的文本区域中分别包含不同文本数据的数量、属性，所述图片域中包含不同图片区域，每个图片区域中包含所述图片区域对应的位置坐标。
根据权利要求18所述的计算机设备，其特征在于，所述计算机可读指令使所述处理器执行所述将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中之前，还包括：

提取服务器中暂停使用的所述临时存储路径，建立所述空压缩文件，并将所述空压缩文件存储至所述临时存储路径下的临时文件中。