[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2020015220A1 - 基于pdf文档的数据下载方法及装置、存储介质、终端 - Google Patents

基于pdf文档的数据下载方法及装置、存储介质、终端 Download PDF

Info

Publication number
WO2020015220A1
WO2020015220A1 PCT/CN2018/111697 CN2018111697W WO2020015220A1 WO 2020015220 A1 WO2020015220 A1 WO 2020015220A1 CN 2018111697 W CN2018111697 W CN 2018111697W WO 2020015220 A1 WO2020015220 A1 WO 2020015220A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
pdf document
class object
picture
text
Prior art date
Application number
PCT/CN2018/111697
Other languages
English (en)
French (fr)
Inventor
罗先贤
龙觉刚
孙成
叶俊锋
赖云辉
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2020015220A1 publication Critical patent/WO2020015220A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Definitions

  • the present application relates to the technical field of data processing, and in particular, to a method and device for downloading data based on a PDF document, a storage medium, and a terminal.
  • the website establishes a fixed PDF document template in advance, and adds the data to be downloaded to the PDF document template.
  • adding these data to the fixed PDF document template increases the pressure on the website processing and the data download time, and replacing the PDF document template will increase the data download. Complexity, reducing the efficiency of data downloads.
  • the present application provides a method and device for downloading data based on PDF documents, a storage medium, and a terminal, the main purpose of which is to provide existing formats and contents of data that need to be downloaded due to the website are not fixed.
  • the fixed PDF document template increases the processing pressure of the website and the data download time, and replacing the PDF document template will increase the complexity of data download and reduce the problem of data download efficiency.
  • a data download method based on a PDF document including:
  • the text data and picture data are respectively converted into a first-type object and a second-type object, and a pre-created PDF document template is read.
  • the text field and the picture field in the PDF document template are respectively configured with a class object X.
  • a data download device based on a PDF document including:
  • An obtaining unit configured to obtain text data and picture data according to a request content carried in the data download request when a data download request is received;
  • a conversion unit configured to convert the text data and picture data into a first type object and a second type object, respectively, and read a pre-created PDF document template, wherein the text field and the picture field in the PDF document template are respectively Configured with class object X, class object Y;
  • An adding unit configured to match and add the first-type object and the second-type object to the class-object X and the second-type object according to the class-object attributes of the first-type object and the second-type object, respectively; Class object Y, and build the output byte stream of the matched PDF document;
  • a storage unit configured to write the output byte stream of the created PDF document into a pre-established empty compressed file, and store the compressed file written into the PDF document into a temporary storage path of the server, so that the user Download the data of the PDF document through the temporary storage path.
  • a non-volatile readable storage medium stores at least one computer-readable instruction, and the computer-readable instruction causes a processor Perform the operation corresponding to the data download method based on the PDF document as described above.
  • a computer device including: a processor, a memory, a communication interface, and a communication bus, and the processor, the memory, and the communication interface complete each other through the communication bus.
  • Communication the memory is configured to store at least one computer-readable instruction, and the computer-readable instruction causes the processor to perform an operation corresponding to the foregoing PDF document-based data download method.
  • This application provides a PDF file-based data download method and device, storage medium, and terminal.
  • text data and picture data are obtained according to the request content carried in the data download request;
  • the text data and picture data are converted into first-type objects and second-type objects, respectively, and a pre-created PDF document template is read.
  • the text field and picture field in the PDF document template are respectively configured with a class object X and a class.
  • Object Y according to the class object attributes of the first class object and the second class object, matching the first class object and the second class object to the class object X and the class object, respectively Y, and build the output byte stream of the matched PDF document; write the output byte stream of the created PDF document into a previously created empty compressed file, and store the compressed file written into the PDF document to A temporary storage path of the server, so that a user downloads data of a PDF document through the temporary storage path.
  • the embodiments of the present application convert the requested text data and image data into first-class objects and second-class objects that can be added to PDF document templates.
  • Class object and then add the first class object and the second class object to the corresponding class object X, class object Y, and then write it into an empty compressed file as the output byte stream of the PDF document, and store the compressed file to
  • text data and image data can be flexibly added to PDF documents, which reduces the processing pressure on the website and reduces the data download time.
  • Flexible and diverse text fields and image fields can reduce the complexity of adding PDF document templates to downloading data. Degree to improve data download efficiency.
  • FIG. 1 shows a flowchart of a method for downloading data based on a PDF document according to an embodiment of the present application
  • FIG. 2 shows a flowchart of another method for downloading data based on a PDF document according to an embodiment of the present application
  • FIG. 3 shows a block diagram of a data downloading device based on a PDF document according to an embodiment of the present application
  • FIG. 4 shows a block diagram of another PDF file-based data downloading apparatus provided by an embodiment of the present application.
  • FIG. 5 is a schematic structural diagram of a computer device according to an embodiment of the present application.
  • An embodiment of the present application provides a data download method based on a PDF document. As shown in FIG. 1, the method includes:
  • the content of the request is specific data that needs to be downloaded, and these data may be stored in a database or in a cache of a server, which is not specifically limited in the embodiment of the present application.
  • the text data is data such as specific characters and numbers
  • the picture data is image data for display.
  • a data download request it may be based on the content of the request.
  • the content of the request is the user login URL on October 3.
  • Historical browsing records you can get text data and picture data on October 3 through historical browsing records stored in the server.
  • the obtained text data is specific text, numbers, and other data
  • the obtained image data is the identification code of the image, such as a barcode.
  • the barcode itself is a string composed of English and numbers, which is converted by open source code. Barcodes with corresponding specifications.
  • the specifications in this embodiment include the type of barcode, the thickness, size, and display resolution of the barcode, and are not specifically limited.
  • a class object X and a class object Y are respectively configured in a text field and a picture field.
  • PDF document templates are pre-configured with different sizes and forms of text fields and picture fields.
  • Each text field can be configured according to the size, size, and attributes of the text data that needs to be generated, and named for different text fields.
  • the picture field is an area with coordinate position information. When adding picture data, pictures can be added to specific locations according to the coordinate position information.
  • the pre-created PDF document template creates a blank PDF document.
  • the text field or picture field is configured with a corresponding text class object X and a picture class object Y, so that when adding text and pictures, matching is added.
  • a first-type object converted from text data is added to a class object X in the text field by matching
  • the second type of object matching of picture data conversion is added to the class object Y in the picture domain.
  • the PDF document template has a fixed class object X in advance, and then according to the attributes or types of the class objects, the class object X that the first class object matches is determined.
  • an output byte stream for the PDF document is established, so as to perform the step of writing an empty compressed file in step 104.
  • the empty compressed file is a pre-established blank compressed file without any content added, and a place is reserved in the temporary storage path of the server.
  • the output bytes of the PDF document are The stream is written into this blank compressed file, and the finished compressed file is stored in a reserved location so that the user can download the PDF document from the temporary storage path at any time.
  • This application provides a method for downloading data based on PDF documents.
  • the embodiment of the present application converts the requested text data and image data into Add to the first type object and the second type object in the PDF document template, and then add the first type object and the second type object to the corresponding class object X, class object Y, and then output the PDF document with the bytes
  • the stream format is written into an empty compressed file, and the compressed file is stored in a temporary storage path, so that text data and image data can be flexibly added to the PDF document, reducing the processing pressure on the website, reducing data download time, and flexible and diverse text fields.
  • the image domain can reduce the complexity of adding and downloading PDF document templates, thereby improving the efficiency of data downloading.
  • An embodiment of the present application provides another method for downloading data based on a PDF document. As shown in FIG. 2, the method includes:
  • the embodiment of the present application pre-establishes a PDF document template that has been divided into a text field and a picture field.
  • the text field contains Text areas of different names, the text areas of different names respectively containing the quantity and attributes of different text data, the picture field contains different picture areas, and each picture area contains position coordinates corresponding to the picture area.
  • a PDF document template can include multiple text fields and multiple picture fields, when dividing text fields and picture fields, the division of text fields is based on the number of text data and the attributes of different size areas.
  • Text field The number of text data is data such as characters and numbers, that is, the data size of the text.
  • Data attributes include string data, byte data, and so on. According to the number of text data and attributes, different size areas are divided. Name the area.
  • the picture field contains areas with different position coordinates. Different pictures can be added to different position coordinates, that is, multiple pictures can be added according to the position coordinates in a region, or multiple picture fields can be divided in a PDF document template.
  • the embodiments of the present application are not specifically limited.
  • the position of the bar code of the picture data is pre-divided, that is, it can be determined by using the form of the coordinate axis. For example, when the content of the request is picture data, the bar code is added to the position according to the bar code position of the pre-divided picture data.
  • the temporary storage path temporarily suspended in the server is extracted, a blank compressed file is created under this temporary storage path, and stored in the temporary storage path
  • a blank compressed file is created under this temporary storage path, and stored in the temporary storage path
  • extract the empty compressed file directly from the temporary file.
  • This step is the same as the method of step 101 shown in FIG. 1, and details are not described herein again.
  • step 204 may specifically be: defining a first type object that matches the class object X in the text domain according to the data attribute of the text data; converting the identification code of the picture data into a binary code, Convert the binary code into a second type object that matches the class object Y; read the class object X in the text field in the pre-created PDF document template and the class object Y in the picture field, the class object X It is a class object that can add text data and attributes, and the class object Y is a class object that can add coordinate positions of picture data.
  • the first-type object defined is the specific text data that is queried, and each attribute of the first-type object is set to be the same as the attribute of the text data, so that when the matching is performed, the first-type object can be directly set.
  • the class object is matched against the class object X.
  • the acquired image data is an identification code of the image data, such as a barcode.
  • the identification code needs to be converted to binary Code, and then converted to a second-type object through binary code.
  • step 205 may specifically be: using the AcroFields class object to initialize the attributes of the class object X, configuring the attributes in the first class object and the attributes of the class object X;
  • the identification code of the second type of object is matched with the coordinate position of the class object Y, and the matching configuration is configured according to a preset mapping relationship between the identification code and the coordinate position;
  • the PDF document template matches the configuration of class object X and class object Y to create an output byte stream.
  • the AcroFields class object is a java class of a general pdf text field.
  • the initialization process is to initialize the attributes of the class object X to the text field variables corresponding to the AcroFields class object. Among them, each text field field in the PDF document template. This part of the attribute field is finally initialized to each attribute field of the standard AcroFields class object.
  • the attribute fields of AcroFields are read from the specified pdf template, and can also include additional Fields are used for parameter passing or recording information, such as path names, flags, PDF file names, etc., which are not specifically limited in the embodiments of the present application.
  • the class object in the embodiment of the present application is a data structure
  • the basic information of the class is stored: the class size, the class name, the version of the class, the inheritance level, and the mapping table between the message and the function, etc.
  • configuration is performed through a preset mapping relationship between the identification code and the coordinate position, such as identification code 1 and the coordinate position (a, b , C) there is a preset mapping relationship, then the identification code 1 and the coordinate position (a, b, c) are configured, and when the converted second-type object identification code can be matched and configured to the class object Y page, coordinates Information, thereby adding a picture to the PDF document, for example, writing the picture corresponding to the obtained barcode to the position of the page and the coordinate information according to the page and coordinate information of the class object Y in the PDF document template.
  • the created output byte stream is the output byte stream of the PDF document that has been added with text data and image data. After the PDF document generates the output byte stream, the byte information of the output byte stream That is the completed PDF document object.
  • step 104 is the same as the method of step 104 shown in FIG. 1, and details are not described herein again.
  • the compressed file is stored in the temporary path of the server, and the compressed file input stream is read.
  • This input stream refers to the compressed file input into memory or cache, and then converted to binary Byte stream, and write to the output stream.
  • the byte stream here is an eight-bit general-purpose byte stream, that is, the compressed file is converted into byte data.
  • the output stream here refers to output from memory or cache, thereby transmitting Download to the client.
  • the compressed file transmitted to the input stream can be read.
  • the compressed file in the input stream is converted as a binary byte stream for the client to download.
  • the compressed files in the temporary files in the temporary storage path of the server need to be cleared at a certain interval, so that the temporary storage path is always Stay storable.
  • the preset time interval can be set according to the data download amount. For example, when the download amount is too large, it is set to 10 minutes, and when the download amount is too small, it is set to 1 hour, which is not specifically limited in the embodiment of the present application.
  • This application provides another method for downloading data based on PDF documents.
  • the requested text data and image data are converted into first-type objects and second-type objects that can be added to a PDF document template.
  • the first type object and the second type object are matched and added to the corresponding class object X and class object Y, and then written to the empty compressed file as the output byte stream of the PDF document, and the compressed file is stored in the temporary storage path.
  • flexible and diverse text fields and image fields can reduce the complexity of adding and downloading PDF document templates, thereby improving data Download efficiency.
  • an embodiment of the present application provides a data downloading device based on a PDF document.
  • the device includes: an obtaining unit 31, a converting unit 32, and an adding unit. 33. Storage unit 34.
  • An obtaining unit 31 is configured to obtain text data and picture data according to a request content carried in the data download request when a data download request is received; the obtaining unit 31 executes a data download device based on a PDF document when receiving data When downloading a request, a module for obtaining text data and picture data according to the requested content carried in the data download request.
  • a converting unit 32 configured to convert the text data and picture data into first-type objects and second-type objects, respectively, and read a pre-created PDF document template in the text field and picture field in the PDF document template
  • a class object X and a class object Y are respectively configured; the conversion unit 32 executes conversion of the text data and picture data into a first type object and a second type object for a PDF document-based data download device, and reads in advance Module for creating PDF document templates.
  • An adding unit 33 is configured to match and add the first-type object and the second-type object to the class-object X and the second-type object respectively according to the class-object attributes of the first-type object and the second-type object.
  • the class object Y is described, and an output byte stream of the matched PDF document is established; the adding unit 33 executes a class object attribute based on the first class object and the second class object for a data download device based on the PDF document A module that adds the first type object and the second type object to the class object X and the class object Y, respectively, and establishes a matching output byte stream of the PDF document.
  • the storage unit 34 is configured to write the output byte stream of the created PDF document into a pre-established empty compressed file, and store the compressed file written into the PDF document into a temporary storage path of the server, so that The user downloads the data of the PDF document through the temporary storage path.
  • the storage unit 34 executes writing a PDF file-based output byte stream into a pre-established empty compressed file for a PDF document-based data downloading device, and stores the compressed file written into the PDF document to a server. Module in the temporary storage path.
  • This application provides a data downloading device based on a PDF document.
  • the embodiment of the present application converts the requested text data and image data into Add to the first type object and the second type object in the PDF document template, and then add the first type object and the second type object to the corresponding class object X, class object Y, and then output the PDF document with the bytes
  • the stream format is written into an empty compressed file, and the compressed file is stored in a temporary storage path, so that text data and image data can be flexibly added to the PDF document, reducing the processing pressure on the website, reducing data download time, and flexible and diverse text fields.
  • the image domain can reduce the complexity of adding and downloading PDF document templates, thereby improving the efficiency of data downloading.
  • an embodiment of the present application provides another data downloading device based on a PDF document.
  • the device includes: an obtaining unit 41, a converting unit 42, and an adding unit.
  • An obtaining unit 41 is configured to obtain text data and picture data according to a request content carried in the data download request when a data download request is received;
  • a conversion unit 42 is configured to convert the text data and picture data into first One type of object and second type of object, and read a pre-created PDF document template, and the text field and the picture field in the PDF document template are respectively configured with a class object X and a class object Y;
  • an adding unit 43 is configured according to Class object attributes of the first class object and the second class object, add the first class object and the second class object to the class object X and the class object Y, respectively, and establish Output byte stream of the matched PDF document;
  • a storage unit 44 for writing the output byte stream of the created PDF document into a pre-established empty compressed file, and writing the compressed compressed file into the PDF file Stored in the temporary storage path of the server, so that the user downloads the data of the PDF document through the temporary storage path.
  • the apparatus further includes: a creating unit 45 configured to create the PDF document template, and divide a text field and a picture field in the PDF document template, and the text field contains text areas with different names,
  • the text areas of different names respectively contain the quantity and attributes of different text data
  • the picture domain contains different picture areas
  • each picture area contains position coordinates corresponding to the picture area.
  • the apparatus further includes: an extracting unit 46, configured to extract the temporary storage path temporarily suspended in the server, establish the empty compressed file, and store the empty compressed file in the temporary storage path. In a temporary file.
  • the conversion unit 42 includes: a definition module 4201, configured to define a first type object that matches the class object X in the text domain according to the data attribute of the text data; and a conversion module 4202, configured to convert the The identification code of the picture data is converted into a binary code, and the binary code is converted into a second type object that matches the class object Y; a reading module 4203 is used to read the text fields in the pre-created PDF document template, respectively.
  • the class object X is a class object to which text data and attributes can be added
  • the class object Y is a class object to which the coordinate position of the picture data can be added.
  • the adding unit 43 includes: a first configuration module 4301, which is used to initialize the attributes of the class object X by using AcroFields class objects, and the attributes in the first class object and the class object X Attribute configuration; a second configuration module 4302, configured to match and configure the identification code of the second-type object with the coordinate position of the class object Y, and the matching configuration is based on the identification code and the coordinate position The preset mapping relationship between them is configured; a establishing module 4303 is configured to establish an output byte stream according to the PDF document after the class object X and the class object Y are configured and matched according to the PDF document template.
  • the conversion unit 42 is further configured to convert the compressed file into a binary word output throttling in the form of an output stream after the compression is completed, so that a user can download the compressed file.
  • the apparatus further includes a clearing unit 47 for clearing compressed files in the temporary files in the temporary storage path of the server at a preset time interval.
  • This application provides another data downloading device based on a PDF document.
  • the requested text data and image data are converted into first-type objects and second-type objects that can be added to a PDF document template, and then The first type object and the second type object are matched and added to the corresponding class object X and class object Y, and then written to the empty compressed file as the output byte stream of the PDF document, and the compressed file is stored in the temporary storage path.
  • flexible and diverse text fields and image fields can reduce the complexity of adding and downloading PDF document templates, thereby improving data Download efficiency.
  • FIG. 5 shows a schematic structural diagram of a computer device according to an embodiment of the present application, which may specifically be a terminal.
  • the terminal may include a processor (processor) 502, a communication interface (504), a memory (506), and a communication bus (508).
  • the processor 502, the communication interface 504, and the memory 506 complete communication with each other through the communication bus 508.
  • the communication interface 504 is configured to communicate with a network element of another device, such as a client or another server.
  • the processor 502 is configured to execute computer-readable instructions 510, and may specifically perform relevant steps in the foregoing embodiment of the method for downloading data based on a PDF document.
  • the computer-readable instructions 510 may include computer-readable instruction codes, where the computer-readable instruction codes include computer-readable instructions.
  • the processor 502 may be a central processing unit CPU, or an application specific integrated circuit (ASIC), or one or more integrated circuits configured to implement the embodiments of the present application.
  • the terminal includes one or more processors, which may be processors of the same type, such as one or more CPUs; or may be processors of different types, such as one or more CPUs and one or more ASICs.
  • the memory 506 is configured to store computer-readable instructions 510.
  • the memory 506 may include a high-speed RAM memory, and may also include a non-volatile memory (non-volatile memory), for example, at least one disk memory.
  • the computer-readable instructions 510 may be specifically used to cause the processor 502 to perform the following operations: when receiving a data download request, obtain text data and picture data according to the request content carried in the data download request; and convert the text data and picture
  • the data is converted into first-type objects and second-type objects, respectively, and a pre-created PDF document template is read.
  • the text field and the picture field in the PDF document template are respectively configured with a class object X and a class object Y;
  • the first class object and the second class object have class object attributes, and the first class object and the second class object are matched and added to the class object X and the class object Y, respectively, and a match is established.
  • Output byte stream of the PDF file after writing write the output byte stream of the PDF file after creation into a pre-established empty compressed file, and store the compressed file written into the PDF document to a temporary storage path of the server So that the user can download the data of the PDF document through the temporary storage path.
  • modules or steps of the present application may be implemented by a general-purpose computing device, and they may be concentrated on a single computing device or distributed in a network composed of multiple computing devices.
  • they can be implemented with computer-readable instruction code executable by the computing device, so that they can be stored in a storage device and executed by the computing device, and in some cases, can be different from this
  • the steps shown or described are performed in sequence, either by making them into individual integrated circuit modules, or by making multiple modules or steps into a single integrated circuit module. As such, this application is not limited to any particular combination of hardware and software.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种基于PDF文档的数据下载方法及装置、存储介质、终端,涉及数据处理技术领域,主要目的在于现有网站需要下载的数据的格式及内容都是不固定,将这些数据添加至固定的PDF文档模板时增大了网站处理压力的问题。包括:当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数据、图片数据;将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板;按照所述第一类对象、第二类对象匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流;将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中。

Description

基于PDF文档的数据下载方法及装置、存储介质、终端
本申请要求与2018年7月19日提交中国专利局、申请号为2018107965600、申请名称为“基于PDF文档的数据下载方法及装置、存储介质、终端”的中国专利申请的优先权,其全部内容通过引用结合在申请中。
技术领域
本申请涉及一种数据处理技术领域,特别是涉及一种基于PDF文档的数据下载方法及装置、存储介质、终端。
背景技术
随着数据信息的无纸化传播的普及,越来越多的用户使用互联网网站下载数据信息进行查看。例如,在一些大数据网站中,为了获取网站中的相关数据,用户从网站中下载具有PDF格式的文档,以便用户进行打印。
目前,现有数据在生成并下载PDF文档的过程中,通常互联网网站在接收到数据下载请求后,网站预先建立一个固定的PDF文档模板,将需要下载的数据添加至PDF文档模板中,但是,由于网站需要下载的数据的格式及内容都是不固定的,将这些数据添加至固定的PDF文档模板时增大了网站处理压力,扩大了数据下载时间,而更换PDF文档模板又会增加数据下载的复杂程度,降低数据下载的效率。
发明内容
有鉴于此,本申请提供一种基于PDF文档的数据下载方法及装置、存储介质、终端,主要目的在于现有由于网站需要下载的数据的格式及内容都是不固定的,将这些数据添加至固定的PDF文档模板时增大了网站处理压力,扩大了数据下载时间,而更换PDF文档模板又会增加数据下载的复杂程度,降低数据下载的效率的问题。
依据本申请一个方面,提供了一种基于PDF文档的数据下载方法,包括:
当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数据、图片数据;
将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板,所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y;
根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第 二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流;
将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中,以使得用户通过所述临时存储路径下载PDF文档的数据。
依据本申请一个方面,提供了一种基于PDF文档的数据下载装置,包括:
获取单元,用于当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数据、图片数据;
转换单元,用于将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板,所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y;
添加单元,用于根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流;
存储单元,用于将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中,以使得用户通过所述临时存储路径下载PDF文档的数据。
根据本申请的又一方面,提供了一种非易失性可读存储介质,所述非易失性可读存储介质中存储有至少一计算机可读指令,所述计算机可读指令使处理器执行如上述基于PDF文档的数据下载方法对应的操作。
根据本申请的再一方面,提供了一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一计算机可读指令,所述计算机可读指令使所述处理器执行上述基于PDF文档的数据下载方法对应的操作。
借由上述技术方案,本申请实施例提供的技术方案至少具有下列优点:
本申请提供了一种基于PDF文档的数据下载方法及装置、存储介质、终端,首先当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数据、图片数据;将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板,所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y;根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF 文档的输出字节流;将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中,以使得用户通过所述临时存储路径下载PDF文档的数据。与现有网站需要下载的数据的格式及内容都是不固定的相比,本申请实施例通过将请求的文本数据、图片数据转换为可添加至PDF文档模板中的第一类对象、第二类对象,然后将第一类对象、第二类对象匹配添加至对应的类对象X、类对象Y中,然后以PDF文档的输出字节流形式写入空压缩文件中,将压缩文件存储至临时存储路径中,以实现文本数据、图片数据灵活的添加至PDF文档中,降低网站处理压力,减少了数据下载时间,灵活多样的文本域、图片域可以减少PDF文档模板的添加下载数据的复杂程度,从而提高数据下载效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例提供的一种基于PDF文档的数据下载方法流程图;
图2示出了本申请实施例提供的另一种基于PDF文档的数据下载方法流程图;
图3示出了本申请实施例提供的一种基于PDF文档的数据下载装置框图;
图4示出了本申请实施例提供的另一种基于PDF文档的数据下载装置框图;
图5示出了本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本申请实施例提供了一种基于PDF文档的数据下载方法,如图1所示,所述方法包括:
101、当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文 本数据、图片数据。
其中,所述请求内容为需要进行下载的具体数据,这些数据可以存储在数据库中,也可以存储在服务器的缓存中,本申请实施例不做具体限定。另外,所述文本数据为具体的文字、数字等数据,所述图片数据为进行展示图像数据,当接收到数据下载请求时,可以根据请求内容,如请求内容为10月3日用户登录网址a的历史浏览记录,则可以通过存储在服务器中的历史浏览记录获取到10月3日的文本数据、图片数据。
需要说明的是,获取到的文本数据为具体的文字、数字等数据,而获取到的图片数据则为图片的标识码,如条形码,条形码本身为一个英文和数字组成的字符串通过开源代码转换成相应规格的条形码,本实施例中的规格包括条形码的类型、条形码的粗细、大小、显示分辨率等,不做具体限定。
102、将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板。
其中,所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y。PDF文档模板中预先配置有不同大小、不同形式的文本域及图片域,每个文本域可以根据需要生成的文本数据的多少、大小、属性进行配置,并针对不同文本域进行命名,当将文本数据添加至文本域中时,可以根据文本域的名称进行添加。另外,图片域为带有坐标位置信息的区域,在进行添加图片数据时,可以根据坐标位置信息将图片添加至具体的位置中,且预先创建的PDF文档模板建立的是空白PDF文档,不同的文本域或者图片域配置有分别对应的文本的类对象X,以及图片的类对象Y,以便在添加文本和图片时,进行匹配添加。
需要说明的是,对于文本数据可以直接将具体的文字、数据转换为类对象,为了区分与图片数据进行转换出的类对象,文本数据转换得到第一类对象,对于图片数据可以通过标识码转换为图像的二进制码,再将二进制码转换为第二类对象。
103、根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流。
本申请实施例中,为了准确的将文本数据添加至文本域中,并将图片数据添加至图片域中,通过将文本数据转换的第一类对象匹配添加至文本域中的类对象X中,将图片数据转换的第二类对象匹配添加至图片域中的类对象Y中。其中,PDF文档模板中预先有了固定的类对象X,然后根据类对象的属性或者类型,确定出第一类对象匹配的类对象X。为了便于将添加完文本数据及图片数据的PDF文档进行输出,建立针对PDF 文档的输出字节流,以便进行步骤104中写入空压缩文件的步骤。
104、将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中。
对于本申请实施例,以使得用户通过所述临时存储路径下载PDF文档的数据。所述空压缩文件为预先建立的没有添加任何内容的空白压缩文件,并在服务器的临时存储路径中预留一个位置,当根据获取到的数据添加至PDF文档后,将PDF文档的输出字节流写入这个空白压缩文件中,并将写完的压缩文件存储在预留的位置中,以便用户随时从临时存储路径中下载PDF文档。
本申请提供了一种基于PDF文档的数据下载方法,与现有网站需要下载的数据的格式及内容都是不固定的相比,本申请实施例通过将请求的文本数据、图片数据转换为可添加至PDF文档模板中的第一类对象、第二类对象,然后将第一类对象、第二类对象匹配添加至对应的类对象X、类对象Y中,然后以PDF文档的输出字节流形式写入空压缩文件中,将压缩文件存储至临时存储路径中,以实现文本数据、图片数据灵活的添加至PDF文档中,降低网站处理压力,减少了数据下载时间,灵活多样的文本域、图片域可以减少PDF文档模板的添加下载数据的复杂程度,从而提高数据下载效率。
本申请实施例提供了另一种基于PDF文档的数据下载方法,如图2所示,所述方法包括:
201、建立所述PDF文档模板,并在所述PDF文档模板中划分文本域、图片域。
对于本申请实施例,为了避免在添加文本数据、图片数据时,需要重新建立PDF模板,所以本申请实施例预先建立已经划分好文本域、图片域的PDF文档模板,所述文本域中包含有不同名称的文本区域,所述不同名称的文本区域中分别包含不同文本数据的数量、属性,所述图片域中包含不同图片区域,每个图片区域中包含所述图片区域对应的位置坐标。
需要说明的是,由于PDF文档模板中可以包括多个文本域、多个图片域,因此,在划分文本域、图片域时,文本域的划分是根据文本数据的数量、属性命名不同大小区域的文本域,文本数据的数量为文字、数字等数据,即形成文本的数据大小,数据属性包括字符串数据、字节数据等,根据文本数据数量、属性划分出不同大小的区域,并对每个区域进行命名。另外,图片域中包含有不同位置坐标的区域,不同的位置坐标可以添加不同的图片,即一个区域中按照位置坐标可以添加多张图片,也可以在一个PDF文档模板中划分出多个图片域,本申请实施例不做具体限定。图片数据的条形码的位置是预先划分出来的,即可以利用坐标轴的形式确定出,例如,当请求内容为图片数据时, 根据预先划分出来的图片数据的条形码位置将条形码添加至这个位置中。
202、提取服务器中暂停使用的所述临时存储路径,建立所述空压缩文件,并将所述空压缩文件存储至所述临时存储路径下的临时文件中。
对于本申请实施例,为了不影响其他数据的存储,以及不占用正常数据的使用,提取服务器中暂停使用的临时存储路径,在这个临时存储路径下建立空白的压缩文件,并存储至临时存储路径下的临时文件中,以便将PDF文档添加至当前空压缩文件时,直接从临时文件中提取空压缩文件。
203、当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数据、图片数据。
本步骤与图1所示的步骤101方法相同,在此不再赘述。
204、将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板。
本步骤与图1所示的步骤102方法相同,在此不再赘述。对于本申请实施例,步骤204具体可以为:根据所述文本数据的数据属性定义与所述文本域中类对象X匹配的第一类对象;将所述图片数据的标识码转换为二进制码,将所述二进制码转换为与所述类对象Y匹配的第二类对象;分别读取预先创建的PDF文档模板中文本域的类对象X以及图片域中的类对象Y,所述类对象X为可添加文本数据、属性的类对象,所述类对象Y为可添加图片数据的坐标位置的类对象。
对于本申请实施例,定义的第一类对象即为查询到的具体文本数据,第一类对象的各个属性即与文本数据的属性设定为相同,从而在进行匹配时,可以直接将第一类对象与类对象X进行匹配。本申请实施例中,由于图片数据在获取时,获取的即为图片数据的标识码,如条形码,为了将图片数据转换成与类对象Y匹配的第二类对象,需要将标识码转换为二进制码,然后通过二进制码转换为第二类对象。
另外,为了将第一类对象与第二类对象准确的添加在预先创建的PDF模板中,在读取到第一类对象与第二类对象之后,需要读取PDF文档模板中类对象X以及类对象Y,从而进行准确的匹配添加。
205、根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流。
本步骤与图1所示的步骤103方法相同,在此不再赘述。对于本申请实施例,步骤205具体可以为:利用AcroFields类对象将所述类对象X的属性进行初始化,将所述第 一类对象中的属性与所述类对象X的属性进行配置;将所述第二类对象的标识码与所述类对象Y的坐标位置进行匹配配置,所述匹配配置为按照所述标识码与所述坐标位置之间的预置映射关系进行配置;根据按照所述PDF文档模板匹配配置类对象X、类对象Y后的PDF文档建立输出字节流。
对于本申请实施例,所述AcroFields类对象为通用的pdf文本域的java类,初始化的过程即为将类对象X的属性初始化给AcroFields类对象对应的文本域变量。其中,PDF文档模板中各个文本域字段,这部分属性字段最终又初始化给标准的AcroFields类对象的各属性字段,AcroFields的属性字段就是从指定的pdf模板中读取来的,还可以包括额外的字段,用于参数传递或记录信息,如路径名、标志位、PDF文件名等,本申请实施例不做具体限定。
另外,由于本申请实施例中的类对象为一种数据结构,存储类的基本信息:类大小,类名称,类的版本,继承层次,以及消息与函数的映射表等,类对象Y中存储有页面、坐标信息等信息,这些页面、坐标信息可以与标识码进行匹配,具体的,通过标识码与坐标位置之间的预置映射关系进行配置,如标识码1与坐标位置(a,b,c)之间存在预置映射关系,则将标识码1与坐标位置(a,b,c)进行配置,当转换后的第二类对象的标识码可以匹配配置到类对象Y页面、坐标信息,从而将图片添加至PDF文档中,例如,根据PDF文档模板中类对象Y的页面、坐标信息,将获取到的条形码对应的图片写入到页面、坐标信息的位置上。
需要说明的是,建立的输出字节流即为已经添加完文本数据、图片数据的PDF文档的输出字节流,当这个PDF文档生成输出字节流后,这个输出字节流的字节信息即为完成的PDF文档对象。
206、将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中。
本步骤与图1所示的步骤104方法相同,在此不再赘述。
207、压缩完成后,以输出流的形式将所述压缩文件转换为二进制字输出节流。
对于本申请实施例,以使得用户下载所述压缩文件。例如,当写入空压缩文件后的PDF文档得到压缩文件存储在服务器的临时路径中,读取这个压缩文件输入流中,这个输入流是指压缩文件输入到内存或缓存中,再转化为二进制字节流,并写入到输出流,这里的字节流为八位的通用字节流,即将压缩文件转换成字节数据,这里的输出流是指从内存或缓存中进行输出,从而传输至客户端进行下载。当压缩完成后,即可读取传输到输入流中的压缩文件,输入流中的压缩文件是以二进制字节流形式进行转换,以便客 户端进行下载。
208、按照预设时间间隔清除所述服务器的临时存储路径下临时文件中的压缩文件。
对于本申请实施例,为了避免临时存储路径下临时文件过多、过大影响服务器处理效率,需要按照一定的时间间隔清除服务器的临时存储路径下临时文件中的压缩文件,以便使临时存储路径一直保持可存储状态。其中,预设时间间隔可以根据数据的下载量进行设定,例如,下载量过大时,设定为10分钟,下载量过小时,设定为1小时,本申请实施例不做具体限定。
本申请提供了另一种基于PDF文档的数据下载方法,本申请实施例通过将请求的文本数据、图片数据转换为可添加至PDF文档模板中的第一类对象、第二类对象,然后将第一类对象、第二类对象匹配添加至对应的类对象X、类对象Y中,然后以PDF文档的输出字节流形式写入空压缩文件中,将压缩文件存储至临时存储路径中,以实现文本数据、图片数据灵活的添加至PDF文档中,降低网站处理压力,减少了数据下载时间,灵活多样的文本域、图片域可以减少PDF文档模板的添加下载数据的复杂程度,从而提高数据下载效率。
进一步的,作为对上述图1所示方法的实现,本申请实施例提供了一种基于PDF文档的数据下载装置,如图3所示,该装置包括:获取单元31、转换单元32、添加单元33、存储单元34。
获取单元31,用于当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数据、图片数据;所述获取单元31为基于PDF文档的数据下载装置执行当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数据、图片数据的模块。转换单元32,用于将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板,所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y;所述转换单元32为基于PDF文档的数据下载装置执行将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板的模块。添加单元33,用于根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流;所述添加单元33为基于PDF文档的数据下载装置执行根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流的模块。存储单元34,用于将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务 器的临时存储路径中,以使得用户通过所述临时存储路径下载PDF文档的数据。所述存储单元34为基于PDF文档的数据下载装置执行将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中的模块。
本申请提供了一种基于PDF文档的数据下载装置,与现有网站需要下载的数据的格式及内容都是不固定的相比,本申请实施例通过将请求的文本数据、图片数据转换为可添加至PDF文档模板中的第一类对象、第二类对象,然后将第一类对象、第二类对象匹配添加至对应的类对象X、类对象Y中,然后以PDF文档的输出字节流形式写入空压缩文件中,将压缩文件存储至临时存储路径中,以实现文本数据、图片数据灵活的添加至PDF文档中,降低网站处理压力,减少了数据下载时间,灵活多样的文本域、图片域可以减少PDF文档模板的添加下载数据的复杂程度,从而提高数据下载效率。
进一步的,作为对上述图2所示方法的实现,本申请实施例提供了另一种基于PDF文档的数据下载装置,如图4所示,该装置包括:获取单元41、转换单元42、添加单元43、存储单元44、建立单元45、提取单元46、清除单元47。
获取单元41,用于当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数据、图片数据;转换单元42,用于将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板,所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y;添加单元43,用于根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流;存储单元44,用于将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中,以使得用户通过所述临时存储路径下载PDF文档的数据。
进一步地,所述装置还包括:建立单元45,用于建立所述PDF文档模板,并在所述PDF文档模板中划分文本域、图片域,所述文本域中包含有不同名称的文本区域,所述不同名称的文本区域中分别包含不同文本数据的数量、属性,所述图片域中包含不同图片区域,每个图片区域中包含所述图片区域对应的位置坐标。
进一步地,所述装置还包括:提取单元46,用于提取服务器中暂停使用的所述临时存储路径,建立所述空压缩文件,并将所述空压缩文件存储至所述临时存储路径下的临时文件中。
进一步地,所述转换单元42包括:定义模块4201,用于根据所述文本数据的数据 属性定义与所述文本域中类对象X匹配的第一类对象;转换模块4202,用于将所述图片数据的标识码转换为二进制码,将所述二进制码转换为与所述类对象Y匹配的第二类对象;读取模块4203,用于分别读取预先创建的PDF文档模板中文本域的类对象X以及图片域中的类对象Y,所述类对象X为可添加文本数据、属性的类对象,所述类对象Y为可添加图片数据的坐标位置的类对象。
进一步地,所述添加单元43包括:第一配置模块4301,用于利用AcroFields类对象将所述类对象X的属性进行初始化,将所述第一类对象中的属性与所述类对象X的属性进行配置;第二配置模块4302,用于将所述第二类对象的标识码与所述类对象Y的坐标位置进行匹配配置,所述匹配配置为按照所述标识码与所述坐标位置之间的预置映射关系进行配置;建立模块4303,用于根据按照所述PDF文档模板匹配配置类对象X、类对象Y后的PDF文档建立输出字节流。
进一步地,所述转换单元42,还用于压缩完成后,以输出流的形式将所述压缩文件转换为二进制字输出节流,以使得用户下载所述压缩文件。
进一步地,所述装置还包括:清除单元47,用于按照预设时间间隔清除所述服务器的临时存储路径下临时文件中的压缩文件。
本申请提供了另一种基于PDF文档的数据下载装置,本申请实施例通过将请求的文本数据、图片数据转换为可添加至PDF文档模板中的第一类对象、第二类对象,然后将第一类对象、第二类对象匹配添加至对应的类对象X、类对象Y中,然后以PDF文档的输出字节流形式写入空压缩文件中,将压缩文件存储至临时存储路径中,以实现文本数据、图片数据灵活的添加至PDF文档中,降低网站处理压力,减少了数据下载时间,灵活多样的文本域、图片域可以减少PDF文档模板的添加下载数据的复杂程度,从而提高数据下载效率。
根据本申请一个实施例提供了一种非易失性可读存储介质,所述非易失性可读存储介质存储有至少一计算机可读指令,该计算机计算机可读指令可执行上述任意方法实施例中的基于PDF文档的数据下载方法。图5示出了根据本申请一个实施例提供的一种计算机设备的结构示意图,具体可以为一种终端,本申请具体实施例并不对终端的具体实现做限定。如图5所示,该终端可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。处理器502,用于 执行计算机可读指令510,具体可以执行上述基于PDF文档的数据下载方法实施例中的相关步骤。
具体地,计算机可读指令510可以包括计算机可读指令代码,该计算机可读指令代码包括计算机可读指令。处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。终端包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。存储器506,用于存放计算机可读指令510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。计算机可读指令510具体可以用于使得处理器502执行以下操作:当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数据、图片数据;将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板,所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y;根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流;将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中,以使得用户通过所述临时存储路径下载PDF文档的数据。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的计算机可读指令代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本申请的保护范围之内。

Claims (20)

  1. 一种基于PDF文档的数据下载方法,其特征在于,包括:
    当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数据、图片数据;
    将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板,所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y;
    根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流;
    将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中,以使得用户通过所述临时存储路径下载PDF文档的数据。
  2. 根据权利要求1所述的方法,其特征在于,所述根据所述数据下载请求中携带的请求内容获取文本数据、图片数据之前,还包括:
    建立所述PDF文档模板,并在所述PDF文档模板中划分文本域、图片域,所述文本域中包含有不同名称的文本区域,所述不同名称的文本区域中分别包含不同文本数据的数量、属性,所述图片域中包含不同图片区域,每个图片区域中包含所述图片区域对应的位置坐标。
  3. 根据权利要求1所述的方法,其特征在于,所述将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中之前,还包括:
    提取服务器中暂停使用的所述临时存储路径,建立所述空压缩文件,并将所述空压缩文件存储至所述临时存储路径下的临时文件中。
  4. 根据权利要求1所述的方法,其特征在于,所述将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板包括:
    根据所述文本数据的数据属性定义与所述文本域中类对象X匹配的第一类对象;
    将所述图片数据的标识码转换为二进制码,将所述二进制码转换为与所述类对象Y匹配的第二类对象;
    分别读取预先创建的PDF文档模板中文本域的类对象X以及图片域中的类对象Y,所述类对象X为可添加文本数据、属性的类对象,所述类对象Y为可添加图片数据的 坐标位置的类对象。
  5. 根据权利要求4所述的方法,其特征在于,所述根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流包括:
    利用AcroFields类对象将所述类对象X的属性进行初始化,将所述第一类对象中的属性与所述类对象X的属性进行配置;
    将所述第二类对象的标识码与所述类对象Y的坐标位置进行匹配配置,所述匹配配置为按照所述标识码与所述坐标位置之间的预置映射关系进行配置;
    根据按照所述PDF文档模板匹配配置类对象X、类对象Y后的PDF文档建立输出字节流。
  6. 根据权利要求1所述的方法,其特征在于,所述将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中之后,所述方法还包括:
    压缩完成后,以输出流的形式将所述压缩文件转换为二进制字输出节流,以使得用户下载所述压缩文件。
  7. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
    按照预设时间间隔清除所述服务器的临时存储路径下临时文件中的压缩文件。
  8. 一种基于PDF文档的数据下载装置,其特征在于,包括:
    获取单元,用于当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数据、图片数据;
    转换单元,用于将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板,所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y;
    添加单元,用于根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流;
    存储单元,用于将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中,以使得用户通过所述临时存储路径下载PDF文档的数据。
  9. 根据权利要求8所述的装置,其特征在于,所述装置还包括:
    建立单元,用于建立所述PDF文档模板,并在所述PDF文档模板中划分文本域、 图片域,所述文本域中包含有不同名称的文本区域,所述不同名称的文本区域中分别包含不同文本数据的数量、属性,所述图片域中包含不同图片区域,每个图片区域中包含所述图片区域对应的位置坐标。
  10. 根据权利要求8所述的装置,其特征在于,所述装置还包括:
    提取单元,用于提取服务器中暂停使用的所述临时存储路径,建立所述空压缩文件,并将所述空压缩文件存储至所述临时存储路径下的临时文件中。
  11. 根据权利要求8所述的装置,其特征在于,所述转换单元包括:
    定义模块,用于根据所述文本数据的数据属性定义与所述文本域中类对象X匹配的第一类对象;
    转换模块,用于将所述图片数据的标识码转换为二进制码,将所述二进制码转换为与所述类对象Y匹配的第二类对象;
    读取模块,用于分别读取预先创建的PDF文档模板中文本域的类对象X以及图片域中的类对象Y,所述类对象X为可添加文本数据、属性的类对象,所述类对象Y为可添加图片数据的坐标位置的类对象。
  12. 根据权利要求11所述的装置,其特征在于,所述添加单元包括:
    第一配置模块,用于利用AcroFields类对象将所述类对象X的属性进行初始化,将所述第一类对象中的属性与所述类对象X的属性进行配置;
    第二配置模块,用于将所述第二类对象的标识码与所述类对象Y的坐标位置进行匹配配置,所述匹配配置为按照所述标识码与所述坐标位置之间的预置映射关系进行配置;
    建立模块,用于根据按照所述PDF文档模板匹配配置类对象X、类对象Y后的PDF文档建立输出字节流。
  13. 根据权利要求8所述的装置,其特征在于,所述转换单元,还用于压缩完成后,以输出流的形式将所述压缩文件转换为二进制字输出节流,以使得用户下载所述压缩文件。
  14. 根据权利要求8所述的装置,其特征在于,所述装置还包括:
    清除单元,用于按照预设时间间隔清除所述服务器的临时存储路径下临时文件中的压缩文件。
  15. 一种非易失性可读存储介质,所述非易失性可读存储介质中存储有至少一计算机可读指令,所述计算机可读指令使处理器执行基于PDF文档的数据下载方法,包括:
    当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数 据、图片数据;
    将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板,所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y;
    根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流;
    将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中,以使得用户通过所述临时存储路径下载PDF文档的数据。
  16. 根据权利要求15所述的非易失性可读存储介质,其特征在于,所述计算机可读指令使处理器执行所述根据所述数据下载请求中携带的请求内容获取文本数据、图片数据之前,还包括:
    建立所述PDF文档模板,并在所述PDF文档模板中划分文本域、图片域,所述文本域中包含有不同名称的文本区域,所述不同名称的文本区域中分别包含不同文本数据的数量、属性,所述图片域中包含不同图片区域,每个图片区域中包含所述图片区域对应的位置坐标。
  17. 根据权利要求15所述的非易失性可读存储介质,其特征在于,所述计算机可读指令使处理器执行所述将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中之前,还包括:
    提取服务器中暂停使用的所述临时存储路径,建立所述空压缩文件,并将所述空压缩文件存储至所述临时存储路径下的临时文件中。
  18. 一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
    所述存储器用于存放至少一计算机可读指令,所述计算机可读指令使所述处理器执行基于PDF文档的数据下载方法,包括:
    当接收到数据下载请求时,根据所述数据下载请求中携带的请求内容获取文本数据、图片数据;
    将所述文本数据、图片数据分别转换为第一类对象、第二类对象,并读取预先创建的PDF文档模板,所述PDF文档模板中的文本域、图片域中分别配置有类对象X、类对象Y;
    根据所述第一类对象和所述第二类对象的类对象属性,将所述第一类对象、所述第二类对象分别匹配添加至所述类对象X、所述类对象Y,并建立匹配后的PDF文档的输出字节流;
    将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中,并将写入所述PDF文档后的压缩文件存储至服务器的临时存储路径中,以使得用户通过所述临时存储路径下载PDF文档的数据。
  19. 根据权利要求18所述的计算机设备,其特征在于,所述计算机可读指令使所述处理器执行所述根据所述数据下载请求中携带的请求内容获取文本数据、图片数据之前,还包括:
    建立所述PDF文档模板,并在所述PDF文档模板中划分文本域、图片域,所述文本域中包含有不同名称的文本区域,所述不同名称的文本区域中分别包含不同文本数据的数量、属性,所述图片域中包含不同图片区域,每个图片区域中包含所述图片区域对应的位置坐标。
  20. 根据权利要求18所述的计算机设备,其特征在于,所述计算机可读指令使所述处理器执行所述将建立后的PDF文档的输出字节流写入预先建立的空压缩文件中之前,还包括:
    提取服务器中暂停使用的所述临时存储路径,建立所述空压缩文件,并将所述空压缩文件存储至所述临时存储路径下的临时文件中。
PCT/CN2018/111697 2018-07-19 2018-10-24 基于pdf文档的数据下载方法及装置、存储介质、终端 WO2020015220A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810796560.0A CN109284453B (zh) 2018-07-19 2018-07-19 基于pdf文档的数据下载方法及装置、存储介质、终端
CN201810796560.0 2018-07-19

Publications (1)

Publication Number Publication Date
WO2020015220A1 true WO2020015220A1 (zh) 2020-01-23

Family

ID=65182376

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/111697 WO2020015220A1 (zh) 2018-07-19 2018-10-24 基于pdf文档的数据下载方法及装置、存储介质、终端

Country Status (2)

Country Link
CN (1) CN109284453B (zh)
WO (1) WO2020015220A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651215A (zh) * 2020-12-31 2021-04-13 中国农业银行股份有限公司 文档配图确定方法、装置、电子设备及存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666745B (zh) * 2020-06-03 2023-07-25 中国建设银行股份有限公司 一种文件下载方法、装置、服务器及介质
CN112380828A (zh) * 2020-11-03 2021-02-19 前海飞算云创数据科技(深圳)有限公司 Pdf文档生成方法和装置、存储介质和电子设备
CN117807291B (zh) * 2024-02-29 2024-04-26 南京三百云信息科技有限公司 用于业务材料的智能识别交互处理方法及平台

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060170948A1 (en) * 2005-02-03 2006-08-03 Canon Kabushiki Kaisha Document processing apparatus, document processing method and program
CN101777056A (zh) * 2009-12-31 2010-07-14 成都市华为赛门铁克科技有限公司 数据存储方法及设备
CN106776498A (zh) * 2016-12-09 2017-05-31 山东浪潮商用系统有限公司 一种数据导出为pdf的方法
CN108052491A (zh) * 2017-11-22 2018-05-18 李晓妮 一种证件文档的自动处理方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040153462A1 (en) * 2003-02-05 2004-08-05 Bardwell Steven J. Systems, methods, and computer program product for use in association with electronic documents
US10506017B2 (en) * 2016-05-20 2019-12-10 Adobe Inc. Manipulation of PDF file content through HTTP requests
CN108090213A (zh) * 2017-12-29 2018-05-29 福建南威软件有限公司 移动终端快速转换生成pdf文件的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060170948A1 (en) * 2005-02-03 2006-08-03 Canon Kabushiki Kaisha Document processing apparatus, document processing method and program
CN101777056A (zh) * 2009-12-31 2010-07-14 成都市华为赛门铁克科技有限公司 数据存储方法及设备
CN106776498A (zh) * 2016-12-09 2017-05-31 山东浪潮商用系统有限公司 一种数据导出为pdf的方法
CN108052491A (zh) * 2017-11-22 2018-05-18 李晓妮 一种证件文档的自动处理方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651215A (zh) * 2020-12-31 2021-04-13 中国农业银行股份有限公司 文档配图确定方法、装置、电子设备及存储介质
CN112651215B (zh) * 2020-12-31 2023-11-03 中国农业银行股份有限公司 文档配图确定方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN109284453A (zh) 2019-01-29
CN109284453B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN109408783B (zh) 电子文档在线编辑方法及系统
WO2020015220A1 (zh) 基于pdf文档的数据下载方法及装置、存储介质、终端
US9940744B2 (en) Remote font management
US20070192687A1 (en) Document content and structure conversion
US9129421B2 (en) System and method for displaying complex scripts with a cloud computing architecture
WO2020233332A1 (zh) 文本结构化信息提取方法、服务器及存储介质
US10516803B2 (en) Information processing apparatus, and storage medium
US10783412B1 (en) Smart page encoding system including linearization for viewing and printing
JP2010129057A (ja) 情報処理装置、表示データ翻訳方法、及びプログラム
CN111797595A (zh) 一种基于xml模板生成ofd版式页面的方法和装置
CN112016290A (zh) 一种文档自动排版方法、装置、设备及存储介质
CN111950247A (zh) 一种基于配置的Word文档生成方法
CN112487763A (zh) 基于svg的ofd文件在线显示方法、服务器端及系统
CN110737860A (zh) 一种富文本图片插入方法和装置
US7860892B2 (en) Information processing apparatus, history file generation method and program
US8930808B2 (en) Processing rich text data for storing as legacy data records in a data storage system
CN114691712A (zh) 一种生成票据的方法、装置以及存储介质
US11087188B2 (en) Smart page decoding system including linearization for viewing and printing
US20080313201A1 (en) System and method for compact representation of multiple markup data pages of electronic document data
CN111222310A (zh) 一种不规则表单的录入和展示的方法及系统
CN115712411A (zh) 一种自定义流水号的生成方法及装置
US7199804B2 (en) Ink information in image files
CN116050370A (zh) 模板数据处理方法、系统及相关设备
JP2003345787A (ja) 電子文書作成システムおよび電子文書管理装置
US9195655B2 (en) Method and system for transforming documents

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18927022

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18927022

Country of ref document: EP

Kind code of ref document: A1