CN112187949A - 图片的批量下载方法和装置、存储介质、电子装置 - Google Patents
图片的批量下载方法和装置、存储介质、电子装置 Download PDFInfo
- Publication number
- CN112187949A CN112187949A CN202011072570.3A CN202011072570A CN112187949A CN 112187949 A CN112187949 A CN 112187949A CN 202011072570 A CN202011072570 A CN 202011072570A CN 112187949 A CN112187949 A CN 112187949A
- Authority
- CN
- China
- Prior art keywords
- picture
- target webpage
- suffix
- coding
- downloading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000004044 response Effects 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 235000014510 cooky Nutrition 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9566—URL specific, e.g. using aliases, detecting broken or misspelled links
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
- H04L67/146—Markers for unambiguous identification of a particular session, e.g. session cookie or URL-encoding
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请公开了一种图片的批量下载方法和装置、存储介质、电子装置。其中,该方法包括:对目标网页进行编码,得到编码ID;将所述编码ID对应的前缀与所述目标网页内图片的图片后缀进行拼接,得到图片的下载链接;利用所述目标网页内各图片的下载链接下载所述目标网页内的所有图片。本申请解决了相关技术中图片下载效率较低的技术问题。
Description
技术领域
本申请涉及互联网领域,具体而言,涉及一种图片的批量下载方法和装置、存储介质、电子装置。
背景技术
网络技术的不断发展,各类网站存储了大量的类别鲜明的图片数据,如何快速有效的提取所需类别的图片,是目前有待解决的问题。
现有技术中,对网站页面图片进行下载的方法为右键保存图片(需手动单张的点击)下载效率低,且不能保证每次都准确的保存了目标文章下(特定范围内)的图片,可能会误点到其他图片;也可利用下载工具,输入图片链接进行下载,此类方法的问题在于无法快速提取图片的链接从而影响了下载效率。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种图片的批量下载方法和装置、存储介质、电子装置,以至少解决相关技术中图片下载效率较低的技术问题。
根据本申请实施例的一个方面,提供了一种图片的批量下载方法,包括:对目标网页进行编码,得到编码ID;将所述编码ID对应的前缀与所述目标网页内图片的图片后缀进行拼接,得到图片的下载链接;利用所述目标网页内各图片的下载链接下载所述目标网页内的所有图片。
可选地,对目标网页进行编码,得到编码ID包括:将所述目标网页的网页信息携带于post请求中提交给服务器;获取由所述服务器对post请求进行响应而返回的所述编码ID。
可选地,在将所述目标网页的网页信息携带于post请求中提交给服务器之后,对所述目标网页的网页ID、编码接口的来源、特征长度、字段要素构成以及编码格式进行分析,得到所述编码ID。
可选地,在对目标网页进行编码,得到编码ID之后,利用所述编码ID请求得到携带有所述目标网页内各图片的图片后缀的后缀列表。
可选地,利用所述编码ID请求得到携带有所述目标网页内各图片的图片后缀的后缀列表包括:将携带有所述编码ID的post请求发送到服务器;获取由所述服务器对post请求进行响应而返回的所述后缀列表。
可选地,获取由所述服务器对post请求进行响应而返回的所述后缀列表包括:通过对所述编码ID进行正则匹配得到图片链接接口;从所述图片链接接口接收所述后缀列表。
可选地,将所述编码ID对应的前缀与所述目标网页内图片的图片后缀进行拼接,得到图片的下载链接包括:将所述编码ID对应的前缀与后缀列表中的每个后缀分别进行拼接,得到所述目标网页内所有图片的下载链接。
根据本申请实施例的另一方面,还提供了一种图片的批量下载装置,包括:编码单元,用于对目标网页进行编码,得到编码ID;拼接单元,用于将所述编码ID对应的前缀与所述目标网页内图片的图片后缀进行拼接,得到图片的下载链接;下载单元,用于利用所述目标网页内各图片的下载链接下载所述目标网页内的所有图片。
可选地,编码单元还用于:将所述目标网页的网页信息携带于post请求中提交给服务器;获取由所述服务器对post请求进行响应而返回的所述编码ID。
可选地,编码单元还用于:在将所述目标网页的网页信息携带于post请求中提交给服务器之后,对所述目标网页的网页ID、编码接口的来源、特征长度、字段要素构成以及编码格式进行分析,得到所述编码ID。
可选地,编码单元还用于:在对目标网页进行编码,得到编码ID之后,利用所述编码ID请求得到携带有所述目标网页内各图片的图片后缀的后缀列表。
可选地,编码单元还用于:将携带有所述编码ID的post请求发送到服务器;获取由所述服务器对post请求进行响应而返回的所述后缀列表。
可选地,编码单元还用于:通过对所述编码ID进行正则匹配得到图片链接接口;从所述图片链接接口接收所述后缀列表。
可选地,拼接单元还用于:将所述编码ID对应的前缀与后缀列表中的每个后缀分别进行拼接,得到所述目标网页内所有图片的下载链接。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。
根据本申请实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。
本发明实现了图片对应的文章、专题标识(即文章或者专题ID)进行对编码接口提交post请求得到编码后的ID(即编码ID),携带编码后ID向图片url接口提交post请求得到文章或者专题下的图片url尾缀列表(或称为后缀列表),将对应该网站的图片url前部与得到的尾缀进行拼接,即可得到完整的图片下载链接imgURL,后续可利用imgURL进行图片下载。采用批量下载,可以解决相关技术中图片下载效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种可选的图片的批量下载方法的流程图;
图2是根据本申请实施例的一种可选的图片的批量下载方案的示意图;
图3是根据本申请实施例的一种可选的图片的批量下载方案的示意图;
图4是根据本申请实施例的一种可选的图片的批量下载装置的示意图;
以及
图5是根据本申请实施例的一种终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
针对批量获取某类图片的普遍效率低,需手动单张点击、难以针对性的获取特定范围(比如某文章下的所有图片)的图片、手动点击页面可能出现误点击导致下载到无用图片的问题。根据本申请实施例的一方面,提供了一种()的方法实施例。图1是根据本申请实施例的一种可选的图片的批量下载方法的流程图,如图1所示,该方法可以包括以下步骤:
步骤S1,对目标网页进行编码,得到编码ID。
可选地,对目标网页进行编码,得到编码ID包括:将所述目标网页的网页信息(如网页文章或者专题ID)携带于post请求中提交给服务器;获取由所述服务器对post请求进行响应而返回的所述编码ID。
可选地,在将所述目标网页的网页信息携带于post请求中提交给服务器之后,对所述目标网页的网页ID、编码接口的来源、特征长度、字段要素构成以及编码格式进行分析,得到所述编码ID。
可选地,在对目标网页进行编码,得到编码ID之后,利用所述编码ID请求得到携带有所述目标网页内各图片的图片后缀的后缀列表。
可选地,利用所述编码ID请求得到携带有所述目标网页内各图片的图片后缀的后缀列表包括:将携带有所述编码ID的post请求发送到服务器;获取由所述服务器对post请求进行响应而返回的所述后缀列表。
可选地,获取由所述服务器对post请求进行响应而返回的所述后缀列表包括:通过对所述编码ID进行正则匹配得到图片链接接口;从所述图片链接接口接收所述后缀列表。
步骤S2,将所述编码ID对应的前缀与所述目标网页内图片的图片后缀进行拼接,得到图片的下载链接。
可选地,将所述编码ID对应的前缀与所述目标网页内图片的图片后缀进行拼接,得到图片的下载链接包括:将所述编码ID对应的前缀与后缀列表中的每个后缀分别进行拼接,得到所述目标网页内所有图片的下载链接。
步骤S3,利用所述目标网页内各图片的下载链接下载所述目标网页内的所有图片。
本发明实现了图片对应的文章、专题标识(即文章或者专题ID)进行对编码接口提交post请求得到编码后的ID(即编码ID),携带编码后ID向图片url接口提交post请求得到文章或者专题下的图片url尾缀列表(或称为后缀列表),将对应该网站的图片url前部与得到的尾缀进行拼接,即可得到完整的图片下载链接imgURL,后续可利用imgURL进行图片下载。采用批量下载,可以解决相关技术中图片下载效率较低的技术问题。
作为一种可选的实施例,下文结合具体的实施方式进一步详述本申请的技术方案。
本方案的实施步骤流程如下(参考图2):
步骤S21:获取文章或者专题在对应网站的编号ID,将该ID以post形式提交到编码接口。
步骤S22:由提交的post请求在编码接口得到文章或者专题对应的编码后的ID。
步骤S23:将编码后的ID通过post请求提交到图片url接口,得到对应该文章或者专题的所有图片url尾缀列表。
步骤S24:将该网站的图片链接的固定前缀与得到的图片url尾缀进行拼接组合,从而得到完整的图片链接imgURL。
上述过程中两个接口提取具体技术方案如下(参考图3)。
图片url接口提取方案如下:
通过浏览器访问该网站,采集若干个目标图片(作为示例)的链接地址targetUrl。
在长度、字段一致性、结构、编码格式等方面对比得到该网站的完整图片imgURL的特征,即固定前缀(例如https://li.com/getImage/path=?这一示例)和尾缀的格式特征(例如包含字符范围,如大小写字母及数字等,即可变部分)。
S32,访问该网站上述目标图片并保存所有的网络请求和响应(使用浏览器访问目标文章过程),遍历上述的响应(response,即网络请求返回内容),通过正则匹配得到目标图片链接地址的前缀或后缀的网络响应,该网络相应对应的请求网址(requestUrl)一致为某一特定网址,该网址即为图片url接口。
文章或者专题进行编码的接口技术方案如下:
遍历上述网络请求中对图片url接口的请求,汇集请求中的携带的参数,特征提取手段得到参数的数据格式。遍历网络响应得到可正则匹配到上述参数的请求(一个请求对应一个响应),该类请求网址一致为某一特定网址,该网址即文章或者专题进行编码的接口。上述请求中所携带参数,可一一字符匹配到文章或者专题网址中的包含的字符串或者数值串,该字符串或者数字串即为文章(专题)ID。
前缀和尾缀的拼接使用如下方式:将由图片url接口返回的图片URL尾缀列表展开为多个字符串,去除每个字符串头部的多余字符,逐一和上述步骤过程中得到的图片链接固定前缀(例如https://li.com/getImage/path=?,上述只作为示例)拼接,使用quote编码(一种网络链接地址编码格式),得到最终的完整图片链接imgURL。
对于访问网站需要登录的情况,可同样采用上述方式,后续的图片下载请求需包含登录到该网站的cookie(验证登录状态的信息)。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述图片的批量下载方法的图片的批量下载装置。图4是根据本申请实施例的一种可选的图片的批量下载装置的示意图,如图4所示,该装置可以包括:
编码单元41,用于对目标网页进行编码,得到编码ID;
拼接单元43,用于将所述编码ID对应的前缀与所述目标网页内图片的图片后缀进行拼接,得到图片的下载链接;
下载单元45,用于利用所述目标网页内各图片的下载链接下载所述目标网页内的所有图片。
需要说明的是,该实施例中的编码单元41可以用于执行本申请实施例中的步骤S1,该实施例中的拼接单元43可以用于执行本申请实施例中的步骤S2,该实施例中的下载单元45可以用于执行本申请实施例中的步骤S3。
本发明实现了图片对应的文章、专题标识(即文章或者专题ID)进行对编码接口提交post请求得到编码后的ID(即编码ID),携带编码后ID向图片url接口提交post请求得到文章或者专题下的图片url尾缀列表(或称为后缀列表),将对应该网站的图片url前部与得到的尾缀进行拼接,即可得到完整的图片下载链接imgURL,后续可利用imgURL进行图片下载。采用批量下载,可以解决相关技术中图片下载效率较低的技术问题。
可选地,编码单元还用于:将所述目标网页的网页信息携带于post请求中提交给服务器;获取由所述服务器对post请求进行响应而返回的所述编码ID。
可选地,编码单元还用于:在将所述目标网页的网页信息携带于post请求中提交给服务器之后,对所述目标网页的网页ID、编码接口的来源、特征长度、字段要素构成以及编码格式进行分析,得到所述编码ID。
可选地,编码单元还用于:在对目标网页进行编码,得到编码ID之后,利用所述编码ID请求得到携带有所述目标网页内各图片的图片后缀的后缀列表。
可选地,编码单元还用于:将携带有所述编码ID的post请求发送到服务器;获取由所述服务器对post请求进行响应而返回的所述后缀列表。
可选地,编码单元还用于:通过对所述编码ID进行正则匹配得到图片链接接口;从所述图片链接接口接收所述后缀列表。
可选地,拼接单元还用于:将所述编码ID对应的前缀与后缀列表中的每个后缀分别进行拼接,得到所述目标网页内所有图片的下载链接。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在相应的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的另一个方面,还提供了一种用于实施上述图片的批量下载方法的服务器或终端。
图5是根据本申请实施例的一种终端的结构框图,如图5所示,该终端可以包括:一个或多个(仅示出一个)处理器201、存储器203、以及传输装置205,如图5所示,该终端还可以包括输入输出设备207。
其中,存储器203可用于存储软件程序以及模块,如本申请实施例中的图片的批量下载方法和装置对应的程序指令/模块,处理器201通过运行存储在存储器203内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图片的批量下载方法。存储器203可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器203可进一步包括相对于处理器201远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置205用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置205包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置205为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器203用于存储应用程序。
处理器201可以通过传输装置205调用存储器203存储的应用程序,以执行下述步骤:
对目标网页进行编码,得到编码ID;
将所述编码ID对应的前缀与所述目标网页内图片的图片后缀进行拼接,得到图片的下载链接;
利用所述目标网页内各图片的下载链接下载所述目标网页内的所有图片。
处理器201还用于执行下述步骤:
将所述目标网页的网页信息携带于post请求中提交给服务器;
获取由所述服务器对post请求进行响应而返回的所述编码ID。
本发明实现了图片对应的文章、专题标识(即文章或者专题ID)进行对编码接口提交post请求得到编码后的ID(即编码ID),携带编码后ID向图片url接口提交post请求得到文章或者专题下的图片url尾缀列表(或称为后缀列表),将对应该网站的图片url前部与得到的尾缀进行拼接,即可得到完整的图片下载链接imgURL,后续可利用imgURL进行图片下载。采用批量下载,可以解决相关技术中图片下载效率较低的技术问题。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图5所示的结构仅为示意,终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile InternetDevices,MID)、PAD等终端设备。图5其并不对上述电子装置的结构造成限定。例如,终端还可包括比图5中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图5所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行图片的批量下载方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
对目标网页进行编码,得到编码ID;
将所述编码ID对应的前缀与所述目标网页内图片的图片后缀进行拼接,得到图片的下载链接;
利用所述目标网页内各图片的下载链接下载所述目标网页内的所有图片。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:
将所述目标网页的网页信息携带于post请求中提交给服务器;
获取由所述服务器对post请求进行响应而返回的所述编码ID。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种图片的批量下载方法,其特征在于,包括:
对目标网页进行编码,得到编码ID;
将所述编码ID对应的前缀与所述目标网页内图片的图片后缀进行拼接,得到图片的下载链接;
利用所述目标网页内各图片的下载链接下载所述目标网页内的所有图片。
2.根据权利要求1所述的方法,其特征在于,对目标网页进行编码,得到编码ID包括:
将所述目标网页的网页信息携带于post请求中提交给服务器;
获取由所述服务器对post请求进行响应而返回的所述编码ID。
3.根据权利要求2所述的方法,其特征在于,在将所述目标网页的网页信息携带于post请求中提交给服务器之后,所述方法还包括:
对所述目标网页的网页ID、编码接口的来源、特征长度、字段要素构成以及编码格式进行分析,得到所述编码ID。
4.根据权利要求1所述的方法,其特征在于,在对目标网页进行编码,得到编码ID之后,所述方法还包括:
利用所述编码ID请求得到携带有所述目标网页内各图片的图片后缀的后缀列表。
5.根据权利要求4所述的方法,其特征在于,利用所述编码ID请求得到携带有所述目标网页内各图片的图片后缀的后缀列表包括:
将携带有所述编码ID的post请求发送到服务器;
获取由所述服务器对post请求进行响应而返回的所述后缀列表。
6.根据权利要求5所述的方法,其特征在于,获取由所述服务器对post请求进行响应而返回的所述后缀列表包括:
通过对所述编码ID进行正则匹配得到图片链接接口;
从所述图片链接接口接收所述后缀列表。
7.根据权利要求1所述的方法,其特征在于,将所述编码ID对应的前缀与所述目标网页内图片的图片后缀进行拼接,得到图片的下载链接包括:
将所述编码ID对应的前缀与后缀列表中的每个后缀分别进行拼接,得到所述目标网页内所有图片的下载链接。
8.一种图片的批量下载装置,其特征在于,包括:
编码单元,用于对目标网页进行编码,得到编码ID;
拼接单元,用于将所述编码ID对应的前缀与所述目标网页内图片的图片后缀进行拼接,得到图片的下载链接;
下载单元,用于利用所述目标网页内各图片的下载链接下载所述目标网页内的所有图片。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7任一项中所述的方法。
10.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器通过所述计算机程序执行上述权利要求1至7任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011072570.3A CN112187949B (zh) | 2020-10-09 | 2020-10-09 | 图片的批量下载方法和装置、存储介质、电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011072570.3A CN112187949B (zh) | 2020-10-09 | 2020-10-09 | 图片的批量下载方法和装置、存储介质、电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112187949A true CN112187949A (zh) | 2021-01-05 |
CN112187949B CN112187949B (zh) | 2021-08-20 |
Family
ID=73948315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011072570.3A Active CN112187949B (zh) | 2020-10-09 | 2020-10-09 | 图片的批量下载方法和装置、存储介质、电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112187949B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103645939A (zh) * | 2013-11-29 | 2014-03-19 | 北京奇虎科技有限公司 | 一种图片抓取的方法和系统 |
CN103927370A (zh) * | 2014-04-23 | 2014-07-16 | 焦点科技股份有限公司 | 一种组合文字和图片信息的网络资讯批量采集方法 |
CN104486371A (zh) * | 2014-11-20 | 2015-04-01 | 北京安奇智联科技有限公司 | 批量下载文件的设备和方法 |
US20150296014A1 (en) * | 2012-12-27 | 2015-10-15 | Tencent Technology (Shenzhen) Company Limited | Picture download method and apparatus |
US20180246980A1 (en) * | 2017-02-24 | 2018-08-30 | Invisible Friend LLC | Uniform Resource Locator Link Generator |
CN110619103A (zh) * | 2019-09-18 | 2019-12-27 | 珠海格力电器股份有限公司 | 网页图文检测方法、装置及存储介质 |
-
2020
- 2020-10-09 CN CN202011072570.3A patent/CN112187949B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150296014A1 (en) * | 2012-12-27 | 2015-10-15 | Tencent Technology (Shenzhen) Company Limited | Picture download method and apparatus |
CN103645939A (zh) * | 2013-11-29 | 2014-03-19 | 北京奇虎科技有限公司 | 一种图片抓取的方法和系统 |
CN103927370A (zh) * | 2014-04-23 | 2014-07-16 | 焦点科技股份有限公司 | 一种组合文字和图片信息的网络资讯批量采集方法 |
CN104486371A (zh) * | 2014-11-20 | 2015-04-01 | 北京安奇智联科技有限公司 | 批量下载文件的设备和方法 |
US20180246980A1 (en) * | 2017-02-24 | 2018-08-30 | Invisible Friend LLC | Uniform Resource Locator Link Generator |
CN110619103A (zh) * | 2019-09-18 | 2019-12-27 | 珠海格力电器股份有限公司 | 网页图文检测方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112187949B (zh) | 2021-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110380954B (zh) | 数据分享方法和装置,存储介质及电子装置 | |
CN105051685B (zh) | 用于使得网络资产能够访问本地应用的系统和方法 | |
CN107104924B (zh) | 网站后门文件的验证方法及装置 | |
KR101572642B1 (ko) | 데이터 제출 방법 및 장치 | |
US9245028B2 (en) | System and method to identify machine-readable codes | |
US10250521B2 (en) | Data stream identifying method and device | |
CN105897888B (zh) | 一种客户端连接方法及系统 | |
CN104683407A (zh) | 一种页面数据和应用数据的传输方法和设备 | |
CN107480277A (zh) | 用于网站日志采集的方法及装置 | |
CN103617267A (zh) | 社交化扩展搜索方法及装置、系统 | |
CN102185830B (zh) | 一种网络电视浏览器安全过滤的方法及系统 | |
CN104283865A (zh) | 一种下载处理方法、装置、服务器及客户端设备 | |
CN110535974A (zh) | 待投放资源的推送方法、推送装置、设备及存储介质 | |
CN105554136B (zh) | 备份数据还原方法、装置及系统 | |
CN105159992A (zh) | 一种应用程序的页面内容及网络行为的检测方法及装置 | |
CN104361007B (zh) | 浏览器及其收藏夹的处理方法 | |
CN111723083B (zh) | 用户身份识别方法、装置、电子设备及存储介质 | |
CN105550179A (zh) | 一种网页收藏方法和浏览器插件 | |
CN108280228A (zh) | 一种网页的处理方法及相关设备 | |
CN102769625A (zh) | 客户端Cookie信息获取方法和装置 | |
CN111506551A (zh) | 一种会议文件的提取方法、系统和计算机设备 | |
CN112187949B (zh) | 图片的批量下载方法和装置、存储介质、电子装置 | |
CN111291288B (zh) | 网页链接抽取方法及系统 | |
CN112417164A (zh) | 信息的推荐方法和装置、存储介质、电子装置 | |
CN112417874A (zh) | 命名实体的识别方法和装置、存储介质、电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |