8000 GitHub - TwoOnefour/max_book: 原创力文档爬虫下载pdf
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content

TwoOnefour/max_book

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 

Repository files navigation

Description

这是一个原创力文档的爬虫,可以爬取doc,docx和pdf,输入网址,可以将文档下载到img文件夹下

ppt只能爬取链接

注意,只能下载免费预览的文档,付费文档请付费下载

Usage

python.exe get_doc.py 'maxbook的文档url'

For example

python.exe get_doc.py https://max.book118.com/html/2017/0122/86192397.shtm

输出图片

Disclaimer

此程序仅用于学习交流,禁止用于商业用途,如有认为本项目有侵权嫌疑,请联系我删除本项目

About

原创力文档爬虫下载pdf

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

0