8000 GitHub - songcser/webscraper: webscraper
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content
  • Notifications < 8000 tool-tip id="tooltip-d7911c7e-5d4b-4970-854f-13448b4c5cdb" for="repository-details-watch-button" popover="manual" data-direction="s" data-type="description" data-view-component="true" class="sr-only position-absolute">You must be signed in to change notification settings
  • Fork 1

webscraper

Notifications You must be signed in to change notification settings

songcser/webscraper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

webscraper

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。

使用Scrapy抓取Instagram数据,存储到我们自己的服务器上。其中访问Instagram需要翻墙,我们使用的是Shadowsocks。Shadowsocks使用的是socks代理,scrapy只支持http代理,所以使用polipo将socks代理转换成http代理。

About

webscraper

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

0