webscraper

Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。

使用Scrapy抓取Instagram数据，存储到我们自己的服务器上。其中访问Instagram需要翻墙，我们使用的是Shadowsocks。Shadowsocks使用的是socks代理，scrapy只支持http代理，所以使用polipo将socks代理转换成http代理。

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
develop		develop
webscraper		webscraper
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

webscraper

About

Releases

Packages

Languages

songcser/webscraper

Folders and files

Latest commit

History

Repository files navigation

webscraper

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages