GuShiWen

Scrapy练习项目，利用Scrapy抓取古诗（唐诗三百首，宋词三百首等），并保存为json格式（不断完善ing）

采用的技术

##遇到的问题

转换成json数据的时候多了很多无用的空格

提取一首诗题目之后根据题目进入到下一个页面提取相对应的内容，使用yield request发现内容不对应

Scrapy默认抓取为多线程，使用第三方requests提取网站源码，并用Scrapy的HtmlResponse转换成 Scrapy响应格式,即可正常使用xpath抓取

网站赏析部分有文字图片,提取时自动忽略

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
tangshi5		tangshi5
README.md		README.md
scrapy.cfg		scrapy.cfg