Python爬虫入门教程 14-100 All IT eBooks多线程爬取

1.All IT eBooks多线程-写在前面

对一个爬虫爱好者来讲,或多或少都有这么一点点的收集癖 ~ 发现好的图片,发现好的书籍,发现各类能存放在电脑上的东西,都喜欢把它批量的爬取下来。 而后放着,是的,就这么放着…而后慢慢的遗忘掉…html

6af89bc8gw1f8sw1x8sumg205m05k74f.gif

All IT eBooks多线程-爬虫分析

打开网址 http://www.allitebooks.com/ 发现特别清晰的小页面,一看就好爬
在这里插入图片描述web

在点击一本图书进入,发现下载的小连接也很明显的展现在了咱们面前,小激动一把,这么清晰无广告的网站很少见了。
在这里插入图片描述多线程

All IT eBooks多线程-撸代码

此次我采用了一个新的模块 requests-html 这个模块的做者以前开发了一款 requestssvg