网络爬虫,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 网站首页Spider

tesserocr:第三方模块tesserocr安装

tesserocr:第三方模块tesserocr安装

在爬虫过程中,难免会遇到各种各样的验证码,而大多数验证码还是图形验证码,这时候我们可以直接用 OCR 来识别。

Pyspider:常见错误整理

Pyspider:常见错误整理

使用pyspider时遇到的问题,记录下来。