exc¶
Exceptions.
-
exception
crawlib.exc.
CaptchaError
¶ Encounter a captcha page.
http status code 403
中文文档
遭遇反爬虫验证页面。
-
exception
crawlib.exc.
DecodeError
¶ Failed to decode binary response.
-
exception
crawlib.exc.
DownloadOversizeError
¶ The download target are not falls in the size range you specified.
-
exception
crawlib.exc.
ForbiddenError
¶ Banned from server.
http status code 403
中文文档
被服务器禁止访问。
-
exception
crawlib.exc.
IncompleteDataError
¶ Successfully parse data from html, but we can’t accept the result due to missing data.
-
exception
crawlib.exc.
ParseError
¶ Failed to parse data from html, may due to bug in your method.
中文文档
由于函数的设计失误, 解析页面信息发生了错误。
-
exception
crawlib.exc.
ServerSideError
¶ Server side problem.
code 404
中文文档
- 因为服务器的缘故该页面无法正常访问, 也可能已经不存在了, 但以后可能会回来。
- 因为服务器的缘故, 上面的数据不是我们想要的, 但是我们可以暂时用着, 以后可能要重新抓取。
-
exception
crawlib.exc.
SoupError
¶ Failed to convert html to beatifulsoup.
http status 200+
中文文档
html成功获得了, 但是格式有错误, 不能转化为soup。
-
exception
crawlib.exc.
WrongHtmlError
¶ The html is not the one we desired.
中文文档
页面不是我们想要的页面。有以下几种可能:
- 服务器暂时连不上, 返回了404页面。
- 服务器要求验证码, 返回了验证码页面。
- 页面暂时因为各种奇怪的原因不是我们需要的页面。