找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
楼主: wenguonideshou

另类下载91的脚本—介绍大佬Kenneth Reitz的新爬虫库requests

[复制链接]

90

主题

802

回帖

1982

积分

金牌会员

积分
1982
发表于 2018-3-1 15:14:00 | 显示全部楼层

985464672 发表于 2018-3-8 13:06

C:%users\mmmcz\Desktop\91>python 91.py
Traceback (most recent call last):
  File "91.py", line 85, i ...

我也是這個錯誤,電腦上能正常跑,小雞上跑不了

root@181:~# python3 91.py
Traceback (most recent call last):
  File "91.py", line 86, in
    main(4260)
  File "91.py", line 79, in main
    for url in page_url.html.absolute_links:
  File "/usr/local/lib/python3.6/site-packages/requests_html.py", line 329, in absolute_links
    return set(gen())
  File "/usr/local/lib/python3.6/site-packages/requests_html.py", line 326, in gen
    for link in self.links:
  File "/usr/local/lib/python3.6/site-packages/requests_html.py", line 300, in links
    return set(gen())
  File "/usr/local/lib/python3.6/site-packages/requests_html.py", line 291, in gen
    for link in self.find('a'):
  File "/usr/local/lib/python3.6/site-packages/requests_html.py", line 227, in find
    for found in self.pq(selector)
  File "/usr/local/lib/python3.6/site-packages/requests_html.py", line 124, in pq
    self._pq = PyQuery(self.html)
  File "/usr/local/lib/python3.6/site-packages/requests_html.py", line 90, in html
    return self.raw_html.decode(self.encoding)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xef in position 27093: invalid continuation byte
厉害了python, mjj们保重身体啊
回复

使用道具 举报

14

主题

229

回帖

568

积分

高级会员

积分
568
发表于 2018-3-1 15:29:57 | 显示全部楼层
身体吃不消了
回复

使用道具 举报

556

主题

1848

回帖

5436

积分

论坛元老

积分
5436
发表于 2018-3-1 15:37:13 | 显示全部楼层
问题是上次爬完了,不爬了
回复

使用道具 举报

3

主题

26

回帖

83

积分

注册会员

积分
83
发表于 2018-3-1 15:38:09 | 显示全部楼层
俄罗斯为什么总是人才倍出
回复

使用道具 举报

27

主题

563

回帖

1253

积分

金牌会员

积分
1253
发表于 2018-3-1 16:12:11 | 显示全部楼层
收藏了。python**好。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2025-4-20 18:08 , Processed in 0.016423 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表