设为首页收藏本站

简体中文 繁體中文 English 日本語 Deutsch 한국 사람 بالعربية TÜRKÇE português คนไทย Français

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 161|回复: 19

请教个python问题 正则提取IndexError list index out of range

[复制链接]

37

主题

402

回帖

1019

积分

金牌会员

积分
1019
发表于 2020-4-18 20:33:51 | 显示全部楼层 |阅读模式
在爬n**的时候遇见了个问题
有些网页爬取出现IndexError list index out of range

这是出问题的截图和网页/g/201100/






这是我正则提取的代码

[ol]
  • page = re.findall('
    [img][/img]
    ',html)[-1]
  • [/ol]复制代码



    这是需要提取的代码
    [ol]
  •                                 [url=]
  •                                        
    [img][/img]
    [img][/img]
  •                                 [/url]
  •                         [/ol]复制代码
  • 本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?立即注册

    ×
    回复

    使用道具 举报

    14

    主题

    342

    回帖

    768

    积分

    高级会员

    积分
    768
    发表于 2020-4-18 20:48:34 | 显示全部楼层
    老哥  *和. 是关键字

    改成

    [img][/img]

    就行了
    回复

    使用道具 举报

    3

    主题

    10

    回帖

    39

    积分

    新手上路

    积分
    39
    发表于 2020-4-18 20:48:52 | 显示全部楼层
    判断吧   估计是有些没有取到内容'
    回复

    使用道具 举报

    13

    主题

    171

    回帖

    437

    积分

    中级会员

    积分
    437
    发表于 2020-4-18 20:53:03 | 显示全部楼层
    list index out of range 引用超出长度
    回复

    使用道具 举报

    10

    主题

    308

    回帖

    676

    积分

    高级会员

    积分
    676
    发表于 2020-4-18 20:57:26 | 显示全部楼层
    列表索引超出范围,比如说一个长度为一的数组a,访问a[1]就会报错
    回复

    使用道具 举报

    37

    主题

    402

    回帖

    1019

    积分

    金牌会员

    积分
    1019
     楼主| 发表于 2020-4-18 21:03:30 | 显示全部楼层

    proc 发表于 2020-4-18 20:57

    列表索引超出范围,比如说一个长度为一的数组a,访问a[1]就会报错

    这是提取时出现问题了啊
    回复

    使用道具 举报

    37

    主题

    402

    回帖

    1019

    积分

    金牌会员

    积分
    1019
     楼主| 发表于 2020-4-18 20:57:00 | 显示全部楼层

    353698500 发表于 2020-4-18 20:48

    判断吧   估计是有些没有取到内容'

    为什么没获取到呢,而且次次都没
    回复

    使用道具 举报

    0

    主题

    107

    回帖

    294

    积分

    中级会员

    积分
    294
    发表于 2020-4-18 21:05:38 | 显示全部楼层

    [img][/img]
    回复

    使用道具 举报

    10

    主题

    308

    回帖

    676

    积分

    高级会员

    积分
    676
    发表于 2020-4-18 20:48:00 | 显示全部楼层

    盯裆猫 发表于 2020-4-18 21:03

    这是提取时出现问题了啊

    嗯,某一个正则没有匹配到内容,或者说你访问的下标超了。

    在Python Shell里把提取到的数组打印出来看看
    回复

    使用道具 举报

    0

    主题

    1

    回帖

    4

    积分

    新手上路

    积分
    4
    发表于 2020-4-18 21:06:58 | 显示全部楼层

    大师兄 发表于 2020-4-18 21:06

    老哥还是一样的有这个错误
    proc 发表于 2020-4-18 21:10

    嗯,某一个正则没有匹配到内容,或者说你访问的下标超了。

    在Python Shell里把提取到的数组打印出来看看 ...

    打印出来,直接超出索引,这只是提取一个数
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    Archiver|手机版|小黑屋|Discuz! X

    GMT+8, 2026-3-28 18:04 , Processed in 0.016493 second(s), 4 queries , Gzip On, Redis On.

    Powered by Discuz! X3.5

    © 2001-2025 Discuz! Team.

    快速回复 返回顶部 返回列表