找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 43|回复: 3

有用神箭手的吗,问个正则问题?

[复制链接]

85

主题

2082

回帖

4489

积分

论坛元老

积分
4489
发表于 2018-1-24 11:51:58 | 显示全部楼层 |阅读模式
我想采集1-45页的内容,
helperUrlRegexes: ["http://***\/page\/^([1-9]|[1-3][0-9]|[4][0-5])$"], //列表页

这样子写似乎不对,在测试时直接提示“测试运行结束,爬虫自动停止,测试完毕!”,只跑了个示例的page=1
是这个正则有问题还是xpath的语法不对啊?求指导


回复

使用道具 举报

85

主题

2082

回帖

4489

积分

论坛元老

积分
4489
 楼主| 发表于 2018-1-24 12:08:37 | 显示全部楼层
来个大佬~~~

回复

使用道具 举报

10

主题

388

回帖

854

积分

高级会员

积分
854
发表于 2018-1-24 12:17:50 | 显示全部楼层
本帖最后由 Carseason 于 2018-1-24 12:19 编辑

http:\/\/[^"]+\/page\/[1-4]{0,1}[0-9]$
这样子试一试
回复

使用道具 举报

85

主题

2082

回帖

4489

积分

论坛元老

积分
4489
 楼主| 发表于 2018-1-24 12:48:53 | 显示全部楼层

Carseason 发表于 2018-1-24 12:17

http:\/\/[^"]+\/page\/[1-4]{0,1}[0-9]$
这样子试一试

多谢!


按照你的方式测试了下,果然OK..
只要不带^的起始符就好了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2025-4-21 05:30 , Processed in 0.015852 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表