找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 149|回复: 19

反爬虫新思路

[复制链接]

114

主题

136

回帖

634

积分

高级会员

积分
634
发表于 2019-3-19 20:08:48 | 显示全部楼层 |阅读模式
统计各种搜索引擎的ip, 其他ip指定时间段限制抓取页面数量,平均单页访问时间小于特定时间,超过一定数量就办ip1个小时,24小时连续办三次就办12小时,依次累加。
这样爬个大站是不是成本就很大了?
回复

使用道具 举报

27

主题

214

回帖

553

积分

高级会员

积分
553
发表于 2019-3-19 21:32:11 | 显示全部楼层
其实很简单的,看到不顺眼的,直接拉一个C段ip进黑名单,再不顺眼,直接一个B段ip进黑名单,你要是还不顺眼,那就没办法了。反正我的黑名单库里已经好几百万ip了。

。。。结果只有一个,网站基本上没有ip了

回复

使用道具 举报

4

主题

629

回帖

1286

积分

金牌会员

积分
1286
发表于 2019-3-19 20:15:56 | 显示全部楼层
理论上没错 但是防不住的
回复

使用道具 举报

89

主题

1833

回帖

4029

积分

论坛元老

积分
4029
发表于 2019-3-19 20:15:59 | 显示全部楼层
一般的都是大量代理1IP轮番QJ
回复

使用道具 举报

44

主题

298

回帖

764

积分

高级会员

积分
764
发表于 2019-3-19 20:20:25 | 显示全部楼层


移动端。。。就只有一个IP。。封了咋办
回复

使用道具 举报

73

主题

183

回帖

639

积分

高级会员

积分
639
发表于 2019-3-19 20:21:20 | 显示全部楼层
google的ip不固定的
回复

使用道具 举报

9

主题

71

回帖

201

积分

中级会员

积分
201
发表于 2019-3-19 20:28:46 | 显示全部楼层
基站IP只有一个,然后真正爬虫加个代理池不是很正常的操作。个人感觉比较好的反爬是用js加载网页,可以挡住很大一部分爬虫,剩下用selenium之类的,效率也会低很多
回复

使用道具 举报

20

主题

1517

回帖

3126

积分

论坛元老

积分
3126
发表于 2019-3-19 20:31:37 | 显示全部楼层
手机上网,都是同一个ip,宁杀一个,错杀1000。
回复

使用道具 举报

5

主题

51

回帖

121

积分

注册会员

积分
121
发表于 2019-3-19 20:36:39 | 显示全部楼层
爬虫也可以通过代理访问
回复

使用道具 举报

195

主题

2815

回帖

6343

积分

论坛元老

积分
6343
发表于 2019-3-19 20:41:53 | 显示全部楼层
IP才多少钱,拉几根家庭宽带呢?1.手机共享ip
2.家宽共享ip
3.公司很多人共享一个ip

lz打算怎么解决
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2025-4-21 04:53 , Processed in 0.021525 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表