找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 44|回复: 6

有没有采集器能像蜘蛛一样 只要个域名无需规则就能采集

[复制链接]

82

主题

2073

回帖

4526

积分

论坛元老

积分
4526
发表于 2014-7-19 10:42:28 | 显示全部楼层 |阅读模式
只要被采集的对象配合你,什么规则都不用
回复

使用道具 举报

4

主题

16

回帖

54

积分

注册会员

积分
54
发表于 2014-7-19 10:44:29 | 显示全部楼层
不要域名了  蜘蛛靠你的意念直接帮你跑了
回复

使用道具 举报

385

主题

1067

回帖

3389

积分

论坛元老

积分
3389
发表于 2014-7-19 10:49:00 | 显示全部楼层
采集论坛的软件 我倒是知道个 不用采集规则的..
回复

使用道具 举报

20

主题

756

回帖

1684

积分

金牌会员

积分
1684
发表于 2014-7-19 10:49:07 | 显示全部楼层
额,直接file_get_contents,全部拿下来
回复

使用道具 举报

283

主题

4444

回帖

9871

积分

论坛元老

积分
9871
发表于 2014-7-19 11:20:45 | 显示全部楼层
如果采集器可以一个字母就存放一次的话……
回复

使用道具 举报

33

主题

6071

回帖

1万

积分

论坛元老

积分
12347
发表于 2014-7-19 11:47:51 | 显示全部楼层

suzizi 发表于 2014-7-19 14:24

没懂

没有规则那就只能是最原始的穷举方法,比如网页标题,采集器不知道是什么,那就连标签都一起放进去。见连接就下载。
回复

使用道具 举报

0

主题

1

回帖

4

积分

新手上路

积分
4
发表于 2014-7-19 12:01:34 | 显示全部楼层

suzizi 发表于 2014-7-19 20:48

这个好办啊  到时过滤html即可
再说那蜘蛛怎么就能做到呢


那还不是得要人去用规则做?为何一开始不按规则采集?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2025-4-20 00:54 , Processed in 0.017723 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表