设为首页收藏本站

简体中文 繁體中文 English 日本語 Deutsch 한국 사람 بالعربية TÜRKÇE português คนไทย Français

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 91|回复: 6

有没有采集器能像蜘蛛一样 只要个域名无需规则就能采集

[复制链接]

82

主题

2086

回帖

4568

积分

论坛元老

积分
4568
发表于 2014-7-19 10:42:28 | 显示全部楼层 |阅读模式
只要被采集的对象配合你,什么规则都不用
回复

使用道具 举报

18

主题

134

回帖

398

积分

中级会员

积分
398
发表于 2014-7-19 10:44:29 | 显示全部楼层
不要域名了  蜘蛛靠你的意念直接帮你跑了
回复

使用道具 举报

405

主题

1146

回帖

3651

积分

论坛元老

积分
3651
发表于 2014-7-19 10:49:00 | 显示全部楼层
采集论坛的软件 我倒是知道个 不用采集规则的..
回复

使用道具 举报

25

主题

948

回帖

2155

积分

金牌会员

积分
2155
发表于 2014-7-19 10:49:07 | 显示全部楼层
额,直接file_get_contents,全部拿下来
回复

使用道具 举报

319

主题

4992

回帖

1万

积分

论坛元老

积分
11139
发表于 2014-7-19 11:20:45 | 显示全部楼层
如果采集器可以一个字母就存放一次的话……
回复

使用道具 举报

33

主题

6114

回帖

1万

积分

论坛元老

积分
12479
发表于 2014-7-19 11:47:51 | 显示全部楼层

suzizi 发表于 2014-7-19 14:24

没懂

没有规则那就只能是最原始的穷举方法,比如网页标题,采集器不知道是什么,那就连标签都一起放进去。见连接就下载。
回复

使用道具 举报

0

主题

1

回帖

4

积分

新手上路

积分
4
发表于 2014-7-19 12:01:34 | 显示全部楼层

suzizi 发表于 2014-7-19 20:48

这个好办啊  到时过滤html即可
再说那蜘蛛怎么就能做到呢


那还不是得要人去用规则做?为何一开始不按规则采集?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2026-2-7 11:20 , Processed in 0.017793 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表