找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 533|回复: 51

关于淘宝的丝袜爬虫历史贴

[复制链接]

667

主题

5112

回帖

1万

积分

论坛元老

积分
12305
发表于 2019-3-6 17:44:04 | 显示全部楼层 |阅读模式
本帖最后由 今晚我是你的 于 2019-3-19 06:30 编辑

https://www.hostloc.com/thread-507739-1-1.html

https://h5.m.taobao.com/ocean/privatenode/shop.html?sellerId=109043255


这个淘宝瀑布流技术难点在于 没有单独的列表页,而那个json的地址又不能单独打开,page也不能直接修改。

集思广益,找出自动爬下一页列表页url的方法。(目前只知道手动去抓下一页的,我已经爬完了,不过依然没有学会如何自动爬下一页,因为下一页的page不能单独改的,url里面的各种参数值也是随机的)


仅供交流学习,提高自己的技术水平,不要老想着撸啊撸
回复

使用道具 举报

2

主题

21

回帖

66

积分

注册会员

积分
66
发表于 2019-3-6 19:21:48 | 显示全部楼层
https://h5.m.taobao.com/ocean/privatenode/shop.html?sellerId=673336836
回复

使用道具 举报

1

主题

20

回帖

47

积分

新手上路

积分
47
发表于 2019-3-6 20:42:00 | 显示全部楼层
本帖最后由 冰镇苏打水 于 2019-3-8 19:02 编辑

为了回复帖子,专门买了个注册吗.洋洋洒洒写了签名过程.
贴了个超链接,然后说不能发地址.然后都给我删了.
醉了 ....

t.(删括号以及内容)cn/EMvA4mo
回复

使用道具 举报

3

主题

75

回帖

189

积分

注册会员

积分
189
发表于 2019-3-8 18:59:27 | 显示全部楼层
好不容易上次网 不仅花了钱 营养还流失了
回复

使用道具 举报

3

主题

187

回帖

397

积分

中级会员

积分
397
发表于 2019-3-7 11:18:50 | 显示全部楼层
666,那就分享出了吧,大佬

回复

使用道具 举报

1

主题

20

回帖

47

积分

新手上路

积分
47
发表于 2019-3-6 17:57:03 | 显示全部楼层
打开淘宝的任何一个具体商品页,在控制台输入一下代码.替换掉网址中的"sellerId"的值

[ol][*](function getUserId(){
[*]    var name = "userid=";
[*]    var ca = document.querySelector('meta[name="microscope-data"]').content.split(';');
[*]    for(var i=0; i复制代码
回复

使用道具 举报

278

主题

1660

回帖

4234

积分

论坛元老

积分
4234
发表于 2019-3-6 17:58:00 | 显示全部楼层
分享出来,今晚我是你的
回复

使用道具 举报

217

主题

1834

回帖

4391

积分

论坛元老

积分
4391
发表于 2019-3-9 00:25:48 | 显示全部楼层
这种爬虫可以写, 无限抓取, 但是目前还在学.

回复

使用道具 举报

39

主题

187

回帖

505

积分

高级会员

积分
505
发表于 2019-3-6 18:05:49 | 显示全部楼层

十香 发表于 2019-3-6 18:08

卧槽.够劲,这论坛就这样,说着说着就开车了

说着说着就开车了
回复

使用道具 举报

59

主题

314

回帖

843

积分

高级会员

积分
843
发表于 2019-3-6 18:08:13 | 显示全部楼层


小白表示只会用远古火车头,感谢提供网址,晚点用火车头试试
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2025-4-20 00:47 , Processed in 0.025469 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表