eqblog 发表于 2018-2-4 14:20:43

【爬虫开源】91+1024+mm131爬虫

006.gif
早上差点被吓死。。mjj。。

项目全部整理到了Github:
91视频解析:https://github.com/eqblog/91_**_video_url
91视频爬虫:https://github.com/eqblog/91_**_spider
1024图片爬虫:https://github.com/eqblog/1024_img_spider_threads
mm131图片爬虫:https://github.com/eqblog/mm131_spider_threading


注意:仅支持python3
注意:仅支持python3
注意:仅支持python3


python需要requests库
请使用pip安装
pip3 install requests


修改目录出现的错误,请自行看代码修改。。本人精力有限(没入股营养快线),精力不足啊
至于我是哪学的爬虫吗。。
python3基础是网上随便找的教程看的。
其实不需要基础也可以学爬虫的。。有其它语言入门水平即可
我是从网上下的免费教程
是崔庆才的,他博客有付费教程,当然你也可以像我一样从网上下载免费的
我只学到了正则。。第10课时左右。。

ecosway598 发表于 2018-2-4 14:22:50

py3 才好,py2还需要自己转编码

oldj 发表于 2018-2-4 14:23:44

91 video spider
lol.gif

倾城翻翻 发表于 2018-2-4 14:27:56

91视频的只爬了54G就自己退了难道91只有这么多 ?

不可能吧   退出也没提示

1024爬的吊炸天   2500个目录

fl20002 发表于 2018-2-4 14:27:58

本帖最后由 eqblog 于 2018-2-4 14:30 编辑

fl20002 发表于 2018-2-4 14:27

91视频的只爬了54G就自己退了难道91只有这么多 ?

不可能吧   退出也没提示


006.gif
你应该是用windows吧? 建议你拿cmd用用python命令执行脚本
这样你会看到报什么错

对了。。默认只爬100页哦。。你把flag改下

while flag
ecosway598 发表于 2018-2-4 14:22

大佬python2.7你放弃了么

011.gif
python2太麻烦了。。中文字符还得自己转。。还不如用python3。。方便点

eqblog 发表于 2018-2-4 14:29:24


eqblog 发表于 2018-2-4 14:29

你应该是用windows吧? 建议你拿cmd用用python命令执行脚本
这样你会看到报什么错
用的window用Linux 好多502

100页54G 差不多

大佬还是入股营养快线吧

稳赚不赔 本帖最后由 xinhualu246 于 2018-2-4 14:44 编辑

其实91完全不用伪造随机IP放到X-Forwarded-For
一个IP就能下完所有的

nerlnsqy 发表于 2018-2-4 14:27:00


xinhualu246 发表于 2018-2-4 14:42

其实完全不用随机IP放到X-Forwarded-For
一个IP就能下完所有的

007.gif
随机IP是为了破那个10视频限制 然后找出mp4地址的。。 虽然我也不知道有没有用。。

weilai丶 发表于 2018-2-4 14:30:43

老哥 我又来了,脚本修改成只下载原标题文件.mp4的视频文件怎么弄啊?修改成“视频”就出现错误本页已下载完,下一页了,怎么解决啊

eqblog 发表于 2018-2-4 14:30:51


lol.gif
lol.gif
lol.gif
脚本一大推,啥类型的都有

bupoo 发表于 2018-2-4 14:22:00

强帖刘明!!!!!!
页: [1] 2 3 4 5
查看完整版本: 【爬虫开源】91+1024+mm131爬虫