找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 134|回复: 17

求个批量下载图片的软件 或者linux的爬虫脚本

[复制链接]

5

主题

21

回帖

75

积分

注册会员

积分
75
发表于 2018-11-7 09:39:17 | 显示全部楼层 |阅读模式
本帖最后由 FxckEveryBody 于 2018-11-7 10:32 编辑

有图片的url
求个批量下载图片的软件 或者linux的爬虫脚本

发现这个貌似可以
https://blog.csdn.net/hjwang1/article/details/44408633
回复

使用道具 举报

202

主题

1110

回帖

2932

积分

金牌会员

积分
2932
发表于 2018-11-7 09:45:14 | 显示全部楼层
同求 有没有大佬有这神器啊
回复

使用道具 举报

122

主题

604

回帖

1646

积分

金牌会员

积分
1646
发表于 2018-11-7 09:53:41 | 显示全部楼层

同求   最近想做妹子图
回复

使用道具 举报

48

主题

395

回帖

1002

积分

金牌会员

积分
1002
发表于 2018-11-7 10:03:51 | 显示全部楼层

lzhd24 发表于 2018-11-7 10:03

`wget -i`
url发出来我给你下载


这个我在用 下载好慢啊 受不了
有没有办法多线程
回复

使用道具 举报

5

主题

21

回帖

75

积分

注册会员

积分
75
 楼主| 发表于 2018-11-7 10:16:32 | 显示全部楼层
有url列表的话迅雷应该就可以?批量添加任务。
回复

使用道具 举报

14

主题

289

回帖

644

积分

高级会员

积分
644
发表于 2018-11-7 10:03:00 | 显示全部楼层

zqm840527 发表于 2018-11-7 10:19

有url列表的话迅雷应该就可以?批量添加任务。

太多了 添加的时候卡住了

回复

使用道具 举报

5

主题

21

回帖

75

积分

注册会员

积分
75
 楼主| 发表于 2018-11-7 10:19:45 | 显示全部楼层

FxckEveryBody 发表于 2018-11-7 10:23

太多了 添加的时候卡住了

火车头免费版估计也可以
回复

使用道具 举报

14

主题

289

回帖

644

积分

高级会员

积分
644
发表于 2018-11-7 10:23:30 | 显示全部楼层
idm,有批量下载,增量下载
回复

使用道具 举报

64

主题

324

回帖

910

积分

高级会员

积分
910
发表于 2018-11-7 10:19:00 | 显示全部楼层
发现这个貌似可以
https://blog.csdn.net/hjwang1/article/details/44408633
gr58046576 发表于 2018-11-7 10:28

idm,有批量下载,增量下载

也卡死了 尴尬

回复

使用道具 举报

9

主题

71

回帖

201

积分

中级会员

积分
201
发表于 2018-11-7 10:24:40 | 显示全部楼层
本帖最后由 gougou6423 于 2018-11-7 14:37 编辑

python3的,需要先 pip install requests
[ol]
  • THREAD = 10 #线程数
  • LINK_PATH = 'link.txt' #保存链接的文件
  • import concurrent.futures
  • import time
  • import requests
  • import os
  • import imghdr
  • def download(url):
  •         url = url.strip()
  •         r = requests.get(url, stream=True)
  •         chunk_size=1048576
  •         filename = url.split('/')[-1]
  •         with open(filename, "wb") as f:
  •                 for chunk in r.iter_content(chunk_size=chunk_size):
  •                         if chunk:
  •                                 f.write(chunk)
  •         print(filename + "下载完成")
  •         return filename
  •         
  • start = time.time()
  • print("图片下载开始")
  • f = open(LINK_PATH)
  • urls = f.readlines()
  • f.close()
  • executor = concurrent.futures.ThreadPoolExecutor(max_workers=THREAD)
  • all_task = [executor.submit(download, (url)) for url in urls]
  • for future in concurrent.futures.as_completed(all_task):
  •         filename = future.result()
  •         if not os.path.splitext(filename)[1]:
  •                 img_type = imghdr.what(filename)
  •                 os.rename(filename, filename + '.' + img_type)
  • end = time.time()               
  • print("所有图片下载完成,耗时%.2f秒" %(end-start))
  • [/ol]复制代码
  • 回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    Archiver|手机版|小黑屋|Discuz! X

    GMT+8, 2025-4-20 12:02 , Processed in 0.021104 second(s), 4 queries , Gzip On, Redis On.

    Powered by Discuz! X3.5

    © 2001-2024 Discuz! Team.

    快速回复 返回顶部 返回列表