漂移弟 发表于 2019-3-18 16:34:15

(已解决)有没有会写bat的老哥,来帮个忙呗

本帖最后由 漂移弟 于 2019-3-18 17:25 编辑

要求用bat实现
某文件夹里有一大批这样的文件,显示是图片格式,实际上是txt文本


https://ws1.sinaimg.cn/large/0076uNA9gy1g170rpzv7gj30ay08agm9.jpg


里面的文本的格式如下图,现在需要将文件里面的网址,也就是 url= 到 ?vuin 之间这段(下图划红线上面这段),提取出来,然后拼接上文件名,格式是 网址+文件名 ,组成新的网址。然后把这批网址放到一个txt里面。


https://ws1.sinaimg.cn/large/0076uNA9gy1g170scg63ij30qf0340sp.jpg


不知道能不能实现,30元酬谢,不够可以加
lol.gif


代码
lol.gif

@echo off
for /f "delims=" %%a in ('dir /b /a-d *.cqimg') do (
    for /f "tokens=2 delims==?" %%b in ('type %%a^|find "url"') do (
      echo %%b/%%~na>>结果.txt
    )
)

allnetstore 发表于 2019-3-18 16:37:30

爬虫写不好,就得再写一个爬虫

miven 发表于 2019-3-18 16:41:59

使用php或者python容易处理吧。

漂移弟 发表于 2019-3-18 16:42:40


allnetstore 发表于 2019-3-18 16:37

爬虫写不好,就得再写一个爬虫
不是爬虫
lol.gif

漂移弟 发表于 2019-3-18 16:43:22


似水无痕 发表于 2019-3-18 16:42

不懂bat。不过在linux下用shell写应该很容易
想在windows下实现
lol.gif

冰剑 发表于 2019-3-18 16:37:00

你要是个妹纸我可以帮你写一个

漂移弟 发表于 2019-3-18 16:44:30


miven 发表于 2019-3-18 16:41

使用php或者python容易处理吧。
python折腾过了,我的是windows,同样的代码放到linux里面没有问题,放到windows就报错,百度也没搞定,放弃了
002.gif

逸笙 发表于 2019-3-18 16:42:00

发几个样本过来嘛~~~

漂移弟greyboy 发表于 2019-3-18 16:45:35


冰剑 发表于 2019-3-18 16:45

你要是个妹纸我可以帮你写一个
可以女装扮一下女的
019.gif
mad.gif
我采集下来也有同样问题

采集下来图片路径   /书名/章节/图片文件

需要每个章节都生成 txt      img代理url/书名/章节/图片文件

大佬们有没有书名方法建议
shy.gif

漂移弟 发表于 2019-3-18 16:45:37


逸笙 发表于 2019-3-18 16:46

发几个样本过来嘛~~~

md5=10178BF4BEF297CCBFFFF3A840191B64
width=690
height=1082
size=90774
url=https://example.cn/offpic_new/748565463//f42d9402-c4a0-4581-b349-f9d6ee7b037f/0?vuin=87564534569&term=2
addtime=1552853042

上面这段,每个文件都是差不多的,其中
url=

?vuin
是固定的, 想要
url=

?vuin
之间的那段,然后拼上文件名
页: [1] 2 3 4
查看完整版本: (已解决)有没有会写bat的老哥,来帮个忙呗