(已解决)有没有会写bat的老哥,来帮个忙呗
本帖最后由 漂移弟 于 2019-3-18 17:25 编辑要求用bat实现
某文件夹里有一大批这样的文件,显示是图片格式,实际上是txt文本
https://ws1.sinaimg.cn/large/0076uNA9gy1g170rpzv7gj30ay08agm9.jpg
里面的文本的格式如下图,现在需要将文件里面的网址,也就是 url= 到 ?vuin 之间这段(下图划红线上面这段),提取出来,然后拼接上文件名,格式是 网址+文件名 ,组成新的网址。然后把这批网址放到一个txt里面。
https://ws1.sinaimg.cn/large/0076uNA9gy1g170scg63ij30qf0340sp.jpg
不知道能不能实现,30元酬谢,不够可以加
lol.gif
代码
lol.gif
@echo off
for /f "delims=" %%a in ('dir /b /a-d *.cqimg') do (
for /f "tokens=2 delims==?" %%b in ('type %%a^|find "url"') do (
echo %%b/%%~na>>结果.txt
)
) 爬虫写不好,就得再写一个爬虫 使用php或者python容易处理吧。
allnetstore 发表于 2019-3-18 16:37
爬虫写不好,就得再写一个爬虫
不是爬虫
lol.gif
似水无痕 发表于 2019-3-18 16:42
不懂bat。不过在linux下用shell写应该很容易
想在windows下实现
lol.gif
你要是个妹纸我可以帮你写一个
miven 发表于 2019-3-18 16:41
使用php或者python容易处理吧。
python折腾过了,我的是windows,同样的代码放到linux里面没有问题,放到windows就报错,百度也没搞定,放弃了
002.gif
发几个样本过来嘛~~~
冰剑 发表于 2019-3-18 16:45
你要是个妹纸我可以帮你写一个
可以女装扮一下女的
019.gif
mad.gif
我采集下来也有同样问题
采集下来图片路径 /书名/章节/图片文件
需要每个章节都生成 txt img代理url/书名/章节/图片文件
大佬们有没有书名方法建议
shy.gif
逸笙 发表于 2019-3-18 16:46
发几个样本过来嘛~~~
md5=10178BF4BEF297CCBFFFF3A840191B64
width=690
height=1082
size=90774
url=https://example.cn/offpic_new/748565463//f42d9402-c4a0-4581-b349-f9d6ee7b037f/0?vuin=87564534569&term=2
addtime=1552853042
上面这段,每个文件都是差不多的,其中
url=
和
?vuin
是固定的, 想要
url=
和
?vuin
之间的那段,然后拼上文件名