找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 85|回复: 13

把DHT改为mysql+sphinx了,空间占用降下来好多啊!

[复制链接]

34

主题

443

回帖

1008

积分

金牌会员

积分
1008
发表于 2016-3-8 17:15:29 | 显示全部楼层 |阅读模式
之前用的MongoDB+Elasticsearch,等于是存储了两份相同的数据,导致空间占用过大,才20W数据就占用了我差不多10个G
本来想不用MongoDB,直接使用Elasticsearch得了,但是发现Elasticsearch在提取数据时,单条数据提取似乎比MongoDB慢
然后又想到很多人推荐MySQL+Sphinx,干脆改了,改完之后空间存储占用的确下降了好多啊!
回复

使用道具 举报

55

主题

1740

回帖

3653

积分

论坛元老

积分
3653
发表于 2016-3-8 17:16:49 | 显示全部楼层


求开源
回复

使用道具 举报

34

主题

443

回帖

1008

积分

金牌会员

积分
1008
 楼主| 发表于 2016-3-8 17:18:10 | 显示全部楼层
等等看,我测试了看看再决定是否开源
回复

使用道具 举报

148

主题

660

回帖

1782

积分

金牌会员

积分
1782
发表于 2016-3-8 17:19:30 | 显示全部楼层
但是有时查询会出现sphinx无法连接的问题
回复

使用道具 举报

34

主题

443

回帖

1008

积分

金牌会员

积分
1008
 楼主| 发表于 2016-3-8 17:24:17 | 显示全部楼层
虽然看不到前途 帮顶
回复

使用道具 举报

12

主题

1518

回帖

3092

积分

论坛元老

积分
3092
发表于 2016-3-8 18:28:23 | 显示全部楼层
开元的呢
回复

使用道具 举报

391

主题

3854

回帖

8957

积分

论坛元老

积分
8957
发表于 2016-3-8 19:24:02 | 显示全部楼层
…这几天也在折腾 用go写了一个 效率是不错… 挂了6小时爬到了800多万(不知道去重复的和蜜罐来的假hash后还有多少)  在想用啥数据库入库…
回复

使用道具 举报

5

主题

102

回帖

223

积分

中级会员

积分
223
发表于 2016-3-8 20:02:49 | 显示全部楼层
"

6小时800万。。。
你只是统计了hash还是只计算入库的?
是去重了么?
数据库的话自己看吧,选自己喜欢的
回复

使用道具 举报

34

主题

443

回帖

1008

积分

金牌会员

积分
1008
 楼主| 发表于 2016-3-8 20:46:05 | 显示全部楼层
本帖最后由 shiro 于 2016-3-8 22:14 编辑

带头盔滴衰锅 发表于 2016-3-8 20:46

6小时800万。。。
你只是统计了hash还是只计算入库的?
是去重了么?


只统计了抓到的hash..还没处理呢
shiro 发表于 2016-3-8 22:12

只统计了抓到的hash..还没处理呢

哦,我就说呢,如果这么高的效率,得多高的CPU,得多少流量
回复

使用道具 举报

208

主题

273

回帖

1214

积分

金牌会员

积分
1214
发表于 2016-3-8 20:02:00 | 显示全部楼层
已经有多个开源的了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2025-2-3 06:53 , Processed in 0.024318 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表