找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 350|回复: 34

搜片大师(Python版磁力链源码) 安装部署教程

[复制链接]

37

主题

1192

回帖

2553

积分

金牌会员

积分
2553
发表于 2015-4-16 17:53:59 | 显示全部楼层 |阅读模式
本帖最后由 wenguonideshou 于 2015-8-16 15:26 编辑

有朋友PM我怎么安装,我就在此说下我的设置,仅供参考。
源码地址  http://www.hostloc.com/thread-273194-1-1.html



推荐使用win2008,因为这套源码是基于Mysql+Python的,众所周知在win2008上面他们的性能比在win03上面好太多
我的系统是win2008 R2 64位,2G内存

1.安装.net3.5.1  :服务器管理器-功能-添加功能-安装
安装mysql    http://dev.mysql.com/downloads/file.php?id=456518
安装python  https://www.python.org/ftp/python/2.7.9/python-2.7.9.amd64.msi
安装MySQL-python-1.2.3.win-amd64-py2.7  http://www.codegood.com/archives/129


2.创建数据库 名为bt

3.解压源码,其中
weclar文件夹是采集工具+网站目录,网站目录在/web/template目录下,修改源码后需要点“关闭网站”再点“打开网站”才能生效
magent.rar是数据库,将magnet.rar解压到bt数据库所在目录

4.打开soupian.exe 设置:

爬虫-监听地址                填写服务器IP,端口不用修改,线程一般设置为500




填写正确的的数据库信息,连接池一般设置为10




设置索引





网站-监听地址                 填写服务器IP,端口80





5.解析域名到服务器的IP

6.主选项-开启爬虫-开启网站
爬虫是否启动:
dumeter可以看到上传下载流量的话,就说明爬虫正在工作,占用带宽 几十k/s
是否入库:
mysql命令行界面 输入命令
use information_schema;
select table_name,table_rows from tables where TABLE_SCHEMA = 'bt' order by table_rows desc;
查看film这一行的数字是否增加(数字代表数据库里的电影数量)



或者用phpmyadmin进bt数据库的film表也能看到
或者打开首页查看源代码,也能看到电影总数

注意:如果你使用80端口,服务器不能安装有IIS或者apache等WEB服务器




有坛友发布的视频版安装教程:  http://www.hostloc.com/thread-274391-1-1.html
http://v.youku.com/v_show/id_XOTQwMzg3NzUy.html




补充,在win2003下:

安装.net3.5
安装.net4.0
安装mysql                    http://dev.mysql.com/downloads/file.php?id=456518
安装python 32位                  https://www.python.org/ftp/python/2.7.9/python-2.7.9.msi
安装MySQL-python-1.2.3.win32-py2.7.exe                 http://www.codegood.com/archives/129
剩下的流程 按照win08的流程做

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

37

主题

1192

回帖

2553

积分

金牌会员

积分
2553
 楼主| 发表于 2015-4-17 17:35:23 | 显示全部楼层
本帖最后由 wenguonideshou 于 2015-8-4 11:15 编辑

索引的问题 已经解决 :
http://www.hostloc.com/thread-273787-1-1.html
回复

使用道具 举报

37

主题

1192

回帖

2553

积分

金牌会员

积分
2553
 楼主| 发表于 2015-4-19 22:03:14 | 显示全部楼层

a7898585 发表于 2015-4-19 21:17

必须这样?有没有兼容的方法?
另外问下,他的谷歌广告和cnzz怎么处理?哪个文件都没找到 ...


web/template目录下是网页源码 ,去除他的广告 需要删除代码
"
回复

使用道具 举报

49

主题

282

回帖

747

积分

高级会员

积分
747
发表于 2015-4-19 21:17:00 | 显示全部楼层
怎么绑定域名
回复

使用道具 举报

17

主题

74

回帖

217

积分

中级会员

积分
217
发表于 2015-4-16 17:59:26 | 显示全部楼层
楼主,这个源码我都搭建成功了,能够正常访问,能够正常入库,但是你发现没有,那个搜索功能貌似是坏的,新入库的资源它是搜索不出来的。不知道你们是不是都是这样,还是我是个例?还是说索引要一段时间?
回复

使用道具 举报

371

主题

1537

回帖

4275

积分

论坛元老

积分
4275
发表于 2015-4-16 18:55:54 | 显示全部楼层
还有爬虫我是不是能理解成 只有入库了的东西用户才可以搜索到 反之就是搜索不到?

我的带宽是G口无限 要怎么设置 才能做到最大化采集 硬件 网络都没问题的情况下 线程应该要怎么去设置

回复

使用道具 举报

371

主题

1537

回帖

4275

积分

论坛元老

积分
4275
发表于 2015-4-16 19:03:51 | 显示全部楼层

烟雨江南 发表于 2015-4-16 18:55

楼主,这个源码我都搭建成功了,能够正常访问,能够正常入库,但是你发现没有,那个搜索功能貌似是坏的,新 ...

你是去看了数据库里面的文档 然后去搜索 他新建索引 好像需要一定的时间 而不是及时的

我是这样想的 只要搜索其他关键字可以搜索到 就是其他的东西 只要等索引更新了以后就可以搜索了
回复

使用道具 举报

17

主题

74

回帖

217

积分

中级会员

积分
217
发表于 2015-4-16 19:04:57 | 显示全部楼层

zlpd 发表于 2015-4-16 19:04

你是去看了数据库里面的文档 然后去搜索 他新建索引 好像需要一定的时间 而不是及时的

我是这样想的 只 ...

可能吧,也但愿是这样...
如果是坏的那就没什么好玩的了...
回复

使用道具 举报

17

主题

74

回帖

217

积分

中级会员

积分
217
发表于 2015-4-16 18:55:00 | 显示全部楼层

zlpd 发表于 2015-4-16 19:03

还有爬虫我是不是能理解成 只有入库了的东西用户才可以搜索到 反之就是搜索不到?

我的带宽是G口无限 要怎 ...

肯定是入库的资源才搜索的到,你到这个源码上面标的那个源站看看,明显源站那个的资源是最新的,我们搭建的这个数据大部分都还在14年。

我和楼主设置的线程一样,都是1000。用的一台2.6GHZ主频的CPU(VPS是KVM架构不知道什么型号)大概使用率在15-30左右。
回复

使用道具 举报

15

主题

34

回帖

121

积分

注册会员

积分
121
发表于 2015-4-16 19:11:52 | 显示全部楼层
学习学习
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2025-2-2 07:05 , Processed in 0.020834 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表