wenguonideshou 发表于 2015-4-16 17:53:59

搜片大师(Python版磁力链源码) 安装部署教程

本帖最后由 wenguonideshou 于 2015-8-16 15:26 编辑

有朋友PM我怎么安装,我就在此说下我的设置,仅供参考。
源码地址http://www.hostloc.com/thread-273194-1-1.html



推荐使用win2008,因为这套源码是基于Mysql+Python的,众所周知在win2008上面他们的性能比在win03上面好太多
我的系统是win2008 R2 64位,2G内存

1.安装.net3.5.1:服务器管理器-功能-添加功能-安装
安装mysql    http://dev.mysql.com/downloads/file.php?id=456518
安装pythonhttps://www.python.org/ftp/python/2.7.9/python-2.7.9.amd64.msi
安装MySQL-python-1.2.3.win-amd64-py2.7http://www.codegood.com/archives/129

2.创建数据库 名为bt

3.解压源码,其中
weclar文件夹是采集工具+网站目录,网站目录在/web/template目录下,修改源码后需要点“关闭网站”再点“打开网站”才能生效
magent.rar是数据库,将magnet.rar解压到bt数据库所在目录

4.打开soupian.exe 设置:

爬虫-监听地址                填写服务器IP,端口不用修改,线程一般设置为500




填写正确的的数据库信息,连接池一般设置为10




设置索引





网站-监听地址               填写服务器IP,端口80





5.解析域名到服务器的IP

6.主选项-开启爬虫-开启网站
爬虫是否启动:
dumeter可以看到上传下载流量的话,就说明爬虫正在工作,占用带宽 几十k/s
是否入库:
mysql命令行界面 输入命令
use information_schema;
select table_name,table_rows from tables where TABLE_SCHEMA = 'bt' order by table_rows desc;
查看film这一行的数字是否增加(数字代表数据库里的电影数量)



或者用phpmyadmin进bt数据库的film表也能看到
或者打开首页查看源代码,也能看到电影总数

注意:如果你使用80端口,服务器不能安装有IIS或者apache等WEB服务器




有坛友发布的视频版安装教程:http://www.hostloc.com/thread-274391-1-1.html
http://v.youku.com/v_show/id_XOTQwMzg3NzUy.html




补充,在win2003下:

安装.net3.5
安装.net4.0
安装mysql                  http://dev.mysql.com/downloads/file.php?id=456518
安装python 32位                  https://www.python.org/ftp/python/2.7.9/python-2.7.9.msi
安装MySQL-python-1.2.3.win32-py2.7.exe               http://www.codegood.com/archives/129
剩下的流程 按照win08的流程做

wenguonideshou 发表于 2015-4-17 17:35:23

本帖最后由 wenguonideshou 于 2015-8-4 11:15 编辑

索引的问题 已经解决 :
http://www.hostloc.com/thread-273787-1-1.html

wenguonideshou 发表于 2015-4-19 22:03:14


a7898585 发表于 2015-4-19 21:17

必须这样?有没有兼容的方法?
另外问下,他的谷歌广告和cnzz怎么处理?哪个文件都没找到 ...

web/template目录下是网页源码 ,去除他的广告 需要删除代码
"

carsonhui 发表于 2015-4-19 21:17:00

怎么绑定域名

烟雨江南 发表于 2015-4-16 17:59:26

楼主,这个源码我都搭建成功了,能够正常访问,能够正常入库,但是你发现没有,那个搜索功能貌似是坏的,新入库的资源它是搜索不出来的。不知道你们是不是都是这样,还是我是个例?还是说索引要一段时间?

zlpd 发表于 2015-4-16 18:55:54

还有爬虫我是不是能理解成 只有入库了的东西用户才可以搜索到 反之就是搜索不到?

我的带宽是G口无限 要怎么设置 才能做到最大化采集 硬件 网络都没问题的情况下 线程应该要怎么去设置

zlpd 发表于 2015-4-16 19:03:51


烟雨江南 发表于 2015-4-16 18:55

楼主,这个源码我都搭建成功了,能够正常访问,能够正常入库,但是你发现没有,那个搜索功能貌似是坏的,新 ...
你是去看了数据库里面的文档 然后去搜索 他新建索引 好像需要一定的时间 而不是及时的

我是这样想的 只要搜索其他关键字可以搜索到 就是其他的东西 只要等索引更新了以后就可以搜索了

烟雨江南 发表于 2015-4-16 19:04:57


zlpd 发表于 2015-4-16 19:04

你是去看了数据库里面的文档 然后去搜索 他新建索引 好像需要一定的时间 而不是及时的

我是这样想的 只 ...
可能吧,也但愿是这样...
如果是坏的那就没什么好玩的了...

烟雨江南 发表于 2015-4-16 18:55:00


zlpd 发表于 2015-4-16 19:03

还有爬虫我是不是能理解成 只有入库了的东西用户才可以搜索到 反之就是搜索不到?

我的带宽是G口无限 要怎 ...
肯定是入库的资源才搜索的到,你到这个源码上面标的那个源站看看,明显源站那个的资源是最新的,我们搭建的这个数据大部分都还在14年。

我和楼主设置的线程一样,都是1000。用的一台2.6GHZ主频的CPU(VPS是KVM架构不知道什么型号)大概使用率在15-30左右。

paituo 发表于 2015-4-16 19:11:52

学习学习
页: [1] 2 3 4
查看完整版本: 搜片大师(Python版磁力链源码) 安装部署教程