基于第三方项目:https://github.com/hanc00l/wooyun_public
一、 准备工作
1、 python环境:
- 多版本共存pyenv
- 虚拟环境virtualenv
2、 安装命令:
|
|
二、 具体操作步骤
1、 进入虚拟环境
|
|
2、 安装Flask
注:(一个基于python的web开发微框架)
3、 安装 Scrapy
注:(一个基于python的爬虫框架)
备注:需要Twisted>=10.0.0
4、 安装pymongo
|
|
5、 启动web
进入项目的flask目录下:python app.py
6、 开始爬虫
|
|
备注:提示缺少PIL—http://www.pythonware.com/products/pil/
解决:
7、 mongodb+elasticsearch
PS: mongodb使用elasticsearch必须要是集群下
编辑/home/ts/db/mongodb/mongodb.conf ,增加:
12replSet=rs0 #这里是指定replSet的名字oplogSize=100 #这里是指定oplog表数据大小(太大了不支持)重启动mongodb
1service mongodb restart进入mongodb shell,初始化replicSet
1rs.initiate( {"_id" : "rs0", "version" : 1, "members" : [ { "_id" : 0, "host" : "127.0.0.1:27017" } ]})
备注:rs.initiate初始化字段详情见:https://docs.mongodb.com/manual/reference/replica-configuration/#replsetgetconfig-output
三、 还可能遇到的问题
1、 virtualenv的环境无法import sqlite3
报错信息如下:
谷歌了一下,原因是安装了多套python环境,virtualenv使用的那套python没有_sqlite3.so这个文件。
没用virtualenv的时候,使用的是另外一套python的_sqlite3.so,
所以解决方法是先安装sqlite-devel,
然后重新编译virtualenv使用的那套python,
操作步骤如下,因为我使用的pyenv,所以是连带virtualenv一起安装的。
删掉原有的python环境、重新安装python环境