1. 首页
  2. 技术知识

Linux部署python爬虫脚本,并设置定时任务的方法

去年因项目需要,用python写了个爬虫。因爬到的数据需要存到生产环境的PG数据库。所以需要将脚本部署到CentOS服务器,并设置定时任务,自动启动脚本。


实施步骤如下:


1.安装pip(操作系统自带了python2.6可以直接用,但是没有pip)

# 下载pip安装包

wget “https://pypi.python.org/packages/source/p/pip/pip-1.5.4.tar.gz#md5=834b2904f92d46aaa333267fb1c922bb” –no-check-certificate

# 解压安装包并安装

tar -xzvf pip-1.5.4.tar.gz

cd pip-1.5.4

python setup.py install
2.用pip安装第三方库

pip install PyGreSQL==5.0.3

pip install requests==2.18.3
3.设置定时任务

# 开启定时任务服务

service crond start

# 查看定时任务服务状态

service crond status

# 打开定时任务编辑窗口

crontab -e

# 添加两条定时任务,即每天0点0分和12点20分各执行一次,并写入日志

0 0 * * * /usr/bin/python /home/longrise/psrd/collect.py > /home/longrise/psrd/collect.log 2>&1 &

20 12 * * * /usr/bin/python /home/longrise/psrd/collect.py > /home/longrise/psrd/collect.log 2>&1 &

定时任务语法如下:

# For details see man 4 crontabs

# Example of job definition:

# .—————- minute (0 – 59)

# | .————- hour (0 – 23)

# | | .———- day of month (1 – 31)

# | | | .——- month (1 – 12) OR jan,feb,mar,apr …

# | | | | .—- day of week (0 – 6) (Sunday=0 or 7) OR sun,mon,tue,wed,thu,fri,sat

# | | | | |

# * * * * * user-name command to be executed以上这篇Linux部署python爬虫脚本,并设置定时任务的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持软件技术网。

原创文章,作者:starterknow,如若转载,请注明出处:https://www.starterknow.com/109329.html

联系我们