如何配置服务器以运行爬虫并存储数据到MySQL:详细步骤指南

操作系统:CentOS 6.6 64位
CPU:1核
内存:1GB
系统盘:20G(云硬盘)
公网带宽:1Mbps

原本打算给系统安装桌面环境,可没想到速度慢得让人难以忍受,最终还是决定回归到字符界面。下面我会详细向大家介绍我是如何配置FTP服务,以及如何将文件上传到服务器的具体步骤。

合适配置确定

我找到了一个挺合适的配置,用它来运行我的爬虫程序,存入MySQL的数据量足够使用。与之前打算添加桌面环境导致系统卡顿相比,现在这个仅字符界面的配置要稳定多了。之前尝试桌面环境,结果体验不佳,看来稳定性和性能比花哨的界面更为关键。

FTP服务基本设置

配置FTP服务,需设置账户登录上传文件。先将“=YES确认”设置为YES,使本地账户能登录ftp用户。接着,注释掉其他敏感账号,加入自己的登录账号。使用vi编辑器打开/etc/目录下的配置文件,加入一行*=NO,确保只有自己添加的账号有效。完成这三步后,其他设置暂不修改。

认证账户添加

确定好允许谁登录,并且FTP服务已经配置完毕后,接下来需要创建认证账号。使用“-m”参数创建一个目录,“-d”参数用于在/home目录下创建一个名为ftp的目录(目录名可自定义)。该账户不具备系统登录权限,也无法通过su、sudo等命令获取最高权限,这显著增强了安全性。随后,为该账户设置密码,步骤与普通用户设置密码类似,操作简便。

PAM模块设置

#%PAM-1.0 
#原先的第一行,看下面解释
#auth required /lib64/security/pam_listfile.so item=user sense=deny file=/etc/ftpusers onerr=succeed
auth required /lib64/security/pam_listfile.so item=user sense=deny file=/etc/vsftpd/ftpusers onerr=succeed
auth required /lib64/security/pam_unix.so shadow nullok 
auth required /lib64/security/pam_shells.so 
account required /lib64/security/pam_unix.so 
session required /lib64/security/pam_unix.so

依据腾讯的官方指导文件,需调整pam模块的配置,以对通过ftp登录的用户进行筛选。尽管我曾尝试过,不论是否修改设置,都能顺利登录ftp,但考虑到安全性,我还是按照文档的指示进行了操作。操作完成后,显示的目录为/etc//,因此需要将相关文件路径进行相应的更改。

登陆问题排查

配置完成后尝试在终端远程登录,却遇到了超时错误。在网页上输入ftp://公网IP地址也无法访问。然而,在本地通过ftp 127.0.0.1可以成功验证用户名和密码登录,这表明ftp服务本身运作正常。经过排查,发现问题出在防火墙上。我们使用的腾讯云服务器默认设置了内外网访问权限控制,导致ftp请求被拦截。

如何配置服务器以运行爬虫并存储数据到MySQL:详细步骤指南插图

成功上传文件

如何配置服务器以运行爬虫并存储数据到MySQL:详细步骤指南插图1

处理完防火墙相关事宜,接着将Linux系统的安全组设置调整为允许22端口,这样云主机就能接入。之后,用ftp操作,系统能提示输入用户名和密码,登录也就顺利了。上传文件时,建议先打包,然后通过ftp指令,将文件发送至服务器上的/home/ftp/文件夹,文件名可以自定义。

如何配置服务器以运行爬虫并存储数据到MySQL:详细步骤指南插图2

在设置FTP服务时,大家是否遇到过相似的问题?若觉得本文对您有所帮助,不妨点个赞并转发一下!

THE END