快速在单机上部署了 IAM 系统,但这样的系统缺少高可用、弹性扩容等能力,是很脆弱的,遇到流量波峰、发布变更很容易出问题。在系统真正上线前,我们需要重新调整部署架构,来保证我们的系统具有负载均衡、高可用、弹性伸缩等核心运维能力。
软件部署实战(上):部署方案及负载均衡、高可用组件介绍 (geekbang.org)
第一种是传统的部署方式,基于物理机 / 虚拟机来部署,容灾、弹性伸缩能力要部署人员自己实现。第二种是容器化部署方式,基于 Docker、Kubernetes 来部署,容灾、弹性伸缩等能力,可以借助 Kubernetes 自带的能力来实现
部署方案
先来整体看下我们的部署方案。这里,我采用 Nginx + Keepalived 来部署一个高可用的架构,同时将组件都部署在内网,来保证服务的安全和性能。部署需要两台物理机 / 虚拟机,组件之间通过内网访问。所需的服务器如下表所示
两台服务器均为腾讯云 CVM,VIP(Virtual IP,虚拟 IP)为10.0.4.99。部署架构如下图所示
这里我来具体介绍下图中的部署架构。部署采用的这两台 CVM 服务器,一主一备,它们共享同一个 VIP。同一时刻,VIP 只在一台主设备上生效,当主服务器出现故障时,备用服务器会自动接管 VIP,继续提供服务。
主服务器上部署了iam-apiserver、iam-authz-server、iam-pump和数据库mongodb、redis、mysql。备服务器部署了iam-apiserver、iam-authz-server和iam-pump。备服务器中的组件通过内网10.0.4.20访问主服务器中的数据库组件。
主备服务器同时安装了 Keepalived 和 Nginx,通过 Nginx 的反向代理功能和负载均衡功能,实现后端服务iam-apiserver和iam-authz-server的高可用,通过 Keepalived 实现 Nginx 的高可用。
我们通过给虚拟 IP 绑定腾讯云弹性公网 IP,从而使客户端可以通过外网 IP 访问内网的 Nginx 服务器(443端口),如果想通过域名访问内网,还可以申请域名指向该弹性公网 IP。
通过以上部署方案,我们可以实现一个具有较高可用性的 IAM 系统,它主要具备下面这几个能力。
高性能:可以通过 Nginx 的负载均衡功能,水平扩容 IAM 服务,从而实现高性能。
具备容灾能力:通过 Nginx 实现 IAM 服务的高可用,通过 Keepalived 实现 Nginx 的高可用,从而实现核心组件的高可用。
具备水平扩容能力:通过 Nginx 的负载均衡功能,实现 IAM 服务的水平扩容。
高安全性:将所有组件部署在内网,客户端只能通过VIP:443端口访问 Nginx 服务,并且通过开启 TLS 认证和 JWT 认证,保障服务有一个比较高的安全性。因为是腾讯云 CVM,所以也可以借助腾讯云的能力再次提高服务器的安全性,比如安全组、DDoS 防护、主机安全防护、云监控、云防火墙等。
这里说明下,为了简化 IAM 应用的安装配置过程,方便你上手实操,有些能力,例如数据库高可用、进程监控和告警、自动伸缩等能力的构建方式,这里没有涉及到。这些能力的构建方式,你可以在日后的工作中慢慢学习和掌握。
接下来,我们看下这个部署方案中用到的两个核心组件,Nginx 和 Keepalived。我会介绍下它们的安装和配置方法,为你下一讲的学习做准备
Nginx 安装和配置
Nginx 功能简介
这里先简单介绍下 Nginx。Nginx 是一个轻量级、高性能、开源的 HTTP 服务器和反向代理服务器。IAM 系统使用了 Nginx 反向代理和负载均衡的功能,下面我就来分别介绍下。为什么需要反向代理呢?在实际的生产环境中,服务部署的网络(内网)跟外部网络(外网)通常是不通的,这就需要一台既能够访问内网又能够访问外网的服务器来做中转,这种服务器就是反向代理服务器。Nginx 作为反向代理服务器,简单的配置如下
server { listen 80; server_name iam.marmotedu.com; client_max_body_size 1024M; location / {proxy_set_header Host $http_host; proxy_set_header X-Forwarded-Host $http_host;proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;proxy_pass :8080/; client_max_body_size 100m;}}Nginx 的反向代理功能,能够根据不同的配置规则转发到不同的后端服务器上。假如我们在 IP 为x.x.x.x的服务器上,用上面说的 Nginx 配置启动 Nginx,当我们访问:80/时,会将请求转发到:8080/。listen 80指定了 Nginx 服务器的监听端口,proxy_pass :8080/则指定了转发路径。Nginx 另一个常用的功能是七层负载均衡。所谓的负载均衡,就是指当 Nginx 收到一个 HTTP 请求后,会根据负载策略将请求转发到不同的后端服务器上。比如 iam-apiserver 部署在两台服务器 A 和 B 上,当请求到达 Nginx 后,Nginx 会根据 A 和 B 服务器上的负载情况,将请求转发到负载较小的那台服务器上。
这里要求 iam-apiserver 是无状态的服务。Nginx 有多种负载均衡策略,可以满足不同场景下的负载均衡需求。
Nginx 安装步骤接下来,我就来介绍下如何安装和配置 Nginx。
我们分别在10.0.4.20和10.0.4.21服务器上执行如下步骤,安装 Nginx。
在 CentOS 8.x 系统上,我们可以使用 yum 命令来安装,具体安装过程可以分为下面 4 个步骤。
第一步,安装 Nginx
sudo yum -y install nginx第二步,确认 Nginx 安装成功:
$ nginx -vnginx version: nginx/1.14.1第三步,启动 Nginx,并设置开机启动
$ sudo systemctl start nginx$ sudo systemctl enable nginxNginx 默认监听80端口,启动 Nginx 前要确保80端口没有被占用。当然,你也可以通过修改 Nginx 配置文件/etc/nginx/nginx.conf修改 Nginx 监听端口。
第四步,查看 Nginx 启动状态
$ systemctl status nginx输出中有active (running)字符串,说明成功启动。如果 Nginx 启动失败,你可以查看/var/log/nginx/error.log日志文件,定位错误原因。
Keepalived 安装和配置
Nginx 自带负载均衡功能,并且当 Nginx 后端某个服务器故障后,Nginx 会自动剔除该服务器,将请求转发到可用的服务器,通过这种方式实现后端 API 服务的高可用。但是 Nginx 是单点的,如果 Nginx 挂了,后端的所有服务器就都不能访问,所以在实际生产环境中,也需要对 Nginx 做高可用。
业界最普遍采用的方法是通过 Keepalived 对前端 Nginx 实现高可用。Keepalived + Nginx 的高可用方案具有服务功能强大、维护简单等特点。
接下来,我们来看下如何安装和配置
Keepalived。Keepalived 安装步骤
我们分别在10.0.4.20和10.0.4.21服务器上执行下面 5 个步骤,安装 Keepalived。第一步,下载 Keepalived 的最新版本(这门课安装了当前的最新版本 2.1.5)
$ wget https://www.keepalived.org/software/keepalived-2.1.5.tar.gz第二步,安装 Keepalived
$ sudo yum -y install openssl-devel # keepalived依赖OpenSSL,先安装依赖$ tar -xvzf keepalived-2.1.5.tar.gz$ cd keepalived-2.1.5$./configure --prefix=/usr/local/keepalived$ make$ sudo make install第三步,配置 Keepalived
$ sudo mkdir /etc/keepalived # 安装后,默认没有创建/etc/keepalived目录$ sudo cp /usr/local/keepalived/etc/keepalived/keepalived.conf/etc/keepalived/keepalived.conf$ sudo cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/keepalivedKeepalived 的systemd uint 配置,默认使用了/usr/local/keepalived/etc/sysconfig/keepalived作为其EnvironmentFile,我们还需要把它修改为/etc/sysconfig/keepalived文件。编辑/lib/systemd/system/keepalived.service文件,设置EnvironmentFile,值如下:
EnvironmentFile=-/etc/sysconfig/keepalived第四步,启动 Keepalived,并设置开机启动:
$ sudo systemctl start keepalived$ sudo systemctl enable keepalived这里要注意,Keepalived 启动时不会校验配置文件是否正确,所以我们要小心修改配置,防止出现意想不到的问题
第五步,查看 Keepalived 的启动状态:
systemctl status keepalived输出中有active (running)字符串,说明成功启动。Keepalived 的日志保存在/var/log/messages中,你有需要的话可以查看
Keepalived 配置文件解析
Keepalived 的默认配置文件为/etc/keepalived/keepalived.conf,下面是一个 Keepalived 配置
# 全局定义,定义全局的配置选项global_defs {# 指定keepalived在发生切换操作时发送email,发送给哪些email# 建议在keepalived_notify.sh中发送邮件notification_email {acassen@firewall.loc}notification_email_from Alexandre.Cassen@firewall.loc # 发送email时邮件源地址smtp_server 192.168.200.1 # 发送email时smtp服务器地址smtp_connect_timeout 30 # 连接smtp的超时时间router_id VM-4-21-centos # 机器标识,通常可以设置为hostnamevrrp_skip_check_adv_addr # 如果接收到的报文和上一个报文来自同一个路由器,则不执行检查。默认是跳过检查vrrp_garp_interval 0 # 单位秒,在一个网卡上每组gratuitous arp消息之间的延迟时间,默认为0vrrp_gna_interval 0 # 单位秒,在一个网卡上每组na消息之间的延迟时间,默认为0}# 检测脚本配置vrrp_script checkhaproxy{script "/etc/keepalived/check_nginx.sh" # 检测脚本路径interval 5 # 检测时间间隔(秒)weight 0 # 根据该权重改变priority,当值为0时,不改变实例的优先级}# VRRP实例配置vrrp_instance VI_1 {state BACKUP# 设置初始状态为备份interface eth0 # 设置绑定VIP的网卡,例如eth0virtual_router_id 51# 配置集群VRID,互为主备的VRID需要是相同的值nopreempt # 设置非抢占模式,只能设置在state为backup的节点上priority 50 # 设置优先级,值范围0~254,值越大优先级越高,最高的为masteradvert_int 1 # 组播信息发送时间间隔,两个节点必须设置一样,默认为1秒# 验证信息,两个节点必须一致authentication {auth_type PASS # 认证方式,可以是PASS或AH两种认证方式auth_pass 1111 # 认证密码}unicast_src_ip 10.0.4.21# 设置本机内网IP地址unicast_peer {10.0.4.20 # 对端设备的IP地址}# VIP,当state为master时添加,当state为backup时删除virtual_ipaddress {10.0.4.99 # 设置高可用虚拟VIP,如果是腾讯云的CVM,需要填写控制台申请到的HAVIP地址。}notify_master "/etc/keepalived/keepalived_notify.sh MASTER" # 当切换到master状态时执行脚本notify_backup "/etc/keepalived/keepalived_notify.sh BACKUP" # 当切换到backup状态时执行脚本notify_fault "/etc/keepalived/keepalived_notify.sh FAULT" # 当切换到fault状态时执行脚本notify_stop "/etc/keepalived/keepalived_notify.sh STOP" # 当切换到stop状态时执行脚本garp_master_delay 1# 设置当切为主状态后多久更新ARP缓存garp_master_refresh 5 # 设置主节点发送ARP报文的时间间隔# 跟踪接口,里面任意一块网卡出现问题,都会进入故障(FAULT)状态track_interface {eth0}# 要执行的检查脚本track_script {checkhaproxy}}这里解析下配置文件,大致分为下面 4 个部分。
global_defs:全局定义,定义全局的配置选项。
vrrp_script checkhaproxy:检测脚本配置。
vrrp_instance VI_1:VRRP 实例配置
virtual_server:LVS 配置。如果没有配置 LVS+Keepalived,就不用设置这个选项。这门课中,我们使用 Nginx 代替 LVS,所以无需配置virtual_server(配置示例中不再展示)。
只有在网络故障或者自身出问题时,Keepalived 才会进行 VIP 切换。但实际生产环境中,我们往往使用 Keepalived 来监控其他进程,当业务进程出故障时切换 VIP,从而保障业务进程的高可用
为了让 Keepalived 感知到 Nginx 的运行状况,我们需要指定vrrp_script脚本,vrrp_script脚本可以根据退出码,判断 Nginx 进程是否正常,0正常,非0不正常。当不正常时,Keepalived 会进行 VIP 切换。为了实现业务进程的监控,我们需要设置vrrp_script和track_script
vrrp_script checkhaproxy{script "/etc/keepalived/check_nginx.sh"interval 3weight -20}vrrp_instance test{...track_script{checkhaproxy}...}配置中的一些配置项。script:指定脚本路径。interval:表示 Keepalived 执行脚本的时间间隔(秒)。weight:检测权重,可以改变priority的值。例如,-20表示检测失败时,优先级-20,成功时不变。20表示检测成功时,优先级+20,失败时不变。
我们可以基于物理机 / 虚拟机来部署 IAM 应用,在部署 IAM 应用时,需要确保整个应用具备高可用和弹性扩缩容能力。你可以通过 Nginx 的反向代理功能和负载均衡功能实现后端服务 iam-apiserver 和 iam-authz-server 的高可用,通过 Keepalived 实现 Nginx 的高可用,通过 Nginx + Keepalived 组合,来实现 IAM 应用的高可用和弹性伸缩能力