深入浅出反向代理Web服务器Nginx

除了Apache,Nginx也是一款很常用的轻量级的Web服务器、反向代理服务器,由于它的内存占用少,启动极快,高并发能力强,在互联网项目中广泛应用。

Nginx 是一个高性能的 HTTP 和反向代理 Web 服务器,由俄罗斯的伊戈尔·赛索耶夫开发,第一个版本发布于 2004 年 10 月 4 日。

YYDS

Nginx 的特点是:

内存占用少并发能力强(可支持大约 50000 个并发连接)配置超简洁bug 非常少安装超简单服务特别稳(几个月也不需要重启)

基于这些特点,越来越多的网站开始使用 Nginx。于是,掌握 Nginx 就变成了开发者的一项必不可少的技能。

架构图

上图基本上说明了当下流行的技术架构,其中Nginx有点入口网关的味道。

反向代理服务器?

经常听人说到一些术语,如反向代理,那么什么是反向代理,什么又是正向代理呢?

正向代理:

正向代理示意图

反向代理:

反向代理示意图

由于防火墙的原因,我们并不能直接访问谷歌,那么我们可以借助VPN来实现,这就是一个简单的正向代理的例子。这里你能够发现,正向代理“代理”的是客户端,而且客户端是知道目标的,而目标是不知道客户端是通过VPN访问的。

当我们在外网访问百度的时候,其实会进行一个转发,代理到内网去,这就是所谓的反向代理,即反向代理“代理”的是服务器端,而且这一个过程对于客户端而言是透明的。

Nginx的Master-Worker模式

nginx进程

启动Nginx后,其实就是在80端口启动了Socket服务进行监听,如图所示,Nginx涉及Master进程和Worker进程。

Master-Worker模式

nginx.conf

Master进程的作用是?

读取并验证配置文件nginx.conf;管理worker进程;

Worker进程的作用是?

每一个Worker进程都维护一个线程(避免线程切换),处理连接和请求;注意Worker进程的个数由配置文件决定,一般和CPU个数相关(有利于进程切换),配置几个就有几个Worker进程。

思考:Nginx如何做到热部署?

所谓热部署,就是配置文件nginx.conf修改后,不需要stop Nginx,不需要中断请求,就能让配置文件生效!(nginx -s reload 重新加载/nginx -t检查配置/nginx -s stop)

通过上文我们已经知道worker进程负责处理具体的请求,那么如果想达到热部署的效果,可以想象:

方案一:

修改配置文件nginx.conf后,主进程master负责推送给woker进程更新配置信息,woker进程收到信息后,更新进程内部的线程信息。(有点valatile的味道)

方案二:

修改配置文件nginx.conf后,重新生成新的worker进程,当然会以新的配置进行处理请求,而且新的请求必须都交给新的worker进程,至于老的worker进程,等把那些以前的请求处理完毕后,kill掉即可。

Nginx采用的就是方案二来达到热部署的!

思考:Nginx如何做到高并发下的高效处理?

上文已经提及Nginx的worker进程个数与CPU绑定、worker进程内部包含一个线程高效回环处理请求,这的确有助于效率,但这是不够的。

作为专业的程序员,我们可以开一下脑洞:BIO/NIO/AIO、异步/同步、阻塞/非阻塞...

要同时处理那么多的请求,要知道,有的请求需要发生IO,可能需要很长时间,如果等着它,就会拖慢worker的处理速度。

Nginx采用了Linux的epoll模型,epoll模型基于事件驱动机制,它可以监控多个事件是否准备完毕,如果OK,那么放入epoll队列中,这个过程是异步的。worker只需要从epoll队列循环处理即可。

思考:Nginx挂了怎么办?

Nginx既然作为入口网关,很重要,如果出现单点问题,显然是不可接受的。

答案是:Keepalived+Nginx实现高可用。

Keepalived是一个高可用解决方案,主要是用来防止服务器单点发生故障,可以通过和Nginx配合来实现Web服务的高可用。(其实,Keepalived不仅仅可以和Nginx配合,还可以和很多其他服务配合)

Keepalived+Nginx实现高可用的思路:

第一:请求不要直接打到Nginx上,应该先通过Keepalived(这就是所谓虚拟IP,VIP)

第二:Keepalived应该能监控Nginx的生命状态(提供一个用户自定义的脚本,定期检查Nginx进程状态,进行权重变化,,从而实现Nginx故障切换)

Keepalived+Nginx

我们的主战场:nginx.conf

很多时候,在开发、测试环境下,我们都得自己去配置Nginx,就是去配置nginx.conf。

nginx.conf是典型的分段配置文件,下面我们来分析下。

虚拟主机

http的server段

访问结果

其实这是把Nginx作为web server来处理静态资源。

第一:location可以进行正则匹配,应该注意正则的几种形式以及优先级。(这里不展开)

第二:Nginx能够提高速度的其中一个特性就是:动静分离,就是把静态资源放到Nginx上,由Nginx管理,动态请求转发给后端。

第三:我们可以在Nginx下把静态资源、日志文件归属到不同域名下(也即是目录),这样方便管理维护。

第四:Nginx可以进行IP访问控制,有些电商平台,就可以在Nginx这一层,做一下处理,内置一个黑名单模块,那么就不必等请求通过Nginx达到后端在进行拦截,而是直接在Nginx这一层就处理掉。

反向代理【proxy_pass】

所谓反向代理,很简单,其实就是在location这一段配置中的root替换成proxy_pass即可。root说明是静态资源,可以由Nginx进行返回;而proxy_pass说明是动态请求,需要进行转发,比如代理到Tomcat上。

反向代理,上面已经说了,过程是透明的,比如说request -> Nginx -> Tomcat,那么对于Tomcat而言,请求的IP地址就是Nginx的地址,而非真实的request地址,这一点需要注意。不过好在Nginx不仅仅可以反向代理请求,还可以由用户自定义设置HTTP HEADER。

负载均衡【upstream】

上面的反向代理中,我们通过proxy_pass来指定Tomcat的地址,很显然我们只能指定一台Tomcat地址,那么我们如果想指定多台来达到负载均衡呢?

第一,通过upstream来定义一组Tomcat,并指定负载策略(IPHASH、加权论调、最少连接),健康检查策略(Nginx可以监控这一组Tomcat的状态)等。

第二,将proxy_pass替换成upstream指定的值即可。

负载均衡可能带来的问题?

负载均衡所带来的明显的问题是,一个请求,可以到A server,也可以到B server,这完全不受我们的控制,当然这也不是什么问题,只是我们得注意的是:用户状态的保存问题,如Session会话信息,不能在保存到服务器上。

缓存

缓存,是Nginx提供的,可以加快访问速度的机制,说白了,在配置上就是一个开启,同时指定目录,让缓存可以存储到磁盘上。具体配置,大家可以参考Nginx官方文档

一、Nginx 的作用

反向代理是 Nginx 作为 Web 服务器最常用的功能之一。什么是反向代理呢?很多初学者在第一次遇到这个名词的时候总免不了出现很多问号。

那要想搞明白什么是反向代理,就必须得搞明白什么是正向代理。

举个例子,小二的浏览器是无法直接访问谷哥的,但香港的代理服务器是可以访问谷哥的,于是小二访问了香港的代理服务器,也就间接地访问了谷哥。那这台代理服务器也就是正向代理。

总结一句就是,正向代理是代理客户端的,让你能正常访问目的服务器。

与之相反,反向代理是代理服务器的,让大量的请求均衡地访问到某一台服务器上。

举个例子,10 万个小二同时在访问 itwanger.com, 如果只有一台服务器的话,很容易就瘫痪了,于是高并发的情况下会有很多台服务器(假如 10 台吧)来接这个活,那怎么让 10 万个小二访问到这 10 台服务器呢?

这就需要一个反向代理服务器了,反向代理服务器让 1 万个小二访问服务器 A,1 万个小二访问服务器 B,1 个小二访问服务器 C,这样的话,每台服务器的压力就相应减小了,是不是很 nice?

那问题来了。每台服务器的能力可能不同,比如说服务器 A 的内存比较大一点,有 100 个 G;服务器 B 的内存小一点,有 10 个 G;服务器 C 的内存更小一点,只有 1 个 G。怎么才能让没台服务器承担起它能力范围内的访问呢?

Nginx 内置了轮询和加权轮询来达到负载均衡的目的。服务器 A 牛逼就把它的权重加大一点,让 5 万个小二访问它;服务器 B 弱一点,权重就再小一点,让 2 万个小二访问它;服务器 C 更弱,权重就最小,让 1 万个小二访问它。

除此之外,Nginx 还有一个很牛逼的功能是动静分离。

在我们的软件开发中,有些请求是需要后台处理的;有些请求是不需要后台处理的,比如说 css、js 这些文件请求,这些不需要经过后台处理的文件就叫静态文件。

我们可以根据一些规则,把动态资源和静态资源分开,然后通过 Nginx 把请求分开,静态资源的请求就不需要经过 Web 服务器处理了,从而提高整体上的资源的响应速度。

二、Nginx 的安装

针对不同的操作系统,Nginx 的安装各不相同。Windows 可以直接到官网下载 zip 绿色安装包,解压后就可以了。

有 Linux 服务器的话,直接通过宝塔面板这个神器就可以安装了。

不过,如果在安装宝塔面板必备工具包的时候,如果选择了 phpmyadmin(MySQL 的管理工具),会覆盖掉 80 端口,就导致没办法直接通过默认配置的方式访问 Nginx 启动页面了。

我这里以 macOS 环境为例,来演示一下。

第一步,通过 brew info nginx 命令查看 Nginx 是否安装。

第二步,通过 brew install nginx 命令安装 Nginx。

从以上信息可以得出:

根目录是 /usr/local/var/www配置文件是 /usr/local/etc/nginx/nginx.conf默认端口是 8080

第三步,通过 nginx 命令启动 Nginx。

第四步,在浏览器地址栏通过 localhost:8080 访问,可以看到以下欢迎页面。

三、Nginx 常用命令

通常来说,Nginx 一旦启动后,我们是很少让它退出的,使用最多的就是 reload 命令。当我们修改了配置文件,是需要执行一次 reload 命令让 Nginx 生效的。

nginx  启动nginx -s stop  停止nginx -s quit  安全退出nginx -s reload  重新加载配置文件ps aux|grep nginx  查看nginx进程

要知道,Nginx 的 reload 对用户是无感的,这一点我觉得很牛逼~

四、Nginx 的配置

我们先来看一下 Nginx 的配置结构图:

main        # 全局配置├── events  # 配置网络连接├── http    # 配置代理、缓存、日志等│   ├── upstream # 配置负载均衡│   ├── server   # 配置虚拟主机,可以有多个 server│   ├── server│   │   ├── location  # 用于匹配 URI(URL 是 URI 的一种),可以有多个 location│   │   ├── location│   │   └── ...│   └── ...└── ...

再把 Nginx 的默认配置拉出来看一下,我把注释加了进去,这样大家很容易就明白这行配置是用来干嘛的了。

worker_processes  1; # Nginx 进程数,一般设置为和 CPU 核数一样events {    worker_connections  1024; # 每个进程允许最大并发数}http {    include       mime.types; # 文件扩展名与类型映射表    default_type  application/octet-stream;    sendfile        on; # 开启高效传输模式    keepalive_timeout  65; # 保持连接的时间,也叫超时时间,单位秒    server {        listen       8080; # 配置监听的端口        server_name  localhost; # 配置的域名        location / {            root   html; # 网站根目录            index  index.html index.htm; # 默认首页文件        }        error_page   500 502 503 504  /50x.html; # 默认50x对应的访问页面        location = /50x.html {            root   html;        }    }    include servers/*; # 加载子配置项}

好,现在我们登录宝塔面板,尝试把默认的 server 配置复制到 Linux 服务器中的 Nginx 配置里。

简单解释一下。

由于我的服务器上 80 端口是默认打开的,所以我将监听端口配置成了 80,如果你配置成其他端口的话,记得宝塔面板和云服务的安全组里把端口打开。

root 我指定了 /home/www 目录,首页文件为 index.html。这个文件是我自定义的,来看一下内容。

<!DOCTYPE html><html><meta http-equiv="Content-Type" content="text/html; charset=utf-8"><title>沉默王二</title>  <body>    <img src="niubi.jpeg" />  </body></html>

很言简意赅,总之就是二哥,牛逼~

好,保存配置文件,并且 reload Nginx,我们在本地的浏览器中输入服务器的 IP 地址就可以看到效果了。

五、Nginx 的学习资料

关于 Nginx 的负载均衡,还有动静分离,等到二哥的网站跑起来后,可以专门搞个视频给大家演示下,比较直观一点。Nginx 的入门非常简单,但有一说一,如果想要在工作中用好 Nginx,还是需要花费一番功夫的。

我这里再给大家推荐一些不错的学习资料吧。

1)狂神说的视频入门教程,我个人觉得,狂神的入门教程还是非常舒适的,语速和内容都刚刚好。

https://www.bilibili.com/video/BV1F5411J7vK

2)黑马程序员Nginx教程,总共 159 讲,基本上算是非常全面的 Nginx 的视频教程了。

https://www.bilibili.com/video/BV1ov41187bq

3)极客时间上的 Nginx100 讲,讲的比较深一点,涉及到不少原理层面的东西。钱包比较鼓的话,可以去付费下。不过,听说在某个地方也可以白票。

4)Nginx 从入门到实践,万字详解,图文版的,可以到掘金上看看这篇文章,内容基本上面面俱到了(可以看一下下面的目录),配合前面的视频课,拿下 Nginx 基本上是稳了。