Nginx高级篇
Nginx高级篇
John DoeNginx高级篇
1. 扩容
扩容方式
单机垂直扩容:硬件资源增加
水平扩展:集群化
细粒度拆分:分布式
- 数据分区
- 上游服务SOA化(原生支持水平/垂直扩容)
- 入口细分
- 浏览器
- 移动端原生App(物联网)
- H5内嵌式应用
数据异构化
多级缓存
- 客户端缓存
- CDN缓存
- 异地多活
- Nginx缓存
服务异步化
- 拆分请求
- 消息中间件
扩容原则
- 无状态原则
- 弹性原则
1. 单机垂直扩容:硬件资源增加
- 云服务资源增加
- 整机:IBM、浪潮、DELL、HP等
- CPU/主板:更新到主流
- 网卡:10G/40G网卡
- 磁盘:SAS(SCSI) HDD(机械)、HHD(混合)、SATA SSD、PCI-e SSD、MVMe SSD
- SSD
- 多副本机制
- 系统盘/热点数据/数据库存储
- HDD
- 冷数据存储
- SSD
2. 水平扩展:集群化
1. 会话管理
Nginx高级负载均衡
ip_hash1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19upstream httpds {
ip_hash;
server 192.168.44.102;
server 192.168.44.103;
}
server {
listen 80;
server_name localhost;
location / {
proxy_pass http://httpds;
# root html;
}
location ~*/(css|img|js) {
root /usr/local/nginx/html;
}
}其他Hash
hash $cookie_jsessionid;hash $request_uri;
使用lua逻辑定向分发
Redis + SpringSession
使用sticky模块完成对Nginx的负载均衡
使用参考
http://nginx.org/en/docs/http/ngx_http_upstream_module.html#sticky
tengine中有session_sticky模块我们通过第三方的方式安装在开源版本中
sticky是第三方模块,需要重新编译Nginx,他可以对Nginx这种静态文件服务器使用基于cookie的负载均衡
下载模块
https://bitbucket.org/nginx-goodies/nginx-sticky-module-ng/get/1.2.6.tar.gz
上传解压
重新编译Nginx
1
yum install -y openssl-devel
进到源码目录重新编译
1
./configure --prefix=/usr/local/nginx --add-module=/root/nginx-goodies-nginx-sticky-module-ng-c78b7dd79d0d
执行make
如遇报错修改源码
打开 ngx_http_sticky_misc.c文件
在12行添加
1 |
备份之前的程序
1 | mv /usr/local/nginx/sbin/nginx /usr/local/nginx/sbin/nginx.old |
把编译好的Nginx程序替换到原来的目录里
1 | cp objs/nginx /usr/local/nginx/sbin/ |
升级检测
1 | make upgrade |
检查程序中是否包含新模块
1 | nginx -V |
配置方法
1 | upstream httpget { |
2. KeepAlive
在http协议header中可以看到当前连接状态
- 测试工具charles:下载、官网
- 明显的预知用户会在当前连接上有下一步操作
- 复用连接,有效减少握手次数,尤其是https建立一次连接开销会更大
- 访问内联资源一般用缓存,不需要keepalive
- 长时间的tcp连接容易导致系统资源无效占用
1. 客户端使用keepalive(Nginx服务器与客户端的连接)
keepalive_time:限制keepalive保持连接的最大时间keepalive_timeout:用于设置Nginx服务器与客户端保持连接的超时时间,用于踢出不活动连接,keepalive_timeout = 0 即关闭send_timeout- send_timeout 10; 10秒
- send_timeout 10 10; 同时下发一个header 告诉浏览器
两次向客户端写操作之间的间隔 如果大于这个时间则关闭连接 默认60s此处有坑,注意耗时的同步操作有可能会丢弃用户连接
该设置表示Nginx服务器与客户端连接后,某次会话中服务器等待客户端响应超过10s,就会自动关闭连接。
keepalive_requests:默认1000,单个连接中可处理的请求数keepalive_disable:不对某些浏览器建立长连接,默认msie6
1 | http { |
2. 上游服务器使用keepalive
首先需要配置使用http1.1协议。以便建立更高效的传输,默认使用http1.0,在http1.0中需要配置header才能
在Upstream中所配置的上游服务器默认都是用短连接,即每次请求都会在完成之后断开
upstream中配置
keepalive 100:向上游服务器的保留连接数keepalive_timeout:连接保留时间keepalive_requests:一个tcp复用中 可以并发接收的请求个数
server中配置
proxy_http_version 1.1:配置http版本号,默认使用http1.0协议,需要在request中增加”Connection: keep-alive“ header才能够支持,而HTTP1.1默认支持。proxy_set_header Connection "":清楚close信息
3. AB压力测试
1 | yum install -y httpd-tools |
1 | ab [options] [http[s]://]hostname[:port]/path |
参数说明:
-n即requests,用于指定压力测试总共的执行次数。-c即concurrency,用于指定的并发数。-t即timelimit,等待响应的最大时间(单位:秒)。-b即windowsize,TCP发送/接收的缓冲大小(单位:字节)。-p即postfile,发送POST请求时需要上传的文件,此外还必须设置-T参数。-u即putfile,发送PUT请求时需要上传的文件,此外还必须设置-T参数。-T即content-type,用于设置Content-Type请求头信息,例如:application/x-www-form-urlencoded,默认值为text/plain。-v即verbosity,指定打印帮助信息的冗余级别。-w以HTML表格形式打印结果。-i使用HEAD请求代替GET请求。-x插入字符串作为table标签的属性。-y插入字符串作为tr标签的属性。-z插入字符串作为td标签的属性。-C添加cookie信息,例如:”Apache=1234”(可以重复该参数选项以添加多个)。-H添加任意的请求头,例如:”Accept-Encoding: gzip”,请求头将会添加在现有的多个请求头之后(可以重复该参数选项以添加多个)。-A添加一个基本的网络认证信息,用户名和密码之间用英文冒号隔开。-P添加一个基本的代理认证信息,用户名和密码之间用英文冒号隔开。-X指定使用的和端口号,例如:”126.10.10.3:88”。-V打印版本号并退出。-k使用HTTP的KeepAlive特性。-d不显示百分比。-S不显示预估和警告信息。-g输出结果信息到gnuplot格式的文件中。-e输出结果信息到CSV格式的文件中。-r指定接收到错误信息时不退出程序。-h显示用法信息,其实就是ab -help。
1. 直连nginx
1 | ab -n 100000 -c 30 http://192/168.111.130/ |
1 | Server Software: nginx/1.21.6 |
2. 反向代理
1 | ab -n 100000 -c 30 http://192/168.111.129/ |
1 | Server Software: nginx/1.21.6 |
3. 直连Tomcat
1 | ab -n 100000 -c 30 http://192/168.111.130/ |
1 | Server Software: nginx/1.21.6 |
4. nginx反向代理Tomcat
1 | Server Software: nginx/1.21.6 |
5. nginx反向代理Tomcat + keepalive
1 | ab -n 100000 -c 30 http://192/168.111.129/ |
1 | Server Software: nginx/1.21.6 |
4. UpStream工作流程
proxy_pass 向上游服务器请求数据共有6个阶段:初始化、与上游服务器建立连接、向上游服务器发送请求、处理响应头、处理响应体、结束
set_header:设置headerproxy_connect_timeout:与上游服务器连接超时时间、快速失败proxy_send_timeout:定义nginx向后端服务发送请求的间隔时间(不是耗时)。默认60秒,超过这个时间会关闭连接proxy_read_timeout:后端服务给nginx响应的时间,规定时间内后端服务没有给nginx响应,连接会被关闭,nginx返回504 Gateway Time-out。默认60秒
1. 缓冲区
proxy_requset_buffering:是否完全读到请求体之后再向上游服务器发送请求proxy_buffering:是否缓冲上游服务器数据proxy_buffers 32 64k:缓冲区大小 32个 64k大小内存缓冲块proxy_buffer_size:header缓冲区大小proxy_temp_file_write_size 8k:当启用从代理服务器到临时文件的响应的缓冲时,一次限制写入临时文件的数据的大小。 默认情况下,大小由proxy_buffer_size和proxy_buffers指令设置的两个缓冲区限制。 临时文件的最大大小由proxy_max_temp_file_size指令设置。proxy_max_temp_file_size 1024m:临时文件最大值proxy_temp_path1
proxy_temp_path /spool/nginx/proxy_temp 1 2;
a temporary file might look like this:
1
/spool/nginx/proxy_temp/7/45/00000123457
1 | proxy_requset_buffering on; |
2. 客户端的限制
可配置位置:http、server、location
client_body_buffer_size:对客户端请求中的body缓冲区大小,默认32位8k 64位16k,如果请求体大于配置,则写入临时文件client_header_buffer_size:设置读取客户端请求体的缓冲区大小。 如果请求体大于缓冲区,则将整个请求体或仅将其部分写入临时文件。 默认32位8K。 64位平台16K。client_max_body_size 1000M:默认1m,如果一个请求的大小超过配置的值,会返回413 (request Entity Too Large)错误给客户端,将size设置为0将禁用对客户端请求正文大小的检查。client_body_timeout:指定客户端与服务端建立连接后发送 request body 的超时时间。如果客户端在指定时间内没有发送任何内容,Nginx 返回 HTTP 408(Request Timed Out)client_header_timeout:客户端向服务端发送一个完整的 request header 的超时时间。如果客户端在指定时间内没有发送一个完整的 request header,Nginx 返回 HTTP 408(Request Timed Out)。client_body_temp_path path [level1 [level2 [level3]]]:在磁盘上客户端的body临时缓冲区位置client_body_in_file_only on:把body写入磁盘文件,请求结束也不会删除client_body_in_single_buffer:尽量缓冲body的时候在内存中使用连续单一缓冲区,在二次开发时使用$request_body读取数据时性能会有所提高client_header_buffer_size:设置读取客户端请求头的缓冲区大小,如果一个请求行或者一个请求头字段不能放入这个缓冲区,那么就会使用large_client_header_bufferslarge_client_header_buffers:默认8k
5. 反向代理中的容错机制
1. 参考文档
https://docs.nginx.com/nginx/admin-guide/load-balancer/http-load-balancer/
http://nginx.org/en/docs/stream/ngx_stream_proxy_module.html#proxy_bind
2. 重试机制
proxy_next_upstream
作用:
当后端服务器返回指定的错误时,将请求传递到其他服务器。
error与服务器建立连接,向其传递请求或读取响应头时发生错误;
timeout在与服务器建立连接,向其传递请求或读取响应头时发生超时;
invalid_header服务器返回空的或无效的响应;
http_500服务器返回代码为500的响应;
http_502服务器返回代码为502的响应;
http_503服务器返回代码为503的响应;
http_504服务器返回代码504的响应;
http_403服务器返回代码为403的响应;
http_404服务器返回代码为404的响应;
http_429服务器返回代码为429的响应;
不了解这个机制,在日常开发web服务的时候,就可能会踩坑。
比如有这么一个场景:一个用于导入数据的web页面,上传一个excel,通过读取、处理excel,向数据库中插入数据,处理时间较长(如1分钟),且为同步操作(即处理完成后才返回结果)。暂且不论这种方式的好坏,若nginx配置的响应等待时间(proxy_read_timeout)为30秒,就会触发超时重试,将请求又打到另一台。如果处理中没有考虑到重复数据的场景,就会发生数据多次重复插入!(当然,这种场景,内网可以通过机器名访问该服务器进行操作,就可以绕过nginx了,不过外网就没办法了。)
6. 获取客户端真实IP
X-Real-IP:额外模块,不推荐使用,Http协议中的Header
setHeader:Nginx proxy_set_header
1 | proxy_set_header X-Forwarded-For $remote_addr; |
7. gzip
作用域 http, server, location
gzip on:开关,默认关闭gzip_buffers 32 4k|16 8k:缓冲区大小gzip_comp_level 1:压缩等级 1-9,数字越大压缩比越高gzip_http_version 1.1:使用gzip的最小版本gzip_min_length:设置将被gzip压缩的响应的最小长度。 长度仅由“Content-Length”响应报头字段确定。gzip_proxied多选- off:为不做限制,作为反向代理时,针对上游服务器返回的头信息进行压缩
- expired - 启用压缩,如果header头中包含 “Expires” 头信息
- no-cache - 启用压缩,如果header头中包含 “Cache-Control:no-cache” 头信息
- no-store - 启用压缩,如果header头中包含 “Cache-Control:no-store” 头信息
- private - 启用压缩,如果header头中包含 “Cache-Control:private” 头信息
- no_last_modified - 启用压缩,如果header头中不包含 “Last-Modified” 头信息
- no_etag - 启用压缩,如果header头中不包含 “ETag” 头信息
- auth - 启用压缩 , 如果header头中包含 “Authorization” 头信息
- any - 无条件启用压缩
gzip_vary on:增加一个header,适配老的浏览器Vary: Accept-Encodinggzip_types:哪些mime类型的文件进行压缩gzip_disable:禁止某些浏览器使用gzip
Gzip动态压缩
1 | gzip on; |
1 | HTTP/1.1 200 |
Gzip静态压缩
http_gzip_static_module:帮助不支持gzip的客户端解压本地文件
需要重新编译nginx
1 | ./configure --with-http_gzip_static_module |
1 | gzip_static always |
8. Brotli
下面两个都要安装
- https://github.com/google/ngx_brotli/releases
- https://codeload.github.com/google/brotli/tar.gz/refs/tags/v1.0.9
1 | cp -fr ./brotli-1.0.9/* ./ngx_brotli-1.0.0rc/deps/brotli/ |
模块化编译
1 | ./configure --with-compat --add-dynamic-module=ngx_brotli目录 --prefix=/usr/local/nginx/ |
将objs/ngx_http_brotli_filter_module.so、objs/ngx_http_brotli_static_module.so拷贝到/usr/local/nginx/modules/
1 | mkdir /usr/local/nginx/modules/ |
复制nginx主程序
1
cp -rf objs/nginx /usr/local/nginx/sbin
配置文件中添加
1 | load_module "/usr/local/nginx/modules/ngx_http_brotli_filter_module.so"; |
1 | brotli on; |
- 测试
默认http协议是没有br的
1 | curl -H 'Accept-Encoding: gzip' -I http://192.168.111.129 |
9. 合并客户端请求
Concat模块
Tengine
Nginx官方介绍
https://www.nginx.com/resources/wiki/modules/concat/
git地址
https://github.com/alibaba/nginx-http-concat
安装
下载源码解压缩编译安装
配置
1
2concat on;
concat_max_files 30;
10. 资源静态化
- 高并发系统资源静态化方案
- 一致性问题
- 合并文件输出
- 集群文件同步
11. SSI合并服务器端文件
官方文档
http://nginx.org/en/docs/http/ngx_http_ssi_module.html
配置:
ssi_min_file_chunk:向磁盘存储并使用sendfile发送,文件大小最小值ssi_last_modified:是否保留lastmodifiedssi_silent_errors:不显示逻辑错误ssi_value_length:限制脚本参数最大长度ssi_types:默认text/html; 如果需要其他mime类型需要设置
SSI命令:
include file:静态文件直接引用
1
<!--# include file="footer.html" -->
include virtual:可以指向location,而不一定是具体文件
include wait:阻塞请求
include set:在virtual基础上设置变量
set:设置临时变量
block:可以声明一个ssi的命令块,里面可以包裹其他命令
config errmsg:在模板中配置报错情况
config timefmt:日期格式化
echo:直接输出变量
- var变量名称
- encoding 是否使用特殊编码格式
- default 变量没有值的时候使用默认值
if:逻辑判断
13. rsync
https://www.samba.org/ftp/rsync/rsync.html
remote synchronize是一个远程数据同步工具,可通过 LAN/WAN 快速同步多台主机之间的文件。也可以使用 rsync 同步本地硬盘中的不同目录。
rsync 是用于替代 rcp 的一个工具,rsync 使用所谓的 rsync算法 进行数据同步,这种算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度相当快。
rsync 基于inotify 开发
Rsync有三种模式:
- 本地模式(类似于cp命令)
- 远程模式(类似于scp命令)
- 守护进程(socket进程:是rsync的重要功能)
1. rsync 常用选项
| 选项 | 含义 |
|---|---|
| -a | 包含-rtplgoD |
| -r | 同步目录时要加上,类似cp时的-r选项 |
| -v | 同步时显示一些信息,让我们知道同步的过程 |
| -l | 保留软连接 |
| -L | 加上该选项后,同步软链接时会把源文件给同步 |
| -p | 保持文件的权限属性 |
| -o | 保持文件的属主 |
| -g | 保持文件的属组 |
| -D | 保持设备文件信息 |
| -t | 保持文件的时间属性 |
| –delete | 删除DEST中SRC没有的文件 |
| –exclude | 过滤指定文件,如–exclude “logs”会把文件名包含logs的文件或者目录过滤掉,不同步 |
| -P | 显示同步过程,比如速率,比-v更加详细 |
| -u | 加上该选项后,如果DEST中的文件比SRC新,则不同步 |
| -z | 传输时压缩 |
安装
两端安装
1 | yum install -y rsync |
密码文件
创建文件/etc/rsync.password
1 | echo "hello:123" >> /etc/rsync.password |
修改权限
1 | chmod 600 /etc/rsync.password |
修改配置
1 | auth users = sgg |
开机启动
在/etc/rc.local文件中添加
1 | rsync --daemon |
查看远程目录
rsync –list-only 192.168.44.104::www/
拉取数据到指定目录
rsync -avz rsync://192.168.44.104:873/www
rsync -avz 192.168.44.104::www/ /root/w
使用SSH方式
rsync -avzP /usr/local/nginx/html/ root@192.168.44.105:/www/
客户端免密
客户端只放密码
1 | echo "111" >> /etc/rsyncd.passwd |
此时在客户端已经可以配合脚本实现定时同步了
如何实现推送?
修改配置
1 | rsync -avz --password-file=/etc/rsyncd.passwd.client /usr/local/nginx/html/ rsync://sgg@192.168.44.105:/www |
--delete 删除目标目录比源目录多余文件
实时推送
推送端安装inotify
依赖
1 | yum install -y automake |
1 | wget http://github.com/downloads/rvoicilas/inotify-tools/inotify-tools-3.14.tar.gz |
监控目录
1 | /usr/local/inotify/bin/inotifywait -mrq --timefmt '%Y-%m-%d %H:%M:%S' --format '%T %w%f %e' -e close_write,modify,delete,create,attrib,move //usr/local/nginx/html/ |
简单自动化脚本
1 | !/bin/bash |
inotify常用参数
| 参数 | 说明 | 含义 |
|---|---|---|
| -r | –recursive | #递归查询目录 |
| -q | –quiet | #打印很少的信息,仅仅打印监控事件信息 |
| -m | –monitor | #始终保持事件监听状态 |
| –excludei | #排除文件或目录时,不区分大小写 | |
| –timefmt | #指定事件输出格式 | |
| –format | #打印使用指定的输出类似格式字符串 | |
| -e | –event[ -e|–event … ]accessmodifyattribcloseopenmove_tomove createdeleteumount | #通过此参数可以指定要监控的事件 #文件或目录被读取#文件或目录的内容被修改#文件或目录属性被改变#文件或目录封闭,无论读/写模式#文件或目录被打开#文件或目录被移动至另外一个目录#文件或目录被移动另一个目录或从另一个目录移动至当前目录#文件或目录被创建在当前目录#文件或目录被删除#文件系统被卸载 |
3. 多级缓存
1. 静态资源缓存
2. 浏览器缓存
什么时候可以用缓存?
- 不常改变的内容
- 过期时间
- 针对post/get请求都可以
- 存储位置
- 磁盘使用空间限制
观察京东缓存及加载速度
diskcache:字面理解是从内存中,其实也是字面的含义,这个资源是直接从内存中拿到的,不会请求服务器一般已经加载过该资源且缓存在了内存当中,当关闭该页面时,此资源就被内存释放掉了,再次重新打开相同页面时不会出现from memory cache的情况
memorycache:是从磁盘当中取出的,也是在已经在之前的某个时间加载过该资源,不会请求服务器但是此资源不会随着该页面的关闭而释放掉,因为是存在硬盘当中的,下次打开仍会from disk cache
Age:是CDN添加的属性表示在CDN中缓存了多少秒
via:用来标识CDN缓存经历了哪些服务器,缓存是否命中,使用的协议
3. Nginx默认缓存
Nginx版本不同会默认配置
强制缓存:直接从本机读取,不请求服务器
协商缓存:发送请求header中携带Last-Modified,服务器可能会返回304 Not Modified
1. 强制缓存
cache-control
http1.1的规范,使用max-age表示文件可以在浏览器中缓存的时间以秒为单位
| 标记 | 类型 | 功能 |
|---|---|---|
| public | 响应头 | 响应的数据可以被缓存,客户端和代理层都可以缓存 |
| private | 响应头 | 可私有缓存,客户端可以缓存,代理层不能缓存(CDN,proxy_pass) |
| no-cache | 请求头 | 可以使用本地缓存,但是必须发送请求到服务器回源验证 |
| no-store | 请求和响应 | 应禁用缓存 |
| max-age | 请求和响应 | 文件可以在浏览器中缓存的时间以秒为单位 |
| s-maxage | 请求和响应 | 用户代理层缓存,CDN下发,当客户端数据过期时会重新校验 |
| max-stale | 请求和响应 | 缓存最大使用时间,如果缓存过期,但还在这个时间范围内则可以使用缓存数据 |
| min-fresh | 请求和响应 | 缓存最小使用时间, |
| must-revalidate | 请求和响应 | 当缓存过期后,必须回源重新请求资源。比no-cache更严格。因为HTTP 规范是允许客户端在某些特殊情况下直接使用过期缓存的,比如校验请求发送失败的时候。那么带有must-revalidate的缓存必须校验,其他条件全部失效。 |
| proxy-revalidate | 请求和响应 | 和must-revalidate类似,只对CDN这种代理服务器有效,客户端遇到此头,需要回源验证 |
| stale-while-revalidate | 响应 | 表示在指定时间内可以先使用本地缓存,后台进行异步校验 |
| stale-if-error | 响应 | 在指定时间内,重新验证时返回状态码为5XX的时候,可以用本地缓存 |
| only-if-cached | 响应 | 那么只使用缓存内容,如果没有缓存 则504 getway timeout |
在浏览器和服务器端验证文件是否过期的时候,浏览器在二次请求的时候会携带IF-Modified-Since属性
Expires:过期时间
1 | expires 30s; #缓存30秒 |
2. 协商缓存
last-modified etag,http1.1支持
在HTTP协议中If-Modified-Since和If-None-Match分别对应Last-Modified和ETag
Entity Tag 的缩写,中文译过来就是实体标签的意思。
HTTP中并没有指定如何生成ETag,哈希是比较理想的选择。
在计算Etag的时候,会产生CPU的耗费,所以也可以用时间戳,但这样直接使用Last-Modified即可。
ETag 用来校验用户请求的资源是否有变化,作用和lastmodified很像,区别是lastmodified精确到秒,ETag可以用hash算法来生成更精确的比对内容。
当用户首次请求资源的时候返回给用户数据和200状态码并生成ETag,再次请求的时候服务器比对ETag,没有发生变化的话返回304。
Cache-Control直接是通过不请求来实现,而ETag是会发请求的,只不过服务器根据请求的东西的内容有无变化来判断是否返回请求的资源。
总结:
cache-control expires 强制缓存
页面首次打开,直接读取缓存数据,刷新,会向服务器发起请求
etag lastmodify 协商缓存
没发生变化 返回304 不发送数
last-modified 与ssi的冲突
浏览器缓存原则
多级集群负载时last-modified必须保持一致
还有一些场景下我们希望禁用浏览器缓存。比如轮训api上报数据数据
浏览器缓存很难彻底禁用,大家的做法是加版本号,随机数等方法。
只缓存200响应头的数据,像3XX这类跳转的页面不需要缓存。
对于js,css这类可以缓存很久的数据,可以通过加版本号的方式更新内容
不需要强一致性的数据,可以缓存几秒
异步加载的接口数据,可以使用ETag来校验。
在服务器添加Server头,有利于排查错误
分为手机APP和Client以及是否遵循http协议
在没有联网的状态下可以展示数据
流量消耗过多
提前下发 避免秒杀时同时下发数据造成流量短时间暴增
兜底数据 在服务器崩溃和网络不可用的时候展示
临时缓存 退出即清理
固定缓存 展示框架这种,可能很长时间不会更新,可用随客户端下发
- 首页有的时候可以看做是框架 应该禁用缓存,以保证加载的资源都是最新的
父子连接 页面跳转时有一部分内容不需要重新加载,可用从父菜单带过来
预加载 某些逻辑可用判定用户接下来的操作,那么可用异步加载那些资源
漂亮的加载过程 异步加载 先展示框架,然后异步加载内容,避免主线程阻塞
GEOip
1 下载数据库
官网需注册登录
下载数据库
maxmind.com
2 安装依赖
官方git
https://github.com/maxmind/libmaxminddb
下载后执行编译安装之后
1 | $ echo /usr/local/lib >> /etc/ld.so.conf.d/local.conf |
Nginx模块
https://github.com/leev/ngx_http_geoip2_module
更完整的配置可参考官方文档
http://nginx.org/en/docs/http/ngx_http_geoip_module.html#geoip_proxy
正向代理与反向代理缓存
正向代理配置
1 | proxy_pass $scheme://$host$request_uri; |
代理https请求
需要第三方模块
https://github.com/chobits/ngx_http_proxy_connect_module
配置
1 | server { |
proxy缓存
官网解释
http://nginx.org/en/docs/http/ngx_http_proxy_module.html#proxy_cache
配置
1 | http模块: |
proxy_cache_use_stale
默认off
在什么时候可以使用过期缓存
可选error | timeout | invalid_header | updating | http_500 | http_502 | http_503 | http_504 | http_403 | http_404 | http_429 | off
proxy_cache_background_update
默认off
运行开启子请求更新过期的内容。同时会把过期的内容返回给客户端
proxy_no_cache proxy_cache_bypass
指定什么时候不使用缓存而直接请求上游服务器
1 | proxy_no_cache $cookie_nocache $arg_nocache$arg_comment; |
如果这些变量如果存在的话不为空或者不等于0,则不使用缓存
proxy_cache_convert_head
默认 on
是否把head请求转换成get请求后再发送给上游服务器 以便缓存body里的内容
如果关闭 需要在 cache key 中添加 $request_method 以便区分缓存内容
proxy_cache_lock
默认off
缓存更新锁
proxy_cache_lock_age
默认5s
缓存锁超时时间
断点续传缓存 range
当有完整的content-length之后即可断点续传
在反向代理服务器中需向后传递header
1 | proxy_set_header Range $http_range; |
proxy_cache_key中增加range
proxy_cache_max_range_offset
range最大值,超过之后不做缓存,默认情况下 不需要对单文件较大的资源做缓存
proxy_cache_methods
默认 head get
proxy_cache_min_uses
默认1
被请求多少次之后才做缓存
proxy_cache_path
path 指定存储目录
以cache_key取md5值
- levels=1:2
目录层级数及目录名称位数
取mdb5后几位
TMPFS
- use_temp_path
默认创建缓存文件时,先向缓冲区创建临时文件,再移动到缓存目录
是否使用缓冲区
- inactive
指定时间内未被访问过的缓存将被删除
缓存清理
purger
需要第三方模块支持
https://github.com/FRiCKLE/ngx_cache_purge
2. 高效
Nginx内存缓存
strace
一般应用为静态文件元数据信息缓存
sendfile执行过程
1 | epoll_wait(8, [{EPOLLIN, {u32=1904243152, u64=140709327827408}}, {EPOLLIN, {u32=1904242704, u64=140709327826960}}], 512, 25215) = 2 |
open_file_cache
1 | open_file_cache max=500 inactive=60s |
max缓存最大数量,超过数量后会使用LRU淘汰
inactive 指定时间内未被访问过的缓存将被删除
pen_file_cache_min_uses
被访问到多少次后会开始缓存
open_file_cache_valid
间隔多长时间去检查文件是否有变化
open_file_cache_errors
对错误信息是否缓存
Nginx外置缓存缓存
http://nginx.org/en/docs/http/ngx_http_memcached_module.html
error_page
指定状态码
1 | error_page 404 =302 http://www.atguigu.com; |
默认指向location
匿名location
nginx + memcached
memcached安装
yum -y install memcached
默认配置文件在
/etc/sysconfig/memcached
查看状态
1 | memcached-tool 127.0.0.1:11211 stats |
nginx配置
1 | upstream backend { |
nginx + redis
Redis安装
7.0下载地址
https://codeload.github.com/redis/redis/tar.gz/refs/tags/7.0.0
安装
1 | 依赖 |
redis2-nginx-module
redis2-nginx-module是一个支持 Redis 2.0 协议的 Nginx upstream 模块,它可以让 Nginx 以非阻塞方式直接防问远方的 Redis 服务,同时支持 TCP 协议和 Unix Domain Socket 模式,并且可以启用强大的 Redis 连接池功能。
https://www.nginx.com/resources/wiki/modules/redis2/
https://github.com/openresty/redis2-nginx-module
redis快速安装
1 | yum install epel-release |
redis2-nginx-module 安装
test
1 | location = /foo { |
get
1 | location = /get { |
set
1 | # GET /set?key=one&val=first%20value |
pipeline
1 | set $value 'first'; |
list
1 | redis2_query lpush key1 C; |
集群
1 | upstream redis_cluster { |
Stream模块
http://nginx.org/en/docs/stream/ngx_stream_core_module.html
限流
QPS限制
官方文档
http://nginx.org/en/docs/http/ngx_http_limit_req_module.html
测试工具
配置
1 | limit_req_zone $binary_remote_addr zone=test:10m rate=15r/s; |
日志
ngx_http_log_module
http://nginx.org/en/docs/http/ngx_http_log_module.html
ngx_http_empty_gif_module
http://nginx.org/en/docs/http/ngx_http_empty_gif_module.html
json
1 | log_format ngxlog json '{"timestamp":"$time_iso8601",' |
errorlog
http://nginx.org/en/docs/ngx_core_module.html#error_log
日志分割
1.脚本
2.Logrotate
重试机制
http://nginx.org/en/docs/http/ngx_http_proxy_module.html#proxy_next_upstream
max_fails
最大失败次数
0为标记一直可用,不检查健康状态
fail_timeout
失败时间
当fail_timeout时间内失败了max_fails次,标记服务不可用
fail_timeout时间后会再次激活次服务
proxy_next_upstream
proxy_next_upstream_timeout
重试最大超时时间
proxy_next_upstream_tries
重试次数,包括第一次
proxy_next_upstream_timeout时间内允许proxy_next_upstream_tries次重试
主动健康检查
tengine版
https://github.com/yaoweibin/nginx_upstream_check_module
nginx商业版
http://nginx.org/en/docs/http/ngx_http_upstream_hc_module.html
Openresty
Lua
Lua 是由巴西里约热内卢天主教大学(Pontifical Catholic University of Rio de Janeiro)里的一个研究小组于1993年开发的一种轻量、小巧的脚本语言,用标准 C 语言编写,其设计目的是为了嵌入应用程序中,从而为应用程序提供灵活的扩展和定制功能。
IDE
EmmyLua插件
https://github.com/EmmyLua/IntelliJ-EmmyLua
https://emmylua.github.io/zh_CN/
LDT 基于eclipse
Lua基础语法
hello world
1 | print("hello world!") |
保留关键字
and break do else elseif end false for function if in local nil not or repeat return then true until while
注释
1 | -- 两个减号是行注释 |
变量
数字类型
Lua的数字只有double型,64bits
你可以以如下的方式表示数字
1 | num = 1024 |
字符串
可以用单引号,也可以用双引号
也可以使用转义字符‘\n’ (换行), ‘\r’ (回车), ‘\t’ (横向制表), ‘\v’ (纵向制表), ‘\’ (反斜杠), ‘\”‘ (双引号), 以及 ‘\” (单引号)等等
下面的四种方式定义了完全相同的字符串(其中的两个中括号可以用于定义有换行的字符串)
1 | a = 'alo\n123"' |
空值
C语言中的NULL在Lua中是nil,比如你访问一个没有声明过的变量,就是nil
布尔类型
只有nil和false是 false
数字0,‘’空字符串(’\0’)都是true
作用域
lua中的变量如果没有特殊说明,全是全局变量,那怕是语句块或是函数里。
变量前加local关键字的是局部变量。
控制语句
while循环
1 | local i = 0 |
if-else
1 | local function main() |
for循环
1 | sum = 0 |
函数
1 | function myPower(x,y) |
1 | function newCounter() |
返回值
1 | name, age,bGay = "yiming", 37, false, "yimingl@hotmail.com" |
1 | function isMyGirl(name) |
Table
key,value的键值对 类似 map
1 | local function main() |
数组
1 | local function main() |
遍历
1 | arr = {"string", 100, "dog",function() print("wangwang!") return 1 end} |
成员函数
1 | local function main() |
Openresty Nginx + Lua
Nginx是一个主进程配合多个工作进程的工作模式,每个进程由单个线程来处理多个连接。
在生产环境中,我们往往会把cpu内核直接绑定到工作进程上,从而提升性能。
安装
预编译安装
以CentOS举例 其他系统参照:http://openresty.org/cn/linux-packages.html
你可以在你的 CentOS 系统中添加 openresty 仓库,这样就可以便于未来安装或更新我们的软件包(通过 yum update 命令)。运行下面的命令就可以添加我们的仓库:
- yum install yum-utils
- yum-config-manager –add-repo https://openresty.org/package/centos/openresty.repo
然后就可以像下面这样安装软件包,比如 openresty:
yum install openresty
如果你想安装命令行工具 resty,那么可以像下面这样安装 openresty-resty 包:
sudo yum install openresty-resty
源码编译安装
下载
http://openresty.org/cn/download.html
最小版本基于nginx1.21
./configure
然后在进入 openresty-VERSION/ 目录, 然后输入以下命令配置:
./configure
默认, --prefix=/usr/local/openresty 程序会被安装到/usr/local/openresty目录。
依赖 gcc openssl-devel pcre-devel zlib-devel
安装:yum install gcc openssl-devel pcre-devel zlib-devel postgresql-devel
您可以指定各种选项,比如
1 | ./configure --prefix=/opt/openresty \ |
试着使用 ./configure --help 查看更多的选项。
make && make install
服务命令
启动
Service openresty start
停止
Service openresty stop
检查配置文件是否正确
Nginx -t
重新加载配置文件
Service openresty reload
查看已安装模块和版本号
Nginx -V
测试lua脚本
1 | #在Nginx.conf 中写入 |
lua-nginx-module
创建配置文件lua.conf
1 | server { |
在Nginx.conf下引入lua配置
include lua.conf;
创建外部lua脚本
conf/lua/hello.lua
内容:
ngx.say("<p>Hello, World!</p>")
获取Nginx uri中的单一变量
1 | location /nginx_var { |
获取Nginx uri中的所有变量
1 | local uri_args = ngx.req.get_uri_args() |
在处理http请求时还可以使用
- set_by_lua
修改nginx变量
- rewrite_by_lua
修改uri
- access_by_lua
访问控制
- header_filter_by_lua
修改响应头
- boy_filter_by_lua
修改响应体
- log_by_lua
日志
代码热部署
1 | lua_code_cache off |
获取Nginx请求头信息
1 | local headers = ngx.req.get_headers() |
获取post请求参数
1 | ngx.req.read_body() |
http协议版本
1 | ngx.say("ngx.req.http_version : ", ngx.req.http_version(), "<br/>") |
请求方法
1 | ngx.say("ngx.req.get_method : ", ngx.req.get_method(), "<br/>") |
原始的请求头内容
1 | ngx.say("ngx.req.raw_header : ", ngx.req.raw_header(), "<br/>") |
body内容体
1 | ngx.say("ngx.req.get_body_data() : ", ngx.req.get_body_data(), "<br/>") |
Nginx缓存
Nginx全局内存缓存
1 | lua_shared_dict shared_data 1m; |
lua-resty-lrucache
Lua 实现的一个简单的 LRU 缓存,适合在 Lua 空间里直接缓存较为复杂的 Lua 数据结构:它相比 ngx_lua 共享内存字典可以省去较昂贵的序列化操作,相比 memcached 这样的外部服务又能省去较昂贵的 socket 操作
https://github.com/openresty/lua-resty-lrucache
自定
lua-resty-redis访问redis
https://github.com/openresty/lua-resty-redis
常用方法
1 | local res, err = red:get("key") |
创建连接
1 | red, err = redis:new() |
timeout
1 | red:set_timeout(time) |
keepalive
1 | red:set_keepalive(max_idle_timeout, pool_size) |
close
1 | ok, err = red:close() |
pipeline
1 | red:init_pipeline() |
认证
1 | local res, err = red:auth("foobared") |
1 | local redis = require "resty.redis" |
redis-cluster支持
https://github.com/steve0511/resty-redis-cluster
redis2-nginx-module
redis2-nginx-module是一个支持 Redis 2.0 协议的 Nginx upstream 模块,它可以让 Nginx 以非阻塞方式直接防问远方的 Redis 服务,同时支持 TCP 协议和 Unix Domain Socket 模式,并且可以启用强大的 Redis 连接池功能。
test
1 | location = /foo { |
get
1 | location = /get { |
set
1 | # GET /set?key=one&val=first%20value |
pipeline
1 | set $value 'first'; |
list
1 | redis2_query lpush key1 C; |
集群
1 | upstream redis_cluster { |
lua-resty-mysql
https://github.com/openresty/lua-resty-mysql
1 | local mysql = require "resty.mysql" |
模板实时渲染 lua-resty-template
https://github.com/bungle/lua-resty-template
lua代码热加载
在http模块中加入
1 | lua_code_cache off; |
reload后Nginx会提示影响性能,记得在生产环境中关掉。
测试
一、初始化
1 | -- Using template.new |
二、执行函数,得到渲染之后的内容
1 | local func = template.compile("view.html") |
模板文件存放位置
nginx.conf中配置
1 | set $template_root /usr/local/openresty/nginx/tmp; |
resty.template
1 | local template = require("resty.template") |
模板内容
1 |
|
多值传入
1 | template.caching(false) |
模板内容
1 | <!DOCTYPE html> |
模板管理与缓存
模板缓存:默认开启,开发环境可以手动关闭
template.caching(true)
模板文件需要业务系统更新与维护,当模板文件更新后,可以通过模板版本号或消息通知Openresty清空缓存重载模板到内存中
template.cache = {}
完整页面
1 | local template = require("resty.template") |
模板
1 | {(header.html)} |
layout 布局统一风格
使用模板内容嵌套可以实现全站风格同一布局
lua
local template = require "resty.template"
一、
1 | local layout = template.new "layout.html" |
二、
1 | template.render("layout.html", { |
三、
此方式重名变量值会被覆盖
1 | local view = template.new("view.html", "layout.html") |
四、
可以区分一下
1 | local layout = template.new "layout.html" |
layout.html
1 |
|
多级嵌套
lua
1 | local view = template.new("view.html", "layout.html") |
Redis缓存+mysql+模板输出
lua
1 | cjson = require "cjson" |
Lua 开源项目
WAF
https://github.com/unixhot/waf
https://github.com/loveshell/ngx_lua_waf
l 防止 SQL 注入,本地包含,部分溢出,fuzzing 测试,XSS/SSRF 等 Web 攻击
l 防止 Apache Bench 之类压力测试工具的攻击
l 屏蔽常见的扫描黑客工具,扫描器
l 屏蔽图片附件类目录执行权限、防止 webshell 上传
l 支持 IP 白名单和黑名单功能,直接将黑名单的 IP 访问拒绝
l 支持 URL 白名单,将不需要过滤的 URL 进行定义
l 支持 User-Agent 的过滤、支持 CC 攻击防护、限制单个 URL 指定时间的访问次数
l 支持支持 Cookie 过滤,URL 与 URL 参数过滤
l 支持日志记录,将所有拒绝的操作,记录到日志中去
Kong 基于Openresty的流量网关
Kong 基于 OpenResty,是一个云原生、快速、可扩展、分布式的微服务抽象层(Microservice Abstraction Layer),也叫 API 网关(API Gateway),在 Service Mesh 里也叫 API 中间件(API Middleware)。
Kong 开源于 2015 年,核心价值在于高性能和扩展性。从全球 5000 强的组织统计数据来看,Kong 是现在依然在维护的,在生产环境使用最广泛的 API 网关。
Kong 宣称自己是世界上最流行的开源微服务 API 网关(The World’s Most Popular Open Source Microservice API Gateway)。
核心优势:
l 可扩展:可以方便的通过添加节点水平扩展,这意味着可以在很低的延迟下支持很大的系统负载。
l 模块化:可以通过添加新的插件来扩展 Kong 的能力,这些插件可以通过 RESTful Admin API 来安装和配置。
l 在任何基础架构上运行:Kong 可以在任何地方都能运行,比如在云或混合环境中部署 Kong,单个或全球的数据中心。
APISIX
ABTestingGateway
https://github.com/CNSRE/ABTestingGateway
ABTestingGateway 是一个可以动态设置分流策略的网关,关注与灰度发布相关领域,基于 Nginx 和 ngx-lua 开发,使用 Redis 作为分流策略数据库,可以实现动态调度功能。
ABTestingGateway 是新浪微博内部的动态路由系统 dygateway 的一部分,目前已经开源。在以往的基于 Nginx 实现的灰度系统中,分流逻辑往往通过 rewrite 阶段的 if 和 rewrite 指令等实现,优点是性能较高,缺点是功能受限、容易出错,以及转发规则固定,只能静态分流。ABTestingGateway 则采用 ngx-lua,通过启用 lua-shared-dict 和 lua-resty-lock 作为系统缓存和缓存锁,系统获得了较为接近原生 Nginx 转发的性能。
l 支持多种分流方式,目前包括 iprange、uidrange、uid 尾数和指定uid分流
l 支持多级分流,动态设置分流策略,即时生效,无需重启
l 可扩展性,提供了开发框架,开发者可以灵活添加新的分流方式,实现二次开发
l 高性能,压测数据接近原生 Nginx 转发
l 灰度系统配置写在 Nginx 配置文件中,方便管理员配置
l 适用于多种场景:灰度发布、AB 测试和负载均衡等

