34 | Nginx:高性能的Web服务器
34 | Nginx:高性能的Web服务器
讲述:Chrono
时长10:24大小14.28M
进程池
I/O 多路复用
多阶段处理
小结
课下作业
赞 18
提建议
精选留言(32)
- 许童童2019-08-14你是怎么理解进程、线程上下文切换时的成本的,为什么 Nginx 要尽量避免? 当从一个任务切换到另一个任务,当前任务的上下文,如堆栈,指令指针等都要保存起来,以便下次任务时恢复,然后再把另一个任务的堆栈加载进来,如果有大量的上下文切换,就会影响性能。 试着自己描述一下 Nginx 用进程、epoll、模块流水线处理 HTTP 请求的过程。 Nginx 启动进程,一个master,多个worker,创建epoll,监听端口,多路复用来管理http请求,http请求到达worker内部,通过模块流水线处理,最后返回http响应。展开
作者回复: √
共 2 条评论35 - 夏目2019-12-10好像高性能的服务都是这样玩的,nginx这个架构类似于netty中的多线程reactor模式,redis则是单线程reactor
作者回复: nginx也是单线程的,和redis一样自己封装了epoll。单线程的好处是没有race condition,处理简单。 nginx比redis高明的一点是多进程,提高了稳定性和并发能力。
13 - Leon📷2019-08-14一个线程的时间片没用完就系统调用被系统调度切换出去,浪费了剩余的时间片,nginx通过epoll和注册回调,和非阻塞io自己在用户态主动切换上下文,充分利用了系统分配给进程或者线程的时间片,所以对系统资源利用很充分
作者回复: great。
共 2 条评论11 - lesserror2019-12-26老师,以下问题,麻烦回答一下,谢谢: 1. 把进程“绑定”到独立的 CPU 上。意思是一个CPU专门负责管理进程嘛? 2. 不过 master 进程完全是 Nginx 自行用 C 语言实现的,这就摆脱了外部的依赖,简化了 Nginx 的部署和配置。这句话没理解。展开
作者回复: 1.unix/linux有个特别的功能,可以让进程“绑定”在一个cpu上运行,不会被操作系统调度到其他cpu上跑,这样就减少了切换的成本,提高运行效率。不是管理进程的意思。配置指令是“worker_cpu_affinity”。 2.在unix上有很多服务管理程序,比如systemd、supervisor,可以实现进程监控、自动重启等。而Nginx的master进程实现了同样的功能,就不需要这样的外部程序来管理进程,保持服务的稳定性。
8 - 徐海浪2019-08-15多线程就好比一条流水线有多个机械手,把一件事情中途交给其他线程处理,要交接处理中间状态信息。 单进程就好比一条流水线只有一个机械手,切换时间片时暂停状态就可以,不用交接信息,减少无用功,所以效率高。
作者回复: great
6 - fakership2020-08-16老师,有个问题咨询下 虽然nginx是使用了epoll做了io的多路复用,但对于队头阻塞的话感觉并没有帮助啊,因为还是要等io事件回调后发送http响应报文,所以还是阻塞了下一个请求。
作者回复: 是的,但这完全是两个不相关的事情。 队头阻塞是http/1固有的问题,无论是什么web服务器都无法解决,是对单个客户端而言的。 而Nginx的epoll则是解决了多客户端并发请求的问题,避免一个客户端阻塞其他客户端的处理,可以支持海量客户端访问服务器。
6 - -W.LI-2019-08-14老师好!我打算学习nginx,有适合初学者的书推荐么?Java工程师,c全忘了。 线程切换开销:线程切换需要进行系统调用。需要从用户态->内核态->用户态。上下文切换,需要保存寄存器中的信息,以便于完成系统调用后还原现场。会多跑很多指令,出入栈会比寄存器慢很多。相对来说开销就很大了。 nginx和redis一样采用单线程模型。是因为cpu计算不可能是它们瓶颈(所以有些耗cpu资源高的计算不适合放在nginx上做会导致响应时间变长)?进程池+单线程是指,每个worker进程都是单线程是么?展开
作者回复: 1.Nginx的内容很多,看你想学哪方面了。如果是单纯的运维操作网上的资料有很多,如果是想学Nginx开发和源码就看《Nginx完全开发指南》吧。 2.说的很对,看Nginx源码可以学到很多高性能编程的技巧。 3.Nginx里也可以使用多线程,但需要“魔改”。
5 - Aaron2020-06-01对『进程池 + 单线程』的模式还是不太透彻。 我理解,『单线程』指的是所有 HTTP 请求放在同一个线程里通过『I/O 多路复用』的技术处理,实际就是高度集中(无阻塞)地占用了 CPU(核心)地运算能力。 那么,既然请求是单线程的,那进程池地作用又是什么呢?如果是多进程的,不就又回到进程间上下文切换的消耗问题了吗? 另,Nginx 通过 cpu affinity 将进程绑定到 CPU,假设是单 CPU,将三个 worker 进程绑定到同一个物理 CPU 地意义又在哪呢? 个人认为效率最高的方式,是按照 CPU 的核心数量创建一个『线程池』,将所有请求分配到『线程池』内不同的线程,这样在『I/O 多路复用』的加持下能跑满 CPU 的性能。展开
作者回复: 1.单线程理解的很对。进程池里的每个进程都是独立的,崩溃不会影响整体服务,如果是多线程,那么线程崩溃进程也就完蛋了。 2.多进程分散运行在多个cpu上,彼此不干扰,就不会出现进程上下文切换。 3.cpu affinity 是可选的,对于单cpu就没有开启的必要,反而会增加进程切换的成本。 4.刚才说,单进程多线程的缺点就是不够稳定,一个线程出问题,整个进程都受影响。
共 3 条评论3 - J.Smile2020-01-20说一下http2和nginx的多路复用区别和联系: http2的多路复用:多个请求复用同一个连接并行传输数据,且每个请求抽象为流传输的对象为帧序列。 nginx的IO多路复用:将多个线程的请求打散,汇入同一个线程中传输,epoll监听到事件通道可读或者可写的时候取出或者写入数据,所以nginx的IO多路复用是基于linux内核epoll实现的一种事件监听机制,是NIO非阻塞IO。展开
作者回复: 说的很好。
3 - Leon📷2019-08-14切换cpu需要保存线程的上下文,然后再切回去,这是开销
作者回复: √
共 3 条评论3 - 脱缰的野马__2021-03-20老师你好,tomcat不主流吗?
作者回复: tomcat应该算是java容器吧,主要是实现业务,不是专门的web服务器。
2 - 皮特尔2020-07-09Nginx这种异步处理方式叫“协程”吧?
作者回复: 不是。 Nginx是用纯C开发的,里面没有协程的概念,它内部用的是epoll事件机制,reactor并发模式,有ready事件就回调。 OpenResty把lua的协程和epoll事件机制结合在了一起,但两者还是不能混为一谈。
共 3 条评论2 - 阿锋2019-08-14缓存服务器,是属于正向代理还是反向代理,还是根据情况而定。
作者回复: 正向代理和反向代理是根据它所在的位置来定义的,靠近客户端就是正向,靠近服务器就是反向。 代理与缓存是不相关的,代理可以没有缓存功能。
共 3 条评论2 - zyd-githuber2022-03-09感觉和nodejs的单线程机制非常像
作者回复: Nginx可是2002年就开始开发了。
1 - 忧天小鸡2021-12-30这里说的nx的epoll是指模仿epoll的交互逻辑,还是指从epoll的base上做了对tcp的改装?
作者回复: Nginx调用操作系统的epoll接口,来处理tcp事件,本质上epoll和tcp没有直接关系,但tcp会有读写事件,就可以利用epoll来处理。
1 - 功夫熊猫2021-10-27线程上下文的切换消耗感觉主要是用户态和内核态不断切换。也就是堆栈,指令指针之类的。
作者回复: 对,CPU要保存当前状态,再恢复原来的状态,但当线程多的时候,累积的成本就很高了。
共 2 条评论1 - zero2020-04-29老师,您好,我想写博客,我写的博客里面能盗一下您的图么(您的图做的太直观了一看就懂了),我会著名图片的出处😇😇
作者回复: 这个要联系极客时间吧,版权在他们那里。
2 - 萤火之森2023-01-03 来自北京多进程 对缓存管理的数据竞争如何处理?
作者回复: 感兴趣可以看Nginx的源码,这个问题太大了,不太好细说。
- 三千世界2021-11-29老师我想问一下,nginx为什么要设计让多个worker进程竞争accpet,这样导致 惊群 问题,还要加锁来解决,反而造成了性能下降。 所以,为什么不让master通过epoll监听有连接可以accept,通过调度,找一个不怎么忙的worker,然后通过管道通知这个worker呢,这样就不会出现惊群问题了
作者回复: accept mutex设计的目的是多worker进程之间负载均衡,避免有的worker处理的连接太多。 初衷是好的,在NGINX初期也确实很有效果,但到了现在,并发越来越多,它的锁成本就显得高了。 目前NGINX不推荐使用accept mutex,而是改用Linux系统内核的reuseport来实现负载均衡。 你说的master监听的方式是很传统的做法,效率更低。
共 2 条评论 - 爱编程的运维2021-11-05老师您好,nginx采用IO多路复用技术,使用单线程处理多个IO流数据流 是不是也可以多线程+IO多路复用技术?多个线程处理多个IO数据流
作者回复: 当然可以,像envoy,还有NGINX Unit都是多线程+io多路复用。