11 | 如何实现高性能的异步网络传输?
11 | 如何实现高性能的异步网络传输?
讲述:李玥
时长10:17大小11.77M
理想的异步网络框架应该是什么样的?
使用 Netty 来实现异步网络通信
使用 NIO 来实现异步网络通信
小结
思考题
赞 18
提建议
精选留言(47)
- 游弋云端2019-08-15关于JAVA的网络,之前有个比喻形式的总结,分享给大家: 例子:有一个养鸡的农场,里面养着来自各个农户(Thread)的鸡(Socket),每家农户都在农场中建立了自己的鸡舍(SocketChannel) 1、BIO:Block IO,每个农户盯着自己的鸡舍,一旦有鸡下蛋,就去做捡蛋处理; 2、NIO:No-Block IO-单Selector,农户们花钱请了一个饲养员(Selector),并告诉饲养员(register)如果哪家的鸡有任何情况(下蛋)均要向这家农户报告(select keys); 3、NIO:No-Block IO-多Selector,当农场中的鸡舍逐渐增多时,一个饲养员巡视(轮询)一次所需时间就会不断地加长,这样农户知道自己家的鸡有下蛋的情况就会发生较大的延迟。怎么解决呢?没错,多请几个饲养员(多Selector),每个饲养员分配管理鸡舍,这样就可以减轻一个饲养员的工作量,同时农户们可以更快的知晓自己家的鸡是否下蛋了; 4、Epoll模式:如果采用Epoll方式,农场问题应该如何改进呢?其实就是饲养员不需要再巡视鸡舍,而是听到哪间鸡舍的鸡打鸣了(活跃连接),就知道哪家农户的鸡下蛋了; 5、AIO:Asynchronous I/O, 鸡下蛋后,以前的NIO方式要求饲养员通知农户去取蛋,AIO模式出现以后,事情变得更加简单了,取蛋工作由饲养员自己负责,然后取完后,直接通知农户来拿即可,而不需要农户自己到鸡舍去取蛋。展开
作者回复: 这个比喻非常赞👍
共 8 条评论276 - 钱2019-08-23课后思考及建议 没有对比就没有伤害,尤其对于学习,对比一下就知道那个课程优秀,那个更优秀。 首先,我觉得如何实现高性能的网络通信,是必须要讲的,这个原理是脱离具体语言的,和什么实现框架也没什么关系。 不过篇幅有限老师只能讲解一下她的精髓,如果想一点点弄明白,建议看看李林峰大哥的《netty权威指南(第二版)》她用了三章来讲解网络通信模型的演进。 另外,我同时在学kafka的专栏,我发现一个现象,两位老师都没有先将一个消息的全生命历程先细致的讲一下,学习过丁奇老师的MySQL,他上来就讲解了一下一个SQL语句是怎么执行的。我觉得很有整体感,知道整个过程之后其实下面再细致的讲解都是性能优化的事情啦! 我猜想其他各种系统,尤其是和数据打交道的都类似,只要一个完整的流程知道了,下面好多知识都是在为这个系统的性能、健壮性、高可用性、自身的其他特性在加强。 所以,我提过这样的问题,也建议先讲一下一条消息从发送到接收都经历了那些关键环节或组件,对一条消息的全生命历程有个整体的认识。然后再讲每个关键环节为什么这么实现,其性能最佳吞吐量最高。然后再讲各个组件是怎么紧密配合的,如果我知道一个软件是什么?又清楚他由什么组成?每一部分为什么如此设计?那些设计是通用的那些设计比较独特?我觉得我就理解了这个软件 老师的课程非常优秀,哈哈,我觉得听了我的建议还可以再优秀一点点展开
作者回复: 感谢你的建议!
共 5 条评论56 - 芥末小龙2019-08-16玥哥秋安:我今天看了这个课程我觉得就有同学要说,老师你是不是跑题了,首先我要说一下为什么要说今天这讲课,并且用netty来举栗子。 第一:了解一下异步网络传输的原理 第二:用Netty来举栗子是因为Netty提供异步的、事件驱动的网络应用程序框架和工具,用以快速开发高性能、高可靠性的网络服务器和客户端程序。 第三:rocketMQ的底层就是用Netty实现的。 第四:可以看一下第9节课如果学习开源代码,然后在看一下rocketMQ的源码。然后根据MQ的Producer,Consumer,Broker,NameSrv等的底层实现是不是理解了玥哥的良苦用心。 个人见解勿喷!展开共 1 条评论28
- 业余草2019-08-15多回到队列上来吧。Netty几乎很多Java课都会讲到。。。
作者回复: 我们还是需要一个例子能让大家理解异步网络传输的。
共 5 条评论24 - 喜欢地球的阿培同学2020-04-20老师您好,我上周问了你2个问题。 分别在第17讲和第11讲 第一个问题: 一个是100个线程,1个线程在运行,99个线程在阻塞(等待锁释放),会不会造成线程频繁上下文切换。你回答的是不会。 第二个问题: 我又问了一个 Selector.select()方法是一个阻塞方法,这个线程会一直卡在这儿。你的回答我理解过后是会造成线程上下文切换 那为什么第一个问题不会造成线程上下文频繁切换呢? 是因为底层操作系统的原因吗? 而普通的socket连接阻塞,是会造成线程上下文切换?展开
作者回复: 方法在阻塞时,你要区分它的线程状态,如果是你说的等待锁,那线程的状态是waiting,是不会申请cpu时间片的,那就不会上下文切换。 如果是这个方法呢: void blockMethod() { while(....) {doSomeThing();} } 对于这个调用者看来,也是阻塞在这个调用这个blockMethod方法上了,但是线程是RUNNING状态,这个时候肯定是要申请CPU时间片的。 Selector.select()在阻塞时,它的内部实现根据操作系统和epoll的配置不同,实际上有好几种实现,不同的实现行为也不一样。
14 - 喜欢地球的阿培同学2020-04-16最后文中有一段话: "Selecor 通过一种类似于事件的机制来解决这个问题。首先你需要把你的连接,也就是 Channel 绑定到 Selector 上,然后你可以在接收数据的线程来调用 Selector.select() 方法来等待数据到来。这个 select 方法是一个阻塞方法,这个线程会一直卡在这儿,直到这些 Channel 中的任意一个有数据到来,就会结束等待返回数据。" 这个 select 方法是一个阻塞方法,这个线程会一直卡在这儿,岂不是和上篇文章的同步转账类似,该线程会处于等待状态,无法充分利用cpu资源。展开
作者回复: Selector本身是阻塞的,但它只需要阻塞一个线程,就可以等待多个socket连接,任何一个连接有数据进来就会解除阻塞。这就是所谓的“多路复用”。
共 2 条评论8 - 达文西2019-10-10关于同步/异步,阻塞/非阻塞的定义,可以参考这篇博客https://www.cnblogs.com/dolphin0520/p/3916526.html共 2 条评论8
- linqw2019-08-15学习完高性能网络传输,写下自己的理解和疑惑,老师有空帮忙看下哦 Netty服务端会存在两个线程池NioEventLoopGroup,一个线程池主要用来处理客户端的连接,一般设置单线程NioEventLoop,在Linux中可能是EpollEventLoop,要是服务端监控多个端口可以设置多个线程,服务端接收到客户端的连接会创建Channel通道,Channel通道中会有收发缓存,服务端会定时监控Channel通道是否已经断开,在一定时间没有收到客户端的心跳包,把客户端的Channel从服务端移除,还可以设置服务端接收连接的队列,还有一个处理线程池NioEventLoopGroup,里面会有多个线程NioEventLoop,然后每个NioEventLoop都会有一个Selector,然后可以多个channel绑定到NioEventLoop的Selector中,即一个Channel只能被一个NioEventLoop处理,一个NioEventLoop可以处理多个Channel,即收到Channel数据,NioEventLoop执行Handler,包括解码、拆包等Handler,服务端返回响应消息对Channel进行编码等Handler。 尝试回答下课后习题接收数据这个流程Netty是一个NioEventLoop会有一个Selector,原先的Nio是只有一个Selector进行处理所有的连接收发事件,这样的话比如NioEventLoopGroup中有10个NioEventLoop,这样的话就有10个Selector,比如有10000读写请求,每个Selector就可以维持1000展开共 1 条评论6
- 青禾qingh2020-05-11老师,nio不是异步的吧,我理解是同步非阻塞的,当然非阻塞也仅仅是指读写数据的时候,select也是阻塞的,我理解aio才是异步的
作者回复: 严格来说,是这样的。
共 3 条评论6 - 川杰2019-08-15老师,以下是我的理解:异步网络框架中,通过线程池处理接收消息的情况,和同步相比,好处在于,同步框架下,一个连接必须有两个线程(等数据的线程、处理数据的线程),当连接过多时会有大量频繁的上下文切换;而异步框架利用线程池接管了(等数据的线程)的作用,减少了上下文切换、线程的创建销毁的开销; 问题是:虽然线程池完成了数据接收的功能,但加入消息发送方发来了大量的消息,因为线程池的线程数量毕竟是有限的,此时是否就会出现消息不能及时转发给数据处理线程的情况呢?展开
作者回复: 你说的这个问题是有可能出现的。
共 2 条评论4 - leslie2019-08-15Java基础太差:几乎不懂;故而其实本课程学习让我觉得越多Java相关的非常吃力,希望老师后面的课程里面纯Java的东西能浅一点或者告知Java的理解大概要什么水平。 刘超老师的趣谈linux在跟着学、张磊的深入剖析Kubernetes目前学了一遍。我想从用这种方式去理解或解释不知道原理是否类似正确吧:希望老师提点或者下堂课时解答。 其实Netty基于NIO就像Kubernetes其实是基于Cgroup和Namespace一样:其实Netty是使用了NIO的Selecor去处理线程的异步机制,Netty在它的基础上去优化了其线程控制和连接管理并追加了缓存管理,请老师指正;谢谢。 努力跟着学习,努力跟着做题;希望完课的时候能从另外一个高度/层次去理解和使用消息队列。展开
作者回复: 放心,我们这门课使用的任何语言都不会特别深入,更多的是讲实现原理,语言只是讲解和举例的载体。
4 - 王飞20232019-08-151 本文按理说应该讲的是消息队列中网络的使用,但是实际作者讲的是java的网络基础编程和netty的入门介绍。 2 实际的网络传输,比如rocketmq在发送端也是异步的,而不是同步。 3 对于java的BIO,NIO,包括netty的入门demo,网上文章很多。如何在消息队列的中间件开发中,能高效使用netty,或者说NIO,也不是一件容易的事。展开共 1 条评论3
- oscarwin2019-08-15不小心发出去了,继续上一个回答。Netty使用了NIO的IO多路复用能力,采用线程池来增加对多核CPU的利用。在Linux编程里epoll加非阻塞IO,组成了传说中的reactor模式,那么Netty为每一个线程实现一个reactor,使得这个吞吐量非常强大,对应到C++的框架,就类似muduo网络库了。
作者回复: 其实这些语言中,它们的很多基础类库实现的原理都是一样的。
2 - humor2020-05-17老师,就算是SSD,随机查询的速度也会非常慢吧,那为什么SSD就不用考虑异步呢?
作者回复: 是的,SSD同样是,顺序读写远远比随机读写快。 至于异步的方式并不适合用来读写磁盘,读数据的时候肯定要等待磁盘返回数据,写入的时候,虽然可以用异步写来大幅提升响应时间,但其实牺牲了数据可靠性。
2 - 772020-04-27老师,问个问题,线程在忙着处理收到的数据,这时候 Channel 中又收到了新数据;新数据是下一次遍历Channel时处理吗?
作者回复: 是的,数据会暂存在socket缓冲区中,等待下一次读取。
1 - Spring coming2020-03-13请问老师一个问题,异步回调发生的时候才会占用线程吗,收到回调之前网络连接是不是也需要占用线程来处理啊?从回调发生的时候到回调结束,这里涉及到线程的变化是怎么样的啊
作者回复: 网络连接和线程是二回事儿,在异步网络IO中,网络连接可以不占用线程。 异步回调的时候,执行回调方法这个过程,一定要有一个线程来执行,一般来说,如果回调方法没什么逻辑很快,可以直接在IO线程里面执行,否则需要再做一次异步调用,让单独的回调线程来执行。
1 - Alex2020-01-13读了本节,又在网上查了查NIO的内容。最后理解如下,NIO核心是增加了缓存层,这样就不用一个连接启用一个线程。缓存跟消息队列一样,做了前端连接和后端线程的分离。利用缓存的中转站借助少量线程实现后端业务处理。NIO减少的是后端线程不是前端的请求连接。这点容易迷惑。1
- 杰哥长得帅2019-09-02同步的时候,每个连接都需要阻塞一个线程来等待数据,大量的连接数就会需要相同数量的数据接收线程。当这些 TCP 连接都在进行数据收发的时候,会导致什么情况呢?对,会有大量的线程来抢占 CPU 时间,造成频繁的 CPU 上下文切换,导致 CPU 的负载升高,整个系统的性能就会比较慢。 老师能详细解释下 “大量线程用于数据接收时,为什么又会有大量线程来抢占cpu时间” 吗展开
作者回复: 因为接收数据这些操作都需要cpu来执行。接收数据的这个操作,实际上就是把数据从socket 缓冲区复制到用户程序的内存空间,然后执行用户代码去解析数据等其他业务逻辑,这些操作都需要CPU来执行。
2 - 一步2019-08-15希望老师多讲讲MQ 相关的,不要深入某一个语言某一个类库或者框架进行讲解的,有的同学语言不熟悉,代码也看不懂的,某一个类库或者框架实现的细节也不知道的
作者回复: 我们这节课和接下来的几节课讲的都是实现消息队列必须的一些技术,同学应该重点来理解我们讲解的原理,但是要真正掌握这些原理,还是需要依托与某一个语言或者框架来实际操作一下的。
共 2 条评论1 - i_chase2022-03-19没有必要一直说java...