15 | Lock和Condition(下):Dubbo如何用管程实现异步转同步?
下载APP
关闭
渠道合作
推荐作者
15 | Lock和Condition(下):Dubbo如何用管程实现异步转同步?
2019-04-02 王宝令 来自北京
《Java并发编程实战》
课程介绍
讲述:王宝令
时长09:07大小8.33M
在上一篇文章中,我们讲到 Java SDK 并发包里的 Lock 有别于 synchronized 隐式锁的三个特性:能够响应中断、支持超时和非阻塞地获取锁。那今天我们接着再来详细聊聊 Java SDK 并发包里的 Condition,Condition 实现了管程模型里面的条件变量。
在很多并发场景下,支持多个条件变量能够让我们的并发程序可读性更好,实现起来也更容易。例如,实现一个阻塞队列,就需要两个条件变量。
那如何利用两个条件变量快速实现阻塞队列呢?
一个阻塞队列,需要两个条件变量,一个是队列不空(空队列不允许出队),另一个是队列不满(队列已满不允许入队),这个例子我们前面在介绍管程的时候详细说过,这里就不再赘述。相关的代码,我这里重新列了出来,你可以温故知新一下。
不过,这里你需要注意,Lock 和 Condition 实现的管程,线程等待和通知需要调用 await()、signal()、signalAll(),它们的语义和 wait()、notify()、notifyAll() 是相同的。但是不一样的是,Lock&Condition 实现的管程里只能使用前面的 await()、signal()、signalAll(),而后面的 wait()、notify()、notifyAll() 只有在 synchronized 实现的管程里才能使用。如果一不小心在 Lock&Condition 实现的管程里调用了 wait()、notify()、notifyAll(),那程序可就彻底玩儿完了。
Java SDK 并发包里的 Lock 和 Condition 不过就是管程的一种实现而已,管程你已经很熟悉了,那 Lock 和 Condition 的使用自然是小菜一碟。下面我们就来看看在知名项目 Dubbo 中,Lock 和 Condition 是怎么用的。不过在开始介绍源码之前,我还先要介绍两个概念:同步和异步。
同步与异步
我们平时写的代码,基本都是同步的。但最近几年,异步编程大火。那同步和异步的区别到底是什么呢?通俗点来讲就是调用方是否需要等待结果,如果需要等待结果,就是同步;如果不需要等待结果,就是异步。
比如在下面的代码里,有一个计算圆周率小数点后 100 万位的方法pai1M(),这个方法可能需要执行俩礼拜,如果调用pai1M()之后,线程一直等着计算结果,等俩礼拜之后结果返回,就可以执行 printf("hello world")了,这个属于同步;如果调用pai1M()之后,线程不用等待计算结果,立刻就可以执行 printf("hello world"),这个就属于异步。
同步,是 Java 代码默认的处理方式。如果你想让你的程序支持异步,可以通过下面两种方式来实现:
调用方创建一个子线程,在子线程中执行方法调用,这种调用我们称为异步调用;
方法实现的时候,创建一个新的线程执行主要逻辑,主线程直接 return,这种方法我们一般称为异步方法。
Dubbo 源码分析
其实在编程领域,异步的场景还是挺多的,比如 TCP 协议本身就是异步的,我们工作中经常用到的 RPC 调用,在 TCP 协议层面,发送完 RPC 请求后,线程是不会等待 RPC 的响应结果的。可能你会觉得奇怪,平时工作中的 RPC 调用大多数都是同步的啊?这是怎么回事呢?
其实很简单,一定是有人帮你做了异步转同步的事情。例如目前知名的 RPC 框架 Dubbo 就给我们做了异步转同步的事情,那它是怎么做的呢?下面我们就来分析一下 Dubbo 的相关源码。
对于下面一个简单的 RPC 调用,默认情况下 sayHello() 方法,是个同步方法,也就是说,执行 service.sayHello(“dubbo”) 的时候,线程会停下来等结果。
如果此时你将调用线程 dump 出来的话,会是下图这个样子,你会发现调用线程阻塞了,线程状态是 TIMED_WAITING。本来发送请求是异步的,但是调用线程却阻塞了,说明 Dubbo 帮我们做了异步转同步的事情。通过调用栈,你能看到线程是阻塞在 DefaultFuture.get() 方法上,所以可以推断:Dubbo 异步转同步的功能应该是通过 DefaultFuture 这个类实现的。
调用栈信息
不过为了理清前后关系,还是有必要分析一下调用 DefaultFuture.get() 之前发生了什么。DubboInvoker 的 108 行调用了 DefaultFuture.get(),这一行很关键,我稍微修改了一下列在了下面。这一行先调用了 request(inv, timeout) 方法,这个方法其实就是发送 RPC 请求,之后通过调用 get() 方法等待 RPC 返回结果。
DefaultFuture 这个类是很关键,我把相关的代码精简之后,列到了下面。不过在看代码之前,你还是有必要重复一下我们的需求:当 RPC 返回结果之前,阻塞调用线程,让调用线程等待;当 RPC 返回结果后,唤醒调用线程,让调用线程重新执行。不知道你有没有似曾相识的感觉,这不就是经典的等待 - 通知机制吗?这个时候想必你的脑海里应该能够浮现出管程的解决方案了。有了自己的方案之后,我们再来看看 Dubbo 是怎么实现的。
调用线程通过调用 get() 方法等待 RPC 返回结果,这个方法里面,你看到的都是熟悉的“面孔”:调用 lock() 获取锁,在 finally 里面调用 unlock() 释放锁;获取锁后,通过经典的在循环中调用 await() 方法来实现等待。
当 RPC 结果返回时,会调用 doReceived() 方法,这个方法里面,调用 lock() 获取锁,在 finally 里面调用 unlock() 释放锁,获取锁后通过调用 signal() 来通知调用线程,结果已经返回,不用继续等待了。
至此,Dubbo 里面的异步转同步的源码就分析完了,有没有觉得还挺简单的?最近这几年,工作中需要异步处理的越来越多了,其中有一个主要原因就是有些 API 本身就是异步 API。例如 websocket 也是一个异步的通信协议,如果基于这个协议实现一个简单的 RPC,你也会遇到异步转同步的问题。现在很多公有云的 API 本身也是异步的,例如创建云主机,就是一个异步的 API,调用虽然成功了,但是云主机并没有创建成功,你需要调用另外一个 API 去轮询云主机的状态。如果你需要在项目内部封装创建云主机的 API,你也会面临异步转同步的问题,因为同步的 API 更易用。
总结
Lock&Condition 是管程的一种实现,所以能否用好 Lock 和 Condition 要看你对管程模型理解得怎么样。管程的技术前面我们已经专门用了一篇文章做了介绍,你可以结合着来学,理论联系实践,有助于加深理解。
Lock&Condition 实现的管程相对于 synchronized 实现的管程来说更加灵活、功能也更丰富。
结合我自己的经验,我认为了解原理比了解实现更能让你快速学好并发编程,所以没有介绍太多 Java SDK 并发包里锁和条件变量是如何实现的。但如果你对实现感兴趣,可以参考《Java 并发编程的艺术》一书的第 5 章《Java 中的锁》,里面详细介绍了实现原理,我觉得写得非常好。
另外,专栏里对 DefaultFuture 的代码缩减了很多,如果你感兴趣,也可以去看看完整版。
Dubbo 的源代码在Github 上,DefaultFuture 的路径是:incubator-dubbo/dubbo-remoting/dubbo-remoting-api/src/main/java/org/apache/dubbo/remoting/exchange/support/DefaultFuture.java。
课后思考
DefaultFuture 里面唤醒等待的线程,用的是 signal(),而不是 signalAll(),你来分析一下,这样做是否合理呢?
欢迎在留言区与我分享你的想法,也欢迎你在留言区记录你的思考过程。感谢阅读,如果你觉得这篇文章对你有帮助的话,也欢迎把它分享给更多的朋友。
分享给需要的人,Ta购买本课程,你将得18元
生成海报并分享
赞 41
提建议
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
上一篇
14 | Lock和Condition(上):隐藏在并发包中的管程
下一篇
16 | Semaphore:如何快速实现一个限流器?
精选留言(99)
- ZOU志伟2019-04-03不合理,会导致很多请求超时,看了源码是调用signalAll()
作者回复: 写这一章的时候还是signal,后来有人提了个bug,就改成signalall了
共 20 条评论148 - 张天屹2019-04-04我理解异步的本质是利用多线程提升性能,异步一定是基于一个新开的线程,从调用线程来看是异步的,但是从新开的那个线程来看,正是同步(等待)的,只是对于调用方而言这种同步是透明的。正所谓生活哪有什么岁月静好,只是有人替你负重前行。
作者回复: 总结的太有文采了!异步加上非阻塞IO才有威力
共 11 条评论109 - 右耳听海2019-04-28in the method of org.apache.dubbo.remoting.exchange.support.DefaultFuture#doReceived, I think we should call done.signalAll() instead of done.signal() ,and it's unnecessary to check done != null because it's always true
作者回复: 留言这两点有同学都提到了。我表示震撼!
49 - 天涯煮酒2019-04-02合理。 每个rpc请求都会占用一个线程并产生一个新的DefaultFuture实例,它们的lock&condition是不同的,并没有竞争关系 这里的lock&condition是用来做异步转同步的,使get()方法不必等待timeout那么久,用得很巧妙展开共 9 条评论44
- 10buns2019-04-04signal唤醒任意一个线程竞争锁,signalAll唤醒同一个条件变量的所有线程竞争锁。但都只有一个线程获得锁执行。区别只是被唤醒线程的数量。 所以用signalall可以避免极端情况线程只能等待超时,看了代码也是替代了signal共 3 条评论29
- 密码1234562019-04-02不一定。如果这个类是单例,那就不合理。如果是一个实例对应一个请求,那就合理。共 1 条评论20
- Geek_e6f3ec2019-05-15老师关于dubbo源码的执行流程有一点疑问。 以下是源码 // 调用通过该方法等待结果 Object get(int timeout){ long start = System.nanoTime(); lock.lock(); try{ while (!isDone()){ done.wait(timeout); // 在这里调用了等待方法后面的代码还能执行吗? 我理解的管程,是在条件变量等待队列中阻塞等待,被唤醒之后也不是马上执行也要去管程入口等待队列,也就是lock.lock处等待获取锁。 老师是这样的吗? long cur = System.nanoTime(); if (isDone()||cur-start> timeout){ break; } } }finally { lock.unlock(); } return returnFromResponse(); }展开
作者回复: 会去获取锁,但是获取锁后,会执行wait后的代码
共 4 条评论19 - 牧名2019-05-04DefaultFuture本质上只是一种future实现,所以理论上可以有多个线程同时持有同一个future并调用 get方法,如这时候使用signal()就有可能导致有些线程会请求超时 ```java DefaultFuture future = currentClient.request(inv, timeout); for(int i=0; i< 10000; i++) { new Thread(new Runnable() { @Override public void run() { System.out.println(future.get().toString()); } }); }16
- 杨鹏程baci2019-06-30老师好,关于我看到你说改成signalall()是优化了,但是我还是不明白如果用signal()可能会带来什么问题,具体优化体现在哪个方面,感觉从代码上出发,done是一个私有对象,也并不存在多个线程共享的问题,用signal()貌似也是够了的吧?共 4 条评论15
- 约书亚2019-04-06我有点不理解为什么这么多说合理的同学,Future这种类不应该经常由于用在闭包中,导致在多线程多上下文中传递嘛?如果我有多个线程都对同一个DefaultFuture实例调用get,而每个被唤醒的线程又不signal其他线程,那不就是只有一个线程最终会被唤醒,其他调用get的线程都是因为超时获取到的结果嘛?共 1 条评论13
- 苏格拉底232019-06-23老师您好! 有一个基本的问题不明白,如果每个request对应一个线程,似乎并没有用到共享的资源,那么为什么要加锁呢?
作者回复: 这里只是利用管程实现线程的阻塞和唤醒
共 2 条评论11 - 右耳听海2019-04-28我看每个请求都会新建一个DefaultFuture,这个按道理应该只有一个线程阻塞,为什么需要signall共 1 条评论9
- ban2019-04-03老师,求指教 DefaultFuturewhile这个类为什么要加 while(!isDone()) 这个条件,我看代码while里面加了done.await(timeout);是支持超时的,就是说设置5秒超时, if (isDone() || cur-start > timeout){,只要超过没有被signal()唤醒,那5秒就会自动唤醒,这时候就会在if (isDone() || cur-start > timeout){ 被校验通过,从而break,退出。这时候在加个while条件是不是没必要。 还是说加个while条件是因为时间到点的时候自动唤醒后,Response可能是空,而且时间cur-start > timeout 不超时,所以才有必要进行while再一次判断isDone()是否有值。展开
作者回复: while条件是编程范式,可以回去看管程原理,搞工程要多重防护。超时后当然很有可能resp是空的
8 - 水目沾2019-04-02这是一对一的关系,肯定只需要 signal。每个线程都是相互独立的,lock 和 condition 也是各自独享的。
作者回复: 一对一的关系用signalall也不是不可以
6 - 行者2020-06-02找到了issue地址 https://github.com/apache/dubbo/issues/36785
- 苏夏ぃ2019-07-262.7.3版本以及不用lock和signal了共 1 条评论5
- ycfHH2019-05-06作为一个完全不懂dubbo的新人,我很好奇是什么bug能让signal改成signalAll,因为不管怎么看都感觉signal就已经可以了啊(虽然使用signalall也不错)
作者回复: 优化而已
共 3 条评论5 - 一道阳光2019-04-02回复:密码12345同学,如果是单例对象,response岂不是乱套了,每一个请求都对应自己的 response。另外singal()是合理的。因为每一个主线程对应一个子线程,不可能存在一个子线程对应多个请求。5
- Geek_c139e02021-12-15翻了一遍旧版本的代码,如果让我来选,我认为signalAll是一种防呆设计可以应用,因为保不齐有不了解并发编程的人会多个线程跑同一个DefaultFuture实例。 但是我也认为DefaultFuture使用signal是没有问题的,在封装里面不论是Channel还是FutureAdapter都是保证new去对应请求的,而且编程规范也认为一个请求要对应一个响应而不是一个请求多个响应去竞争。 在看旧版本代码的时候,就在想如果实现保证好一一对应,这个lock甚至都可以不需要,这里只是单纯用lock&condition实现阻塞等待返回结果,实际上这个功能是有很多办法可以实现的。后来看新版果不其然已经变成了id+TimerTask做心跳机制,去掉了这个加锁和阻塞。展开4