极客时间已完结课程限时免费阅读

13 | 传输协议:应用程序之间对话的语言

13 | 传输协议:应用程序之间对话的语言-极客时间

13 | 传输协议:应用程序之间对话的语言

讲述:李玥

时长09:07大小12.51M

你好,我是李玥。
经过前面几课的学习,我们已经可以实现高性能的结构化数据传输了。不过,应用程序之间要想互相通信,一起配合来实现业务功能,还需要有一套传输协议来支持。
传输协议就是应用程序之间对话的语言。设计传输协议,并没有太多规范和要求,只要是通信双方的应用程序都能正确处理这个协议,并且没有歧义就好了。
这节课,我们就来说一下设计高性能传输协议的一些方法和技巧。

如何“断句”?

既然传输协议也是一种语言,那么在应用程序之间“通话”的过程中,与我们人类用自然语言沟通有很多相似之处,但是需要处理的问题却又不同。
现代语言,无论是汉语还是英语,都是通过标点符号来分隔句子的,这个叫“断句”。古代汉语是没有标点符号的,断句全靠上下文,但这种断句方式有的时候会出现歧义,比如很著名的那个段子“下雨天留客天天留我不留”,不同的断句方式,意思完全不一样。
我们在传输数据的的时候,首先要解决的就是断句问题。对于传输层来说,收到的数据是什么样的?就是一段一段的字节,但是,因为网络的不确定性,你收到的分段并不一定是我们发出去的分段。比如我们发送的数据是这样的:
下雨天 留客天 天留 我不留
这样断句,意思就是,作为主人我不想让你在我这儿住。
经过网络传输,可能就变成这样了:
下雨天 留客天 天留我不 留
意思完全变了,客人想赖在这儿不走了。
所以,靠时间停顿来断句是不靠谱的。
你可能会想到,那我们在协议中也加上“标点符号”不就行了?而且,我们并不需要像自然语言中那么多种标点符号,只需要定义一个分隔符就可以了。
这个办法是可行的,也有很多传输协议采用这种方法,比如 HTTP1 协议,它的分隔符是换行(\r\n)。但是,这个办法有一个问题比较难处理,在自然语言中,标点符号是专用的,它没有别的含义,和文字是有天然区分的。
在数据传输的过程中,无论你定义什么字符作为分隔符,理论上,它都有可能会在传输的数据中出现。为了区分“数据内的分隔符”和真正的分隔符,你必须得在发送数据阶段,加上分隔符之前,把数据内的分隔符做转义,收到数据之后再转义回来。这是个比较麻烦的过程,还要损失一些性能。
更加实用的方法是,我们给每句话前面加一个表示这句话长度的数字,收到数据的时候,我们按照长度来读取就可以了。比如:
03 下雨天 03 留客天 02 天留 03 我不留
这里面我们固定使用 2 位数字来存放长度,每句话最长可以支持到 99 个字。接收后的处理就比较简单了,我们先读取 2 位数字 03,知道接下来的 3 个字是第一句话,那我们接下来就等着这 3 个字都收到了,就可以作为第一句话来处理了,接下来再按照这个方法来读第二句话、第三句话。
这种预置长度的方法就很好解决了断句的问题,并且它实现起来要比分隔符的方法简单很多,性能也更好,是目前普遍采用的一种分隔数据的方法。
掌握了断句的方法之后,我们再来看一下实现高性能协议还需要解决什么问题。

用双工收发协议提升吞吐量

人类之间通过语言来交流时,基本上是处于一种单工通信的状态,也就是我说你听,然后再你说我听这样。如果俩人同时说,那就不是交流了,那是两个外国人在吵架。所谓的单工通信就是,任何一个时刻,数据只能单向传输,一个人说的时候,另外一个人只能听。
HTTP1 协议,就是这样一种单工协议,客户端与服务端建立一个连接后,客户端发送一个请求,直到服务端返回响应或者请求超时,这段时间内,这个连接通道上是不能再发送其他请求的。这种单工通信的效率是比较低的,很多浏览器和 App 为了解决这个问题,只能同时在服务端和客户端之间创建多个连接,这也是没有办法的办法。
单工通信时,一句对一句,请求和响应是按照顺序依次收发,有一个天然的对应关系。比如说,胡同口张大爷和李大爷俩大爷碰上了:
这个图里面,实线是请求,虚线是响应,一问一答,这是单工协议。
我们知道,TCP 连接它是一个全双工的通道,你可以同时进行数据的双向收发,互相是不会受到任何影响的。要提高吞吐量,应用层的协议也必须支持双工通信。
如果说俩大爷有边听边说的本事,换成双工协议后,是这样的:
这时候就出现一个问题,即使俩大爷有这个边听边说的本事,问题和答案可能已经对不上了。在多线程并发的环境下,顺序也没有办法保证,这个对话就有可能变成这样:
在实际上设计协议的时候,我们一般不关心顺序,只要需要确保请求和响应能够正确对应上就可以了。
这个问题我们可以这样解决:发送请求的时候,给每个请求加一个序号,这个序号在本次会话内保证唯一,然后在响应中带上请求的序号,这样就可以把请求和响应对应上了。
加上序号后,俩大爷的就可以实现双工通信了:
张大爷和李大爷可以对自己发出去的请求来编号,回复对方响应的时候,带上对方请求的编号就可以了。这样就解决了双工通信的问题。

小结

这节课我们主要讲了传输协议,在设计传输协议的时候,只要双方应用程序能够识别传输协议,互相交流就可以了,并没有什么一定要遵循的规范。
在设计传输协议的时候,需要解决如何断句的问题,我们给大家提供了“分隔符”和“前置长度”两种断句的方法,你可以选择使用。
另外,我给大家介绍的这种“使用 ID 来标识请求与响应对应关系”的方法,是一种比较通用的实现双工通信的方法,可以有效提升数据传输的吞吐量。
解决了断句问题,实现了双工通信,配合专用的序列化方法,你就可以实现一套高性能的网络通信协议,实现高性能的进程间通信。很多的消息队列、RPC 框架都是用这种方式来实现它们自己的私有应用层传输协议。

思考题

课后,我希望你能真正动手去写代码,用我们这四节课讲到的方法,来实现一个简单的高性能通信程序。功能就是上面两个大爷那三组对话,服务端是张大爷,客户端是李大爷,我们让俩人在胡同口碰见一百万次,记录下总共的耗时。欢迎你在评论区秀出你的总耗时。
在实现过程中,有任何问题,也欢迎你在评论区留言来提问。
感谢阅读,如果你觉得这篇文章对你有帮助的话,也欢迎把它分享给你的朋友。
分享给需要的人,Ta购买本课程,你将得18
生成海报并分享

赞 15

提建议

上一篇
12 | 序列化与反序列化:如何通过网络传输结构化的数据?
下一篇
14 | 内存管理:如何避免内存溢出和频繁的垃圾回收?
 写留言

精选留言(43)

  • Switch
    2019-10-13
    用 netty 实现了,使用了多种 序列化方式实现,差异还是很大的。写出来和知道怎么做,差距还是非常大的,当完整的写完练习,确实把老师讲到的这些知识点都串起来了。序列化框架的选型及接口设计、通讯协议设计、编解码设计、 netty 服务端客户端的处理。 代码在该目录下:https://github.com/Switch-vov/mq-learing/tree/master/src/main/java/com/switchvov/network/chat 整个实现下来,不同的序列化框架,性能差异还是很大的。用 protostuff 性能是最好的。 麻烦老师看看,哪些地方还能再优化。 - fastjson - 遍历10000次,花费:1400ms - 遍历100000次,花费:7272ms - 遍历1000000次,花费:86840ms - protostuff - 遍历10000次,花费:1224ms - 遍历100000次,花费:5381ms - 遍历1000000次,花费:51677ms - kryo - 遍历10000次,花费:1307ms - 遍历100000次,花费:6774ms - 遍历1000000次,花费:102819ms
    展开

    作者回复: 代码结构很清晰,值得大家学习。 优化的建议:可以采用专用序列化方式,另外,你在做测试的时候有没有关闭控制台的打印输出?这个对性能的影响是很大的。

    共 2 条评论
    83
  • 滴流乱转小胖儿
    2019-08-20
    没想到老师居然是个相声演员,通俗易懂,点赞
    共 1 条评论
    56
  • chon
    2019-08-20
    第一篇的内容质量很高,第二篇的目前这几篇文章的内容实在是太基础了。不用动脑,跳着看
    共 2 条评论
    22
  • 晴空
    2019-09-04
    老师请教个问题,tcp协议中已经协商好了最大报文长度,应用协议为什么又要设置一下报文长度呢,期待老师帮忙解惑

    作者回复: 需要注意的是,在OSI七层网络协议栈中,tcp协议是四层(传输层)协议,而我们设计的传输协议都是七层(应用层)协议,下层协议对上层来说是透明的。 通俗的说,tcp包的长度和我们协议中一条消息的长度是完全没有关系的,一个tcp包可能包含n条完整的消息,也可能包含半条消息,或者前后2个半条消息加上中间n条完整的消息,这都是不一定的。

    共 3 条评论
    16
  • oldman
    2019-08-23
    老师,我理解的双工通信,是不是说不管是客户端还是服务端建立好链接之后,双方都可以基于该socket进行收发消息就好了,而不是说服务器只能accept到message之后再做一些处理。

    作者回复: 是这样的。

    13
  • 知己逢知遇
    2019-08-20
    多线程下异步处理一次会话的结果消息体,除了对这次会话的结果消息进行编号,是否也要对分割的消息体进行顺序编号? 电驴,迅雷,p2p这种软件的消息协议大概是什么样的呢?是不是部分协议跟今天老师讲的情况类似? 我是不是可以理解为,在双全功下,我和一个网站就可以建立一条长链接,然后所有的资源请求都通过这条链接进行交换,只要协议正确,就可以保证数据的完整性,正常访问并解析打开的该网站的所有页面。 多线程,异步的io操作,是不是也有自己的协议?
    展开

    作者回复: 你需要了解,协议是分层的,就像我们发快递,我发给你的可能是个手机,对于快递小哥来说,这就是个小包裹,他不关心里面是什么,总之我保证给你把包裹安全的送到站点儿就行了。包裹到了站点儿会分拣装箱,然后用小货车运到机场,对于小货车司机来说,它也不关心车里装的是什么,只要把车安全开到机场就行了。 对于协议来说已是这样在发送的时候一层一层的封装,然后接收的时候再一层一层解封,对于每一层协议来说,他是不知道底层是什么协议的,也不知道上层协议是如何封装的(送件的快递小哥不知道也不关心这个件是怎么到配送站的,也不知道包裹里到底装的啥),只在自己的协议层完成处理即可。

    共 2 条评论
    12
  • 刘天鹏
    2019-08-20
    https://gist.github.com/liutianpeng/85ce524452c8206396c94ab93506deda 一个"胡同"做中转 两个"大爷"TCP连接到胡同 我这个版本的胡同效率有点低 大爷相遇1万次就用了 3.8s

    作者回复: 赞分享代码的同学👍👍👍

    11
  • 许童童
    2019-08-20
    跟着老师把这些基础知识打牢,很喜欢老师这种讲课节奏。
    9
  • Switch
    2019-10-14
    看了加餐之后,重构了下执行逻辑。更改一问一答交互为 主客户端同时发送消息。主客户端根据消息类型答复相应内容。 另外,老师,专用化序列方式在哪能找到借鉴的地方呢? 是的,没关闭输出。关闭输出后,重新测试后的结果如下: - 关闭打印 - fastjson - 遍历10000次,花费:555ms - 遍历100000次,花费:2740ms - 遍历1000000次,花费:28418ms - protostuff - 遍历10000次,花费:440ms - 遍历100000次,花费:2599ms - 遍历1000000次,花费:23991ms - kryo - 遍历10000次,花费:522ms - 遍历100000次,花费:2805ms - 遍历1000000次,花费:28130ms - 没关闭打印 - fastjson - 遍历10000次,花费:1400ms - 遍历100000次,花费:7272ms - 遍历1000000次,花费:86840ms - protostuff - 遍历10000次,花费:1224ms - 遍历100000次,花费:5381ms - 遍历1000000次,花费:51677ms - kryo - 遍历10000次,花费:1307ms - 遍历100000次,花费:6774ms - 遍历1000000次,花费:102819ms 老师加餐中给的示例代码,在我电脑上 10W 次,在 [8,12]s 这个区间 代码在该目录下:https://github.com/Switch-vov/mq-learing/tree/master/src/main/java/com/switchvov/network/chat
    展开

    作者回复: 可以参考一下加餐这节课中的序列化代码。

    共 3 条评论
    6
  • A9
    2019-08-20
    看了直播,没想到老师你是这样的人 所以,到底谁快?

    作者回复: 同学当然是你最快呀!😏

    5
  • learn more
    2019-08-20
    redis 的 aof 文件好像就是老师说的 前置长度,瞬间觉得经典无处不在
    共 2 条评论
    5
  • 大白先生
    2019-08-21
    老师,那在一次会话过程中,开头的先是唯一序列号么。然后后面跟的是数据长度,再然后是内容么。那接到消息的一方,该如何分辨序列号的长度大小,做到区分序列号和内容前的数据长度信息?

    作者回复: 开头是数据长度,序号也是数据的一部分,所以应该在长度之后。

    共 2 条评论
    4
  • 花子翁
    2020-04-30
    通过预设长度的方式来断句,不会出现分隔符同样的问题吗? 因为预设长度的信息,理论上也会同样出现在数据内容本身,那如何进行区分呢?

    作者回复: 只要数据没有在传输途中被篡改,预设长度断句就总是有效的。 比如,我们约定长度为int类型,占4个字节。从连接建立开始,收到的一个4个字节,一定是第一句的长度。每读取一句之后,接下来的4个字节,一定是下一句的长度,以此类推。

    共 2 条评论
    3
  • 夜空中最亮的星
    2019-08-26
    京味十足,😄
    3
  • 宋晓明
    2019-08-21
    老师,昨天您的直播我看了 但心中一直有个疑问:一般架构师coding能力非常强,尤其是java,现在很多招聘要求都是java架构师,目前本人擅长的语言是python和go,说实话 java虽好,但本人很不喜欢,是不是我与架构师就无缘了??

    作者回复: 跟语言关系不大,其实各种编程语言背后的实现原理都是差不多的。一般的大厂的架构师职位对语言也没有强要求,而且很多架构师都是掌握多门编程语言的。

    3
  • 冰激凌的眼泪
    2019-08-20
    看到过tlv的说法: tag length value
    共 3 条评论
    3
  • 花里胡哨
    2019-09-26
    https://gist.github.com/mrpanc/de206c835abb6a5e9b78c6555b46976d 交一波作业。同步模式,10万次7.463167328s

    作者回复: 👍👍👍

    1
  • coffee
    2019-08-22
    代码见 [email protected]:swgithub1006/-geektime-mqstudy.git ,采用netty实现。 机器是4核,server 端 bossGroup = new NioEventLoopGroup(8); workerGroup = new NioEventLoopGroup(1); client端有8个channel.机器上同时跑server和client。以下是相遇次数和执行耗时。 相遇次数 执行耗时(秒) 10000 2 100000 5 1000000 不稳定(min 65 , max 100)
    展开

    作者回复: 协议部分设计的非常好。 Netty的使用也非常熟练。 使用了8组连接并发,实际的性能要除以8哦。 这是单工通信还是双工通信呢? 最后,使用减号开头的项目名称对*nix用户严重不友好啊。

    共 2 条评论
    1
  • 奇奇
    2019-08-22
    如果发送网络时序出现问题,怎么办?

    作者回复: 一般来说,只要请求和响应能对上就可以了,在网络上传输的这些请求和响应,并不需要严格有序。

    共 2 条评论
    1
  • A9
    2019-08-21
    https://github.com/WangYangA9/netty-FullDuplex-example 作业写完啦,大概时长5秒左右,有待优化,使用netty框架,协议使用Kryo序列化协议(类似上面的例子,4字节表示数据长度,后续记录对应长度数据)。 为了模拟真实的顺序相应,做了很多同步等待,包括每次tcp连接的断开也进行了同步。 客户端什么时候断开连接稍微想了一下。开始的时候,由于消息没收完就断开了连接导致报错。最后实现方案是,收到三条该收的信息后,断开连接。但是这样的代价是,没找到ChannelFuture有类似then的毁掉方法,addListener反而导致性能下降,因此选择同步等待后,再将任务状态置为true,这些等待应该是可以后续优化的点。 请问老师,用什么方式判断一次碰面的3次收发都结束了比较好呢?
    展开

    作者回复: 可以考虑用Barrier或者更简单的CountDownLatch来解决你的问题。

    1