极客时间已完结课程限时免费阅读

第33讲 | 基于XML的SOAP协议:不要说NBA,请说美国职业篮球联赛

第33讲 | 基于XML的SOAP协议:不要说NBA,请说美国职业篮球联赛-极客时间

第33讲 | 基于XML的SOAP协议:不要说NBA,请说美国职业篮球联赛

讲述:刘超

时长09:11大小4.21M

上一节我们讲了 RPC 的经典模型和设计要点,并用最早期的 ONC RPC 为例子,详述了具体的实现。

ONC RPC 存在哪些问题?

ONC RPC 将客户端要发送的参数,以及服务端要发送的回复,都压缩为一个二进制串,这样固然能够解决双方的协议约定问题,但是存在一定的不方便。
首先,需要双方的压缩格式完全一致,一点都不能差。一旦有少许的差错,多一位,少一位或者错一位,都可能造成无法解压缩。当然,我们可以用传输层的可靠性以及加入校验值等方式,来减少传输过程中的差错。
其次,协议修改不灵活。如果不是传输过程中造成的差错,而是客户端因为业务逻辑的改变,添加或者删除了字段,或者服务端添加或者删除了字段,而双方没有及时通知,或者线上系统没有及时升级,就会造成解压缩不成功。
因而,当业务发生改变,需要多传输一些参数或者少传输一些参数的时候,都需要及时通知对方,并且根据约定好的协议文件重新生成双方的 Stub 程序。自然,这样灵活性比较差。
如果仅仅是沟通的问题也还好解决,其实更难弄的还有版本的问题。比如在服务端提供一个服务,参数的格式是版本一的,已经有 50 个客户端在线上调用了。现在有一个客户端有个需求,要加一个字段,怎么办呢?这可是一个大工程,所有的客户端都要适配这个,需要重新写程序,加上这个字段,但是传输值是 0,不需要这个字段的客户端很“冤”,本来没我啥事儿,为啥让我也忙活?
最后,ONC RPC 的设计明显是面向函数的,而非面向对象。而当前面向对象的业务逻辑设计与实现方式已经成为主流。
这一切的根源就在于压缩。这就像平时我们爱用缩略语。如果是篮球爱好者,你直接说 NBA,他马上就知道什么意思,但是如果你给一个大妈说 NBA,她可能就不知所云。
所以,这种 RPC 框架只能用于客户端和服务端全由一拨人开发的场景,或者至少客户端和服务端的开发人员要密切沟通,相互合作,有大量的共同语言,才能按照既定的协议顺畅地进行工作。

XML 与 SOAP

但是,一般情况下,我们做一个服务,都是要提供给陌生人用的,你和客户不会经常沟通,也没有什么共同语言。就像你给别人介绍 NBA,你要说美国职业篮球赛,这样不管他是干啥的,都能听得懂。
放到我们的场景中,对应的就是用文本类的方式进行传输。无论哪个客户端获得这个文本,都能够知道它的意义。
一种常见的文本类格式是 XML。我们这里举个例子来看。
<?xml version="1.0" encoding="UTF-8"?>
<geek:purchaseOrder xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:geek="http://www.example.com/geek">
<order>
<date>2018-07-01</date>
<className>趣谈网络协议</className>
<Author>刘超</Author>
<price>68</price>
</order>
</geek:purchaseOrder>
我这里不准备详细讲述 XML 的语法规则,但是你相信我,看完下面的内容,即便你没有学过 XML,也能一看就懂,这段 XML 描述的是什么,不像全面的二进制,你看到的都是 010101,不知所云。
有了这个,刚才我们说的那几个问题就都不是问题了。
首先,格式没必要完全一致。比如如果我们把 price 和 author 换个位置,并不影响客户端和服务端解析这个文本,也根本不会误会,说这个作者的名字叫 68。
如果有的客户端想增加一个字段,例如添加一个推荐人字段,只需要在上面的文件中加一行:
<recommended> Gary </recommended>
对于不需要这个字段的客户端,只要不解析这一行就是了。只要用简单的处理,就不会出现错误。
另外,这种表述方式显然是描述一个订单对象的,是一种面向对象的、更加接近用户场景的表示方式。
既然 XML 这么好,接下来我们来看看怎么把它用在 RPC 中。

传输协议问题

我们先解决第一个,传输协议的问题。
基于 XML 的最著名的通信协议就是 SOAP 了,全称简单对象访问协议(Simple Object Access Protocol)。它使用 XML 编写简单的请求和回复消息,并用 HTTP 协议进行传输。
SOAP 将请求和回复放在一个信封里面,就像传递一个邮件一样。信封里面的信分抬头正文
POST /purchaseOrder HTTP/1.1
Host: www.geektime.com
Content-Type: application/soap+xml; charset=utf-8
Content-Length: nnn
<?xml version="1.0"?>
<soap:Envelope xmlns:soap="http://www.w3.org/2001/12/soap-envelope"
soap:encodingStyle="http://www.w3.org/2001/12/soap-encoding">
<soap:Header>
<m:Trans xmlns:m="http://www.w3schools.com/transaction/"
soap:mustUnderstand="1">1234
</m:Trans>
</soap:Header>
<soap:Body xmlns:m="http://www.geektime.com/perchaseOrder">
<m:purchaseOrder">
<order>
<date>2018-07-01</date>
<className>趣谈网络协议</className>
<Author>刘超</Author>
<price>68</price>
</order>
</m:purchaseOrder>
</soap:Body>
</soap:Envelope>
HTTP 协议我们学过,这个请求使用 POST 方法,发送一个格式为 application/soap + xml 的 XML 正文给 www.geektime.com,从而下一个单,这个订单封装在 SOAP 的信封里面,并且表明这是一笔交易(transaction),而且订单的详情都已经写明了。

协议约定问题

接下来我们解决第二个问题,就是双方的协议约定是什么样的?
因为服务开发出来是给陌生人用的,就像上面下单的那个 XML 文件,对于客户端来说,它如何知道应该拼装成上面的格式呢?这就需要对于服务进行描述,因为调用的人不认识你,所以没办法找到你,问你的服务应该如何调用。
当然你可以写文档,然后放在官方网站上,但是你的文档不一定更新得那么及时,而且你也写的文档也不一定那么严谨,所以常常会有调试不成功的情况。因而,我们需要一种相对比较严谨的 Web 服务描述语言WSDL(Web Service Description Languages)。它也是一个 XML 文件。
在这个文件中,要定义一个类型 order,与上面的 XML 对应起来。
<wsdl:types>
<xsd:schema targetNamespace="http://www.example.org/geektime">
<xsd:complexType name="order">
<xsd:element name="date" type="xsd:string"></xsd:element>
<xsd:element name="className" type="xsd:string"></xsd:element>
<xsd:element name="Author" type="xsd:string"></xsd:element>
<xsd:element name="price" type="xsd:int"></xsd:element>
</xsd:complexType>
</xsd:schema>
</wsdl:types>
接下来,需要定义一个 message 的结构。
<wsdl:message name="purchase">
<wsdl:part name="purchaseOrder" element="tns:order"></wsdl:part>
</wsdl:message>
接下来,应该暴露一个端口。
<wsdl:portType name="PurchaseOrderService">
<wsdl:operation name="purchase">
<wsdl:input message="tns:purchase"></wsdl:input>
<wsdl:output message="......"></wsdl:output>
</wsdl:operation>
</wsdl:portType>
然后,我们来编写一个 binding,将上面定义的信息绑定到 SOAP 请求的 body 里面。
<wsdl:binding name="purchaseOrderServiceSOAP" type="tns:PurchaseOrderService">
<soap:binding style="rpc"
transport="http://schemas.xmlsoap.org/soap/http" />
<wsdl:operation name="purchase">
<wsdl:input>
<soap:body use="literal" />
</wsdl:input>
<wsdl:output>
<soap:body use="literal" />
</wsdl:output>
</wsdl:operation>
</wsdl:binding>
最后,我们需要编写 service。
<wsdl:service name="PurchaseOrderServiceImplService">
<wsdl:port binding="tns:purchaseOrderServiceSOAP" name="PurchaseOrderServiceImplPort">
<soap:address location="http://www.geektime.com:8080/purchaseOrder" />
</wsdl:port>
</wsdl:service>
WSDL 还是有些复杂的,不过好在有工具可以生成。
对于某个服务,哪怕是一个陌生人,都可以通过在服务地址后面加上“?wsdl”来获取到这个文件,但是这个文件还是比较复杂,比较难以看懂。不过好在也有工具可以根据 WSDL 生成客户端 Stub,让客户端通过 Stub 进行远程调用,就跟调用本地的方法一样。

服务发现问题

最后解决第三个问题,服务发现问题。
这里有一个 UDDI(Universal Description, Discovery, and Integration),也即统一描述、发现和集成协议。它其实是一个注册中心,服务提供方可以将上面的 WSDL 描述文件,发布到这个注册中心,注册完毕后,服务使用方可以查找到服务的描述,封装为本地的客户端进行调用。

小结

好了,这一节就到这里了,我们来总结一下。
原来的二进制 RPC 有很多缺点,格式要求严格,修改过于复杂,不面向对象,于是产生了基于文本的调用方式——基于 XML 的 SOAP。
SOAP 有三大要素:协议约定用 WSDL、传输协议用 HTTP、服务发现用 UDDL。
最后,给你留两个思考题:
对于 HTTP 协议来讲,有多种方法,但是 SOAP 只用了 POST,这样会有什么问题吗?
基于文本的 RPC 虽然解决了二进制的问题,但是 SOAP 还是有点复杂,还有一种更便捷的接口规则,你知道是什么吗?
我们的专栏更新到第 33 讲,不知你掌握得如何?每节课后我留的思考题,你都有没有认真思考,并在留言区写下答案呢?我会从已发布的文章中选出一批认真留言的同学,赠送学习奖励礼券和我整理的独家网络协议知识图谱
欢迎你留言和我讨论。趣谈网络协议,我们下期见!
分享给需要的人,Ta购买本课程,你将得20
生成海报并分享

赞 21

提建议

上一篇
第32讲 | RPC协议综述:远在天边,近在眼前
下一篇
第34讲 | 基于JSON的RESTful接口协议:我不关心过程,请给我结果
 写留言

精选留言(21)

  • 叹息无门
    2018-08-01
    感觉这篇写的不是很严谨: 1,首先SOAP并非只能通过HTTP进行传输,关于SOAP binding应该提一下? 2,SOAP 的HTTP Binding 支持比较完整的Web Method,http GET/POST都是可以支持的,并且对应不同的模式。大多数情况下只使用POST是具体实现的问题。

    作者回复: 是的,这里说的是通常的使用情况

    34
  • 凡凡
    2018-08-01
    1.虽然http协议有post,get,head,put,delete等多种方法,但是平常来说post,get基本足够用。所以soap只支持post方法的差别应该在缺少get方法,get方法可以浏览器直接跳转,post必须借助表单或者ajax等提交。也就限制了soap请求只能在页面内获取或者提交数据。 另外,soap协议规范上是支持get的,但是由于一般xml比较复杂,不适合放在get请求的查询参数里,所以soap协议的服务多采用post请求方法。 2.应该要讲restful协议了,一种使用json格式交互数据的,基于http协议的,轻量级网络数据交互规范。
    展开
    16
  • 2018-08-16
    webservice soap的初始目标:服务自描述,其实就是没有达成,UDDI早已默默死掉

    作者回复: 是的,但是作为rpc历史上不能不说的一个环节,也要讲一下

    10
  • mgxian
    2018-08-01
    1.没有充分利用http协议原有的体系 比如get表示获取资源 post表示创建资源 delete表示删除资源 patch表示更新资源 2.restful协议
    共 3 条评论
    10
  • 雪山飞猪
    2019-05-17
    这套教程真的是比以前看过的好多书都要生动形象,高手出马,化繁为简,非常感谢老师的倾情分享

    作者回复: 谢谢

    3
  • vloz
    2018-08-01
    面向函数和面向对象在信息交互上的特征是什么?为什么讲onc合适面向函数?
    3
  • 悟空聊架构
    2018-08-06
    题目1: HTTP请求里面有很多种提交方式,文中只是提到了可以用post,其实还是可以用其他方式的,比如get。 题目2: restful,用json格式的数据发送请求和返回数据。
    2
  • blackpiglet
    2018-08-01
    1. POST 请求构造比较麻烦,需要专门的工具,所以调用和调试更费事。 2. 更简单的应该就是RESTful 了吧,SOAP 感觉不太好用,复杂度比较高,用起来没有http顺手。
    2
  • spdia
    2018-08-01
    soap的方言问题过于严重。其实简单场景可以用http rest或者json+http post,或者用比较新的graphql
    2
  • 沈洪彬
    2020-12-16
    不是网络传输都要变成二进制传输么? 是不是xml也要变成二进制才能传输,这个是谁去做? stub么?
    1
  • LHW
    2019-02-13
    不用get是考虑传输的内容长度大小吧,如果是提交文件流的形式,post怎么处理?
    1
  • andy
    2018-08-01
    可以使用类似thrift的DSL来描述服务接口,然后生成服务端和客户端
    1
  • 我在你的视线里
    2022-11-09 来自山西
    webserice和HTTP 有什么区别和联系呢?接口传数据不都是http传输吗?
  • 牛年榴莲
    2022-02-11
    现在还有用SOAP协议的吗?
  • 老兵
    2020-06-27
    1. 用post是因为每次都是到service创建一些资源,之前为什么只用post呢?是不是因为访问soap大部分情况都是需要在服务端保存一些数据之类? get, post, put, patch, delete也都是http协议里面的method类型。 2. restful,grpc
  • King-ZJ
    2020-03-26
    在微服务调用这块得多学多看多实践。
  • 渣渣
    2020-02-27
    1.只用http (参数在body中),如果客户端不是用post接收,就收不到,有一些不太灵活, 2.restful
  • DFighting
    2020-01-02
    读完之后才发现最初的rpc协议并没有做到对调用者的完全透明,不利于扩展
  • mlbjay
    2019-04-25
    之前工程里需要调用第三方的SOAP接口,于是研究了一下web servies,但是云里雾里的。 这下感觉WSDL,XML,SOAP等技术的关系现在清晰多了。
  • Jerry Chan
    2018-08-18
    但是这个二进制格式,怎么转换为xml这种格式呢?过程是怎么解析的呢?主要是这块不清楚,作者能解惑下不?

    作者回复: 不会有二进制转换成为xml,是由对象转换成为xml