05 | 使用套接字进行读写:开始交流吧
05 | 使用套接字进行读写:开始交流吧
讲述:冯永吉
时长10:19大小9.44M
发送数据
发送缓冲区
读取数据
read 函数
缓冲区实验
服务器端读取数据程序
客户端发送数据程序
实验一: 观察客户端数据发送行为
实验二: 服务端处理变慢
总结
思考题
赞 26
提建议
精选留言(113)
- 破晓^_^2019-08-12无限增大缓冲区肯定不行,文章中已经说过write函数发送数据只是将数据发送到内核缓冲区,而什么时候发送由内核觉定。内核缓冲区总是充满数据时会产生粘包问题,同时网络的传输大小MTU也会限制每次发送的大小,最后由于数据堵塞需要消耗大量内存资源,资源使用效率不高。 用户缓冲区到内核缓冲区 内核缓冲区IP报文,一次三拷贝,总共6次。不知对否?展开
作者回复: 都是强人😄
共 19 条评论71 - 莫珣2020-01-15无限大肯定是不行的,这要从为什么使用缓存这个角度考虑。内核协议栈不确定用户一次要发多少数据,如果用户来一次就发一次,如果数据多还好说,如果少了,那网络I/O很频繁,而真正发送出去的数据也不多,所以为了减少网络I/O使用了缓存的策略。但为啥不呢无限大呢,网卡一次发出去的数据报它是有一个最大长度的,所以你不管累积再多数据最后还是要分片发送的,这样一来缓冲区太大也没什么意义,而且数据传输也是有延时要求的,不可能总是在缓冲区里待着等数据,这样就总会有空出来的缓冲区存放新数据,所以无限大缓冲区也没意义,反而还浪费资源。 发送端,假设数据能一次性复制完,那么从用户态内存拷贝到内核态内存是一次(这里应该直接拷贝到发送换冲区了),传输层组TCP包是第二次拷贝,因为要加包头,而发送缓冲区的都是紧凑内存全是应用层数据,那么分装包就需要一次拷贝,第三次,一个TCP包封装为IP报文这里可能也会需要一次拷贝,毕竟这里走到协议栈的下一层了。展开
作者回复: 总结的很牛
共 6 条评论45 - cool2020-04-26什么是粘包问题?怎么解决
作者回复: TCP是流协议,根本不存在所谓粘包一说。应用层协议在设计的时候,是需要充分考虑到数据解析和还原的问题,如果设计不好,导致数据无法还原,那是应用层协议设计不佳,并不是说TCP天然有粘包问题。
26 - fjpcode2019-08-131. 缓冲区搞大一些,在一定程度上能够减少write/send等系统调用,减少用户空间和内核空间的切换。但是和吞吐量并没有直接关系, 还可能导致数据都挤压到内核缓冲区得不到处理,造成内存消耗的问题。 2. 发送方:用户空间-->内核缓冲区-->报文封装 三次拷贝,接收方反向过来,所以应该是6次。共 4 条评论22
- 2019-08-13尝试着照着老师贴出来的代码写了一个,可以跑起来 https://github.com/yingcheng-zhou/socket-reading-and-writing
作者回复: 👍
共 8 条评论21 - WhatAKitty2020-04-12不涉及协议栈层面,应该是4次: 用户缓冲区 -> 内核缓冲区 -> 网卡 -> 对端网卡 -> 内核缓冲区 -> 用户缓冲区 老师这里提及复制几次,主要是为了引出零拷贝吧。直接由用户缓冲区复制到网卡DMA区域。减少了中间经由内核缓冲区中转的过程。
作者回复: DMA区域都知道,🐂。
共 5 条评论13 - itschenxiang2019-09-03关于write函数的返回值那里还是不太懂,当它的返回值(数值大小)小于期望写入的字节数,那它的值代表什么呢???
作者回复: 表示缓冲区就那么大,装不下你要的那么大的字节流,就返回了目前能装下的部分,剩下的部分应用程序要自己接着往里装。
共 3 条评论10 - 何赫赫2020-03-07while (remaining) { int n_written = send(sockfd, cp, remaining, 0); fprintf(stdout, "send into buffer %ld \n", n_written); if (n_written <= 0) { error(1, errno, "send failed"); return; } remaining -= n_written; cp += n_written; } 老师你好,send函数不是会等所有的数据都放入缓冲区后才返回吗,那返回的n_written不是应该等于remaining呀,为什么还需要while循环展开
作者回复: 在非阻塞I/O的情况下,send函数是"能写多少写多少",所以n_written就不等于remaining了,而send函数为了同时对阻塞I/O和非阻塞I/O起作用,就用while循环了。
9 - 郑祖煌2020-06-12增大一些是可以提高系统的效率,一定程度上减少了write/send调用,减少了用户空间和内核之间的切换。但是并不能增大吞吐量,毕竟内核的缓冲区并不能跟用户空间的缓冲区保持同步增大。把内核缓冲区总是满满的会增加粘包的频率和概率。
作者回复: 👍
6 - 传说中的成大大2019-08-13还有就是通过现象说明 应用程缓冲区虽然是10240000但是套接字缓冲区应该不是10240000这么大它一次性没写完,这也是为啥服务器端在不停的打印收到的字节数 这说明在客户端send未完全拷贝到套接字缓冲区之前他是不会返回的5
- Geek_Wison2019-08-12老师可以将完整的代码的github地址贴出来吗,我想自己编译调试运行一下。
作者回复: 正在进行中
共 5 条评论5 - tianheng312020-02-18想请问老师两个问题: 【1】“如果我们把服务端的休眠时间稍微调大,把客户端发送的字节数从从 10240000 调整为1024000”,这里表述是否有点小偏差,是从102400调整为2014000吗? 【2】“对我们而言完全都是透明的”,既然我们不知道对方什么时候接收完毕,是否应该是不透明的呢?
作者回复: 1.是减少一个0. 2.我想表达的意思是TCP协议给我们提供了一个透明的交互方式,数据的接收是实现的细节,我们并不需要知道这个细节。如果你从要感知这个细节角度出发,确实是不透明的。
共 2 条评论4 - 学怪2019-12-06网络编程中为什么要循环读取数据呢?
作者回复: 因为数据像流水一样,不会结束,所以叫做stream流。
共 2 条评论4 - itschenxiang2019-10-04在 UNP 中关于 read 和 write 函数有这样一段描述:字节流套接字上调用 read 或 write 输入或输出的字节数可能比请求的数量少......这个现象在 read 一个字节流套接字时很常见,但是在 write 一个字节流套接字时只能在该套接字为非阻塞的前提下才出现,请问这里是什么意思?
作者回复: 就是说读的时候可能读不到你指定大小的字节流;而发送的时候如果是阻塞套接字,则会全部发送完;只有当非阻塞套接字的时候,才可能发送的字节数和请求的字节数不一致。该系列的后面几讲会讨论到这方面的内容。
3 - tongmin_tsai2019-09-30老师,如果客户端和服务端要求是一次短链接,并且是一次性发完所有数据,那如果客户端的缓冲区大,服务端的缓冲区小,那么服务端如何能知道客户端这次数据完全发送完毕的?比如客户端发送1000字节,客户端的缓存区大小为1200字节,那客户端可以一次性把数据放到缓冲区,服务端这边,缓冲区大小为400字节,那么服务端是否就相当于要从缓冲区读取数据3次了,那么服务端是如何知道客户端数据发送完毕的?
作者回复: 首先,TCP的报文会被封装成一个一个TCP包,每个包都有一个sequence序列号,每个包里包含了一定的字节,当这个包被接收端接收(放到接收缓冲区中),接收端发送一个ACK,这个ACK和sequence对应,这样服务端就可以知道哪些包被接收,哪些包没有被接收。 按照你的例子,我们以400为包大小,发送了三个ACK,就可以认为1200字节发送结束。 服务端是不需要知道数据是否发送完毕的,因为TCP是一个流式的,没有办法知道客户端下个时刻还会不会发送数据,服务端只要告诉客户端我收到了1200字节就可以了。
共 4 条评论3 - 徐凯2019-08-12我想问一下 用户态缓存是否指的是运行库的缓存 我的意思就是 write最终是要调用系统调用的 而我们使用的是运行库的write函数 为了避免像发一个字节就立马调用系统调用 运行库也会有缓存来尽量减少系统调用的次数 这个是不是就是指的是用户态缓存 而不是指用户在程序中自己定义的一段buffer数组对吧
作者回复: 我理解不是这样的,咱们调用write就是一个系统调用,就会有用户态-内核态的上下文切换,你说的这个问题,确实是实战中应该尽量避免的,我在后面的提高篇中会针对你说的这个情况讲到一些技巧。
3 - Sweety2019-08-12对C不了解,有点不好理解. 只能将就的看懂方法. 第一次认真跟课,就给自己挖了一个坑. 理解思想吧
作者回复: 答疑篇会稍微点拨一下C语言
3 - 旅途2019-12-29老师 问一下 send into buffer 这句话 看代码里 应该是每次 发送完都会打印出来 为什么调小发送字节数后才能打出来呢?
作者回复: 如果你问的是第二个实验的结果,其实是这样的,确实每次发送都会打印出"send into buffer"这句话,问题是这里的程序一次性的将query字符串发送到了发送缓冲区,而发生缓冲区如果足够大,那么是可以一次性的容纳这部分数据的,所以当我们把发送字节数从从 10240000 调整为 1024000,就会直接看到"send into buffer"这句话
共 2 条评论2 - itgou2019-11-21bzero(&servaddr, sizeof(servaddr)); servaddr.sin_family = AF_INET; servaddr.sin_addr.s_addr = htonl(INADDR_ANY); servaddr.sin_port = htons(12345); /* bind 到本地地址,端口为 12345 */ bind(listenfd, (struct sockaddr *) &servaddr, sizeof(servaddr)); /* listen 的 backlog 为 1024 */ listen(listenfd, 1024); /* 循环处理用户请求 */ for (;;) { clilen = sizeof(cliaddr); connfd = accept(listenfd, (struct sockaddr *) &cliaddr, &clilen); read_data(connfd); /* 读取数据 */ close(connfd); /* 关闭连接套接字,注意不是监听套接字 */ } 两点不明白: 1,bzero函数做了什么事; 2,cliaddr客户端地址只是申明了一下,就传给accept函数了,有什么意义呢?展开
作者回复: 1.bzero对地址进行了置0处理,相当于初始化。否则地址就是错的; 2.cliaddr在accept函数中是传了一个地址的,这相当于是accept函数的输出参数,这样就可以知道连接上来的客户端的信息,比如IP。
共 2 条评论2 - 禾桃2019-08-1613-14 行表示的是非阻塞 I/O 的情况下,没有数据可以读,需要继续调用 read。 EINTR The call was interrupted by a signal before any data was read; see signal(7). 貌似这个场景是因为read这个函数在执行过程中被一个信号中断,而没有执行完提前退出了, 您的意思是只有在socket被设置为非阻塞的前提下,才会出现? 如果socket之前被设成阻塞,read就不会返回,直到这个信号被处理了,如果处理后返回这个进程,读取的操作会继续进行下去,直到read函数返回? 多谢!展开
作者回复: 阻塞那部分确实是这样的,当然,可以为read设置超时。
共 3 条评论2