20 | 大名⿍⿍的select:看我如何同时感知多个I/O事件
20 | 大名⿍⿍的select:看我如何同时感知多个I/O事件
讲述:冯永吉
时长10:27大小14.36M
什么是 I/O 多路复用
select 函数的使用方法
程序例子
套接字描述符就绪条件
总结
思考题
赞 13
提建议
精选留言(40)
- 鸠摩·智2020-02-29我一直很好奇,为啥说select函数对fd有1024的限制,找了点资料共勉: 首先,man select,搜索FD_SETSIZE会看到如下的内容 An fd_set is a fixed size buffer. Executing FD_CLR() or FD_SET() with a value of fd that is negative or is equal to or larger than FD_SETSIZE will result in undefined behavior. Moreover, POSIX requires fd to be a valid file descriptor. 其中最关键的是FD_SETSIZE,是在bitmap位图运算的时候会受到他的影响 其次,sys/select.h头文件有如下定义: #define FD_SETSIZE __FD_SETSIZE typesizes.h头文件有如下定义: #define __FD_SETSIZE 1024 由此,终于看到了1024的准确限制。 同时man里也说明了一个限制,不是0-1023的fd会导致未定义的行为。展开
作者回复: 赞,为大家找到了原始的出处,证明我不是在瞎BB,哈哈。
共 3 条评论49 - 安排2019-09-23第一道:可以,就绪条件是有数据可读(检测可读事件)。是否可以监测可写事件不太清楚,没有实验过。 第二道:不一定需要传入,那样的话内核中for循环需要遍历整个集合,效率低。传入基数可以减小遍历范围,提高效率。 当然,api既然设计成这样了,那肯定需要传入一个数了。展开共 1 条评论21
- Keep-Moving2019-09-23allreads = {0, 3}; 老师,这一步是怎么实现的?没看出来
作者回复: 逐个解释一下: 1.FD_ZERO(&allreads); 所有的位置设置为0; 2. FD_SET(0, &allreads); 将描述字0的对应位置设置为1; 3.FD_SET(socket_fd, &allreads); 将监听套接字的对应位置设置为1。 这样就得到了allreads = {0, 3}。
共 9 条评论15 - 无名2019-11-04对于套接字可写状态中说的:套接字发送缓冲区足够大,怎么样算足够大呢?
作者回复: 实际上,只要有一个字节可以被写入,就是状态可写的。
共 4 条评论13 - 钱2019-11-241:I/O 多路复用的设计初衷就是解决这样的场景,把标准输入、套接字等都看做 I/O 的一路,多路复用的意思,就是在任何一路 I/O 有“事件”发生的情况下,通知应用程序去处理相应的 I/O 事件,这样我们的程序就变成了“多面手”,在同一时刻仿佛可以处理多个 I/O 事件。 2:select 函数就是这样一种常见的 I/O 多路复用技术,使用 select 函数,通知内核挂起进程,当一个或多个 I/O 事件发生后,控制权返还给应用程序,由应用程序进行 I/O 事件的处理。 int select(int maxfd, fd_set *readset, fd_set *writeset, fd_set *exceptset, const struct timeval *timeout); 返回:若有就绪描述符则为其数目,若超时则为 0,若出错则为 -1 在这个函数中,maxfd 表示的是待测试的描述符基数,它的值是待测试的最大描述符加 1。 紧接着的是三个描述符集合,分别是读描述符集合 readset、写描述符集合 writeset 和异常描述符集合 exceptset,这三个分别通知内核,在哪些描述符上检测数据可以读,可以写和有异常发生。 三个描述符集合中的每一个都可以设置成空,这样就表示不需要内核进行相关的检测。 timeout设置成不同的值,会有不同的可能: 第一个可能是设置成空 (NULL),表示如果没有 I/O 事件发生,则 select 一直等待下去。 第二个可能是设置一个非零的值,这个表示等待固定的一段时间后从 select 阻塞调用中返回。 第三个可能是将 tv_sec 和 tv_usec 都设置成 0,表示根本不等待,检测完毕立即返回。这种情况使用得比较少。 3:内核通知我们套接字有数据可以读了,使用 read 函数不会阻塞。 内核通知我们套接字可以往里写了,使用 write 函数就不会阻塞。 读了几遍,感觉还是没有抓住核心,所以,就将文中的要点摘录下来。 对IO多路复用的大概理解是,通过select函数去监听一组文件描述符,如果有事件就绪就交给应用程序去做对应的处理。展开
作者回复: 总结得已经很到位了呀
共 5 条评论11 - 乔丹2020-12-20老师,两个疑问: 1. 为什么socket_fd一定是3呢? 2. 如果socket_fd = 2000, 那么传入select函数的值就是2001了, 这样不是大于1024了吗? 这个点我没有想通。
作者回复: 1.这里是举一个例子,因为0,1,2分别是标准输入,标准输出和标准错误,3是接下来的第一个常见描述字。 2.select确实不能支持大于1024的描述字。
10 - 无名2019-09-27size_t rt = write(socket_fd, send_line, strlen(send_line)); if (rt < 0) { error(1, errno, "write failed "); } 这个代码中有错吧,应该将size_t改为sszie_t,size_t为unsigned long,这样错误-1被转换了。展开
作者回复: 是的,感谢指出。
10 - 莫珣2019-09-23我有些疑问,select的FD数组大小默认是1024,但是Linux的文件描述符大小一定不是1024,假设现在使用ulimit将一个进程可以打开的文件数设置成了65535,那么大于1024的文件描述符怎么加到FD数组中去呢,如果按照文本里说的,文件描述符代表数组下标的话不就加不进去了? 第二个问题,套接字有两个属性,接收低水位线和发送低水位线,当接收缓冲区中待接收的字节数大于接收低水位线,一个可读事件产生,那么如果永远都不能达到接收低水位线呢?展开
作者回复: 第一个问题,我理解是加不进去的,你不妨设计一个程序验证一下。 第二个问题,首先,这个值是可以调整的,我记得默认值即使1个byte,也就是说有数据就可以感知到;第二,如果一直达不到接收watermark,我理解不是一个正常的网络交互过程,正常的网络交互肯定是像流一样,不断有数据接收。
共 2 条评论7 - awmthink2020-04-16老师,哪种场景下需要多路复用 “写描述符” 呢? 什么时候能写应用程序不知道吗?
作者回复: 写描述符是当发送套接字缓冲区有空间时,要知道,应用程序不是什么时刻都可以不断网发送套接字缓冲区打收据,这样会把缓冲区打爆,所以多路复用写的意思就是告诉应用程序什么时候应该往发送套接字缓冲区打数据。
6 - 麻雀2019-12-30您好, 第一,想问下select是不是能够在处理数据的同时继续轮询(监听)是否有新的套接字来到,它的内部是不是多线程呢?因为accept就是因为单线程在处理数据时,不能对这段时间内到来的套接字进行监听。 第二,FD_SET它是一个unsigned long数组,那么它怎么实现Bitmap,只是对数组的每个元素例如fd_set[10]对文件描述符为10的套接字来数据的时候设置为1吗?展开
作者回复: 第一,是可以的。这个机制是操作系统实现的,你可以把操作系统理解成一个"巨大"的无限循环处理器,无论是有数据需要读写,还是有新的套接字连接达到,这个巨大的无限循环处理器都是可以快速感知到(通过各种软硬件机制,比如中断),这样你就可以明白,它的内部并不是多线程实现的。 第二,你的理解是正确的,就是对每个位来设置0或者1。
4 - rongyefeng2020-05-19“第一种是套接字发送缓冲区足够大,如果我们使用非阻塞套接字进行 write 操作,将不会被阻塞,直接返回。” 老师,请问这里是不是应该写成“如果我们使用阻塞套接字进行write操作......”才对?
作者回复: 如果从套接字特性来说,确实是阻塞套接字,已经提交勘误。
3 - imsunv2020-08-09内核通知我们套接字可以往里写了,使用 write 函数就不会阻塞 。 那么如果写的内容超过了 缓冲区的大小,会阻塞么
作者回复: 不会阻塞,write函数会返回实际写入缓冲区的字节大小。实际上的策略就是"尽最大可能"写入。
共 2 条评论2 - 小仙女2020-07-23int select(int maxfd, fd_set *readset, fd_set *writeset, fd_set *exceptset, const struct timeval *timeout); 这里的fd_set 是什么结构 0:标准输入 1:标准输出 2:标准错误 3:socket 是这样吗??展开
作者回复: 你罗列的是文件描述符的种类,这个是没错的。不过fd_set是通过mask位来表示描述字的。
2 - skye2020-01-08用select做多路复用,如果不用多线程,其中一路阻塞或者死锁了,那其它路就无法处理了,所以单线程处理的前提时没有阻塞和死锁,这样理解对吗?
作者回复: 我明白你想表达的是select之后处理事件的时候可能会阻塞,导致select不到其他事件,这点理解是对的。 至于单线程处理是不是一定没有阻塞(死锁我不太明白这里指的是具体什么情况),我倒觉得不一定,当然,非阻塞效果可能更好一些。
共 2 条评论2 - 打奥特曼的小怪兽2019-11-06关于 FD_SET() 函数,debug看了下内存结构,{0,3} 如果设置了,实际上存储的是 2^0 + 2^3 = 9,并不会像图示的在每个位置上设置1。
作者回复: 我的意思就是00001001,在bit位上设置为1, 转换为10进制就是9。
3 - 我也曾是少年2019-10-20老师,我看了一部分开源代码,golang的,我发现大多数有名的项目他们并发写套接字的时候,都是用一个阻塞对列,既向一个没有容量的channel中写,只有接收端接了,发送端才会继续往下面走,我觉得别人这么做肯定是有原因的,但是我摸不透,所以将这问题定位到并发写套接字上,不知老师对这问题怎么看共 3 条评论2
- Navelwort、2021-12-03如果select 检测到可写事件,但是缓冲区还不够大,不能完成应用层数据的全部拷贝,如果是阻塞类套接字,那write函数还是会阻塞吧?
作者回复: 是的。
1 - нáпの゛2020-09-01第一道题,理解管道也是文件,往管道输入数据和输出数据对应可读可写的就绪条件。 第二道题,我理解fd_set本身是数组,如果不传入描述字基数,无法得知fd_set的具体大小,应该是无法进行遍历操作的。
作者回复: 基本正确哦。
2 - Joker2020-04-17小明原来只在一个家书店里等着,后来发现等着无聊,回家,然后在去书店等;后来发现别的书店,索性就好几家一起问,问了这个去下一家,看看哪家书到了,就先买哪一家的。
作者回复: 哈哈,这也可以。
2 - 向东2019-09-2332位整数,那么该数组的第一个元素对应于描述字0~31,第二个元素对应于描述字32~63,依此类推。 没读懂,解答一下?多谢🙏
作者回复: 32位整数,一共有32个bit位,每个bit位可以表示两种状态,0或者1,如果开启检测就将bit设置为1,否则设置为0。像下面这样: 00000000 00000000 00000000 10010010 这个32bit分别表示了描述字7,4和1设置为1,其他的设置为0。这里表示的对应描述字0-31。
1