09 | 外存管理与文件系统
09 | 外存管理与文件系统
讲述:丁伟
时长10:15大小9.42M
外存的分类
外存的数据格式
外存的使用接口
虚拟内存的支持
结语
赞 30
提建议
精选留言(49)
- Enthusiasm2019-05-14关于外存管理,有个问题从之前就困扰我:磁盘的IO是由CPU完成的吗?但之前见到的说法是“CPU只能操作内存”。既然今天又提到了这个问题,文中提到“大量的磁盘 IO 操作,非常占用 CPU 时间”,那这两种说法是否矛盾?还想知道磁盘中的数据是怎么被加载到内存上来的呢?另外,更多的文章是说,“CPU的速度远远大于磁盘IO,CPU经常需要‘等待’磁盘IO”,这明显也是一种将CPU和外存割舍开的一种说法,而且按这种说法,CPU不光无需分配很多时间片给IO,而且还有很多“等待”时间。这也和本文中“非常占用CPU时间”相矛盾吧?展开
作者回复: 所有外设cpu都统一基于数据交换(io)的方式操作。cpu并不知道数据的含义,但是设备的使用方和设备知道。这种情况下你可以简单理解cpu只是一根网线,但是很重要的一点是它让设备使用方和设备可以交互。cpu并不负责磁盘io,但是它要等它结束以接收数据。这方面当然也有一些新技术出现改善这一点,可以想一想可能的优化路径,这里不表。
共 8 条评论16 - Oskar 魏2019-06-19CPU的地址线和数据线与内存相连,CPU可以直接操作内存,进行寻址和读写,也就是CPU直接操作的是内存。CPU通过运行在内存中的应用程序,去调用硬盘的驱动程序,硬盘的驱动程序去操作硬盘的物理接口(比如SATA接口),按照约定协议和电气规格发送指定的电平信号给硬盘,完成和硬盘的通信。然后,硬盘内部也有微控制器MCU( micro controller unit)去控制磁头读写电机,去读出或者写入数据,把磁盘介质物理单元状态所表示的数据读出来,然后再通过刚才的回路逐步传输到内存和CPU的寄存器。展开15
- 开放(深度学习学者)2019-05-27太简单了感觉,基本没有怎么说清楚,第一硬盘存储其中一个文件他是怎么存放的数据块和元数据是怎么结构,inode是什么,还有数据和元数据的索引表,甚至作为文件系统ext3的多层表索引和12个直接链接,一个单层,和多层索引等等都没说,文件系统的整体架构,特别是到底怎么优化等等也没说,还有虚拟内存,具体程序段怎么映射到物理内存,空余内存怎么管理,虚链表,对应的两难性能问题怎么解决?
作者回复: 文件系统主要我觉得从架构上理解比较容易,所以没有特别交代太多。可能后面 review 的时候会适当重构一下这一篇。
共 4 条评论14 - 陈光2019-05-14老师,能否简单介绍一下基于内存的数据结构和基于外存的数据结构有何不同?我们平时所说的“数据结构和算法”是不是偏向于内存?另外,“路径冲突”是不是指多个进程同时访问同一个文件?
作者回复: 1、外存的数据结构的特征是io是很费时的操作,所以外存数据结构+算法的优化方向是减少io次数,这个和内存很不一样。 2、平常数据结构大部分是内存;但一般数据结构书最后有几章会谈到外存数据结构+算法。 3、是的。
11 - Liber2019-09-28许老师,把你的知识掌握了去七牛应聘会不会so easy?
作者回复: 真掌握了去哪里都easy ^_^
9 - 大糖果2019-05-14老师好,有个问题,就是关于Windows自带的文件搜索,我们都知道那东西很慢,但是有一款everything的软件却可以做到很快,微软的技术是不用质疑的,他们为什么不把这个文件搜索做快点呢?还是这样的软件会有别的损耗?
作者回复: 确实不一样,一个有建立搜索的索引,有额外的存储成本;一个是遍历(挨家挨户问过去)。
共 3 条评论8 - 花儿与少年2019-05-17怎么越来越像计算机组成原理了。希望更多的软件架构知识
作者回复: 第一章会更偏基础体系,结合体系谈架构
共 2 条评论5 - 张sir2019-07-13许老师,我有两个疑问, 1.如果操作系统的swap占用过高,会直接影响cpu性能吗。2.路径的冲突检查机制,是不是就是像mysql服务那样,当服务运行起来后,就会创建xxx.pid文件保存进程的pid,来保证进程的互斥
作者回复: 1、会,swap访问越频繁,cpu呈现出来的性能越低,其实是因为访问存储的速度低,数据读写速度低,纯粹的计算是不影响的,但是这个世界没有脱离存储的计算。所有的计算你可以想象成从存储读出来数据,进行纯粹的计算得到结果,然后再把结果写回存储中去。所以计算的性能和存储性能密切相关。2、对的,这是非常常见的一种互斥手法。
共 2 条评论4 - lckfa李钊2019-05-15看回复 ,很多人和我一样,对"Unix的一切皆是文件不是最佳实践"这个论点,有困惑.如果在图形界面时代的一切皆文件这样的架构设计不再适宜,为何类unix的设计者不改变这种设计,或者说,从架构的角度说,这样的设计定型了,是不是就不好改了?本课的主题其实是外设的统一接口是文件系统,那么把外设都当做文件进行抽象化处理,不出很合适么?
作者回复: 这种统一给我的感觉就像很多面向对象的类库,所有的类统一从Object类继承一样,是一个过度设计。
共 2 条评论4 - DaDo Wang2019-05-15想到了HDFS(Hadoop Distributed File System ),文中说的文件系统和HDFS应该不属于一个层吧?个人理解,HDFS应该全是更上层的应用软件层文件系统,它在外置存储的文件系统上,做了对分布式的文件进行管理的功能还请老师解答~😁
作者回复: 不是一个层面,后面服务端开发部分会讨论分布式文件系统
4 - 822019-05-14多个进程去访问修改相同的外存地址文件时,谁来控制并发修改是操作系统还是外设驱动程序? 如果提高外存的访问速度是否可以减少缺页的处理时间,进而一定程度缓解卡顿的情况?
作者回复: 1、操作系统;2、对的,以前用机械硬盘作为swap,有时候慢比较显著;现在电脑基本上都用固态硬盘做swap,慢的感觉基本上完全消失了。
4 - ༀ醉里挑灯看剑༄2019-05-14缺页产生是因为长时间没有用的内存地址淘汰所以需要写入swap中进行保存,频繁的产生是说很多内存地址长时间没有用么?那这是怎么产生的呀
作者回复: 频繁缺页说明活跃的内存页超过物理内存大小,导致一个页刚刚换进来又要换出去,就比较折腾
4 - 傲娇的小宝2019-05-15因为很多东西没学过,或者没这么深入,感觉自己要学习的还很多很多。
作者回复: 能够在头脑中把整体串起来就可以了,然后对某些东西有兴趣想进一步了解的,后面可以继续研究
3 - 庆增2019-05-14再深入一点就好了,比如文件系统是如何恢复数据的。
作者回复: 日志里面记录的是元数据的变更历史,所以可以恢复的是元数据破坏。如果文件内容坏了就没办法了
3 - 零度2019-12-27老师,swap用来保存缺页中断时内存中最早没使用的内存数据,linux分区时一般将swap大小设置为物理内存的2倍,但频繁缺页中断肯定会有很多内存数据保存到swap,如果swap也满了,请问接下来swap是怎么处理?
作者回复: swap满了,内存分配就失败了。swap大小+物理内存大小,整体就是可用的虚拟内存大小。
2 - Eternal2019-07-21老师可以在整篇文章的开头加上一个简单的目录吗?
作者回复: 我想一下这个需求。要是极客时间有这个功能也不错。
2 - 猴子请来的救兵2019-06-13对于外部设备,我觉得从架构角度来说,重点应该介绍设备驱动程序这一块,驱动程序封装了不同设备的实现细节,而提供预定义的接口与操作系统通信2
- 诗泽2019-05-15请问,分区的格式化是由操作系统的文件系统管理程序完成的吗?比如Linux 支持ext3和ext4两种格式那么操作系统会内置两种文件系统管理程序吗?文件系统管理程序从某种角度可以理解为是一种“驱动”吗?谢谢!
作者回复: 分区格式化其实一个普通的用户态应用程序就可以完成。文件系统管理程序不是驱动程序。
2 - 靠人品去赢2019-05-14这个外存的数据格式NTFS我也是装系统的时候见到过,没有去考虑过这是一个什么东西。这个格式是有日志的,想问一下数据恢复可不可以借助日志,可以的话为什么数据恢复,机械盘可以固态盘就很大概率凉凉?
作者回复: 固态盘为何凉凉没有了解过
共 2 条评论2 - 程序员小跃2019-05-1406-09这四篇看完,又加深了很多认识,感谢许老师的课程2