18 | 划分土地(下):如何实现内存页的分配与释放?
下载APP
关闭
渠道合作
推荐作者
18 | 划分土地(下):如何实现内存页的分配与释放?
2021-06-18 LMOS 来自北京
《操作系统实战45讲》
课程介绍
讲述:陈晨
时长08:19大小7.60M
你好,我是 LMOS。
通过前面两节课的学习,我们已经组织好了内存页,也初始化了内存页和内存区。我们前面做了这么多准备工作,就是为了实现分配和释放内存页面,达到内存管理的目的。
那有了前面的基础,我想你自己也能大概实现这个分配和释放的代码。但是,根据前面我们设计的数据结构和对其初始化的工作,估计你也可以隐约感觉到,我们的内存管理的算法还是有一点点难度的。
内存页的分配
如果让你实现一次只分配一个页面,我相信这个问题很好解决,因为你只需要写一段循环代码,在其中遍历出一个空闲的 msadsc_t 结构,就可以返回了,这个算法就可以结束了。
但现实却不容许我们这么简单地处理问题,我们内存管理器要为内核、驱动,还有应用提供服务,它们对请求内存页面的多少、内存页面是不是连续,内存页面所处的物理地址都有要求。
这样一来,问题就复杂了。不过你也不必担心,我们可以从内存分配的接口函数下手。
下面我们根据上述要求来设计实现内存分配接口函数。我们还是先来建立一个新的 C 语言代码文件,在 cosmos/hal/x86 目录中建立一个 memdivmer.c 文件,在其中写一个内存分配接口函数,代码如下所示。
我们内存管理代码的结构是:接口函数调用框架函数,框架函数调用核心函数。可以发现,这个接口函数返回的是一个 msadsc_t 结构的指针,如果是多个页面返回的就是起始页面对应的 msadsc_t 结构的指针。
为什么不直接返回内存的物理地址呢?因为我们物理内存管理器是最底层的内存管理器,而上层代码中可能需要页面的相关信息,所以直接返回页面对应 msadsc_t 结构的指针。
还有一个参数是用于返回实际分配的页面数的。比如,内核功能代码请求分配三个页面,我们的内存管理器不能分配三个页面,只能分配两个或四个页面,这时内存管理器就会分配四个页面返回,retrealpnr 指向的变量中就存放数字 4,表示实际分配页面的数量。
有了内存分配接口、框架函数,下面我们来实现内存分配的核心函数,代码如下所示。
很明显,上述代码中 onmpgs_retn_bafhlst 函数返回的两个 bafhlst_t 结构指针,若是相等的,则在 mm_reldpgsdivmsa_bafhl 函数中很容易处理,只要取出 bafhlst_t 结构中对应的 msadsc_t 结构返回就好了。
问题是很多时候它们不相等,这就要分隔连续的 msadsc_t 结构了,下面我们通过 mm_reldpgsdivmsa_bafhl 这个函数来处理这个问题,代码如下所示。
这个代码有点长,我写出了完成这个逻辑的所有函数,好像很难看懂。别怕,难懂很正常,因为这是一个分配算法的核心逻辑。你之所以看不懂只是因为不懂这个算法,之前我们确实也没提过这个算法。
下面我就举个例子来演绎一下这个算法,帮助你理解它。比如现在我们要分配一个页面,这个算法将执行如下步骤:
1. 根据一个页面的请求,会返回 m_mdmlielst 数组中的第 0 个 bafhlst_t 结构。
2. 如果第 0 个 bafhlst_t 结构中有 msadsc_t 结构就直接返回,若没有 msadsc_t 结构,就会继续查找 m_mdmlielst 数组中的第 1 个 bafhlst_t 结构。
3. 如果第 1 个 bafhlst_t 结构中也没有 msadsc_t 结构,就会继续查找 m_mdmlielst 数组中的第 2 个 bafhlst_t 结构。
4. 如果第 2 个 bafhlst_t 结构中有 msadsc_t 结构,记住第 2 个 bafhlst_t 结构中对应是 4 个连续的 msadsc_t 结构。这时让这 4 个连续的 msadsc_t 结构从第 2 个 bafhlst_t 结构中脱离。
5. 把这 4 个连续的 msadsc_t 结构,对半分割成 2 个双 msadsc_t 结构,把其中一个双 msadsc_t 结构挂载到第 1 个 bafhlst_t 结构中。
6. 把剩下一个双 msadsc_t 结构,继续对半分割成两个单 msadsc_t 结构,把其中一个单 msadsc_t 结构挂载到第 0 个 bafhlst_t 结构中,剩下一个单 msadsc_t 结构返回给请求者,完成内存分配。
我画幅图表示这个过程,如下图所示。
内存分配算法示意图
代码、文字、图,三管齐下,你一看便明白了。
内存页的释放
理解了内存页的分配,掌握内存页的释放就是水到渠成的事儿。其实,内存页的释放就是内存页分配的逆向过程。我们从内存页分配过程了解到,可以一次分配一个或者多个页面,那么释放内存页也必须支持一次释放一个或者多个页面。
我们同样在 cosmos/hal/x86/memdivmer.c 文件中,写一个内存释放的接口函数和框架函数,代码如下所示。
我们的内存释放页面的代码的结构依然是:接口函数调用框架函数,框架函数调用核心函数,函数的返回值都是 bool 类型,即 TRUE 或者 FALSE,来表示内存页面释放操作成功与否。
我们从框架函数中可以发现,内存区是由 msadsc_t 结构中获取的,因为之前该结构中保留了所在内存区的类型,所以可以查到并返回内存区。
在释放内存页面的核心 mm_merpages_core 函数中,会调用 mm_merpages_onmarea 函数,下面我们来实现这个函数,代码如下。
显然,在经过 mm_merpages_opmsadsc 函数操作之后,我们并没有将 msadsc_t 结构加入到对应的 bafhlst_t 结构中,这其实是在下一个函数完成的,那就是 mm_merpages_onbafhlst 这个函数。下面我们来实现它,代码如下所示。
这段代码的注释,已经写出了整个释放页面逻辑,最核心的还是要对空闲页面进行合并,合并成更大的连续的内存页面,这是这个释放算法的核心逻辑。
还是老规矩,我同样举个例子来演绎一下这个算法。比如,现在我们要释放一个页面,这个算法将执行如下步骤。
1. 释放一个页面,会返回 m_mdmlielst 数组中的第 0 个 bafhlst_t 结构。
设置这个页面对应的 msadsc_t 结构的相关信息,表示已经执行了释放操作。
开始查看第 0 个 bafhlst_t 结构中有没有空闲的 msadsc_t,并且它和要释放的 msadsc_t 对应的物理地址是连续的。没有则把这个释放的 msadsc_t 挂载第 0 个 bafhlst_t 结构中,算法结束,否则进入下一步。
把第 0 个 bafhlst_t 结构中的 msadsc_t 结构拿出来与释放的 msadsc_t 结构,合并成 2 个连续且更大的 msadsc_t。
继续查看第 1 个 bafhlst_t 结构中有没有空闲的 msadsc_t,而且这个空闲 msadsc_t 要和上一步合并的 2 个 msadsc_t 对应的物理地址是连续的。没有则把这个合并的 2 个 msadsc_t 挂载第 1 个 bafhlst_t 结构中,算法结束,否则进入下一步。
把第 1 个 bafhlst_t 结构中的 2 个连续的 msadsc_t 结构,还有合并的 2 个地址连续的 msadsc_t 结构拿出来,合并成 4 个连续且更大的 msadsc_t 结构。
继续查看第 2 个 bafhlst_t 结构,有没有空闲的 msadsc_t 结构,并且它要和上一步合并的 4 个 msadsc_t 结构对应的物理地址是连续的。没有则把这个合并的 4 个 msadsc_t 挂载第 2 个 bafhlst_t 结构中,算法结束。
上述步骤,我们只要在一个循环中执行就行。我用一幅图表示这个过程,如下所示。
内存释放算法
这个是不是很熟悉,这正是前面的内存分配图反过来了的结果。最终我们验证了,释放内存就是分配内存的逆向过程。
好了,到这里,一个优秀的物理内存页面管理器就实现了。
重点回顾
1. 我们实现了内存分配接口、框架、核心处理函数,其分配算法是:如果能在 dm_mdmlielst 数组中找到对应请求页面数的 msadsc_t 结构就直接返回,如果没有就寻找下一个 dm_mdmlielst 数组中元素,依次迭代直到最大的 dm_mdmlielst 数组元素,然后依次对半分割,直到分割到请求的页面数为止。
2. 对应于内存分配过程,我们实现了释放页面的接口、框架、核心处理函数,其释放算法则是分配算法的逆向过程,会查找相邻且物理地址连续的 msadsc_t 结构,进行合并,合并工作也是迭代过程,直到合并到最大的连续 msadsc_t 结构或者后面不能合并为止,最后把这个合并到最大的连续 msadsc_t 结构,挂载到对应的 dm_mdmlielst 数组中。
你是不是感觉我们的内存管理器还有缺陷,这只能分配页面?是的,只能分配页面是不行的,你有什么更好的方案吗?下一课我们一起讨论。
思考题
在内存页面分配过程中,是怎样尽可能保证内存页面连续的呢?
欢迎你在留言区记录你的收获或疑问。如果这节课对你有启发,也欢迎分享给你的同事、朋友。
好,我是 LMOS,我们下节课见!
分享给需要的人,Ta购买本课程,你将得20元
生成海报并分享
赞 9
提建议
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
上一篇
17 | 划分土地(中):如何实现内存页面初始化?
下一篇
19 | 土地不能浪费:如何管理内存对象?
精选留言(12)
- neohope2021-06-20一、再梳理一下内存结构 1、内存memmgrob_t被划分为多个功能分区,每个功能分区用一个memarea_t描述 2、每个memarea_t都有一个memdivmer_t ,每个memdivmer_t 都有一个bafhlst_t数组[0-51] 3、每个bafhlst_t都有一个链表,用于存放内存段,规则为: bafhlst_t数组中的每个bafhlst_t,会根据其在数组中的序号n,存放全部2的n次方的连续页面,也就是说: 第0个bafhlst_t,存放全部长度为1的内存段 第1个bafhlst_t,存放全部长度为2的内存段 第2个bafhlst_t,存放全部长度为4的内存段 ...... 4、在内存段处理时,将开始的msadsc_t指向了最后msadsc_t结构,内存段的起止就都清晰了,而且无论首尾,都记录了分配情况,方便各类操作 5、所以从设计层面来讲,页面的分配和释放,也一定只会是2的n次方大小 二、申请 1、根据类型找到内存区,也就是定位到了memarea_t->memdivmer_t->bafhlst_t数组 2、根据申请内存大小,用二进制1的查找,确定要至少要从bafhlst_t数组中的哪个bafhlst_t申请,才能得到足够大的内存 3、从第一个合适的bafhlst_t到最大的bafhlst_t,依次判断链表中有没有可用内存段,一旦有可用的内存段就使用 4、如果内存段大于所需,就要把多出来的内存不断除以2挂载到上一个bafhlst_t,直到达到所需长度 5、设置内存段状态,起始msadsc_t都标记为已占用 6、更新各层结构相关信息,内存申请结束 7、代码中还有各种加锁解锁,各种校验,还有从大到小申请的一种方式,可以看下 三、释放 1、根据要释放内存段的msadsc_t,获取属于哪个内存区,也就是定位到了memarea_t->memdivmer_t->bafhlst_t数组 2、根据释放内存大小,用二进制1的查找,确定最大可以释放到bafhlst_t数组中的哪个bafhlst_t,避免内存碎片化 3、设置内存段状态,起始msadsc_t都标记为未使用 4、从找到的第一个bafhlst_t到最大的bafhlst_t,依次去看链表中有没有内存段是挨着的,如果有就合并,再去下一个bafhlst_t继续合并 一旦某个bafhlst_t中没能合并,就可以退出了,因为我们只存2的n次方大小的内存段 而且每次合并内存段后,都要清理多余的标记,而且开始的msadsc_t要指向最后的msadsc_t 5、把最终合并后的内存段,加入到对应的bafhlst_t中,重新设置内存段的起始msadsc_t标记 6、更新好各层结构相关信息,内存释放结束 7、代码中还有各种加锁解锁,各种校验,可以看下 四、对于最后的问题 其实无论采用哪种分配方式,内存的碎片化都是难以彻底避免的。无论是操作系统、虚拟机还是应用,都要面对这个问题。业界有多种思路来解决或缓解此问题: 1、把不可移动内存单独管理,系统内存分区其实在一定程度上解决了这些问题 2、linux采用了 buddy system来缓解内存碎片问题,本节已经介绍 3、linux中为了处理特别小的内存请求,引入了slab技术,来辅助buddy system 4、windows有一种LFH技术,在程序启动时,会额外分配一定的连续内存给这个进程备用,从而降低系统层面的内存管理负担 5、windows在进程退出后,不会立即释放dll文件相关内存,一方面提速,一方面也缓解了操作系统内存管理负担。其实,看下你手机的APP,切换到后台时,就是这个效果 6、无论是linux还是windows都有低优先级进程,在后台默默做着内存规整工作,类似于磁盘碎片清理 7、JVM虚拟机,GC时会通过标记-整理(比如CMS)或复制-清除(比如G1)的方法来解决部分碎片问题 8、类似与LFH,可以考虑在内存分配时额外预留一部分,下次分配在预留的地方继续分配 9、为了内存规整方便,可以考虑靠近应用已分配内存区域进行分配 10、还有一种思路,就是将不连续的内存,转换为逻辑上连续的内存,来绕过碎片化问题,但一些情况下性能难以保证 应用层面也有工作能做: 1、比如redis在处理内存的时候,申请时会额外申请一部分先备着【记得是jemalloc】,释放时也不会立即释放,有单独的线程进行处理,在应用层面去降低系统内存管理负担 2、同时,redis在数据结构上也做了很多努力 3、在写程序的时候,尽量不要零零散散的去申请大量小内存; 4、除了标准库以外,可以试一下 jemalloc或Doug Lea's malloc 5、感兴趣可以看下redis内存管理的代码 额,好像跑题了。。。展开
作者回复: 老铁的梳理,我只能大写66666
共 4 条评论40 - pedro2021-06-18分配的时候,如果是多个内存页面,优先向数组后面寻找,即多个连续的内存页,这就能保证分配的页面是连续的,释放的释放,组合多个页面,保证下次分配时候的连续性。 页大小是 4KB,对于小对象的分配,这样是非常浪费的,每开辟一个小对象都要申请一个物理页,这谁受得了啊,所以啊,linux 提出了 slab 分配算法。
作者回复: 下节课会讲的
共 2 条评论6 - Fan2021-06-29在内存页面分配过程中,是怎样尽可能保证内存页面连续的呢? 1 .先找到能满足的需要的内存 在m_mdmlielst中的位置。 2.如果内存段大于所需,就要把多出来的内存不断除以2挂载到上一个bafhlst_t,直到达到所需长度。 例如 需要9k内存: 先定位到第 4 个 bafhlst_t 结构中的 4 个连续的 msadsc_t 结构16k(4K*4) 。 分出9K 内存,往上一个bafhlst_t挂载,直到把剩余的内存挂载完。 16K --> 9K 4K 2K 1K展开
作者回复: 66666
共 3 条评论3 - 吕默2021-09-10看代码完全看不懂,但是看图马上懂的不行——天生架构师。。。。。。。
作者回复: 哈哈 你写ppt一定很厉害了
2 - 沈畅2021-09-07为什么分配pages,只设置链表首尾结构的属性,中间结构不用设置吗?这里不太理解 比如分4个页面,只设置msadsc[0] masadsc[3]的属性吗?
作者回复: 中间和首尾是一个整体 所以不需要设置
1 - 朱熙2021-06-18这节课讲的基本是buddy吧?下面对于小对象就是slab了
作者回复: Linux的伙伴系统在后面会讲的
1 - blentle2021-06-18回答一下思考题,是不是有个单独的线程或者每次释放内存后开个守护线程进行碎片整理和移动来实现. 还有这节课的代码真的好硬核,需要好长时间消化
作者回复: 你好,确实可以 这样做
1 - lhgdy2022-12-13 来自北京大佬,一个malloc 很大的一个数组,实际分类物理内存时候会 对应多个 不连续的物理内存页吗?
- lhgdy2022-12-13 来自北京存不存在合并性能很差的问题? 每个 list 中的数据是无须的,要全部遍历一遍才能知道是否能合并吧?
- Han2022-07-21有个疑问,比如第一次申请9k,第二次申请2k,第三次释放9k 第一次:按照文章中的算法,有7k放到前面的bafhlst_t中:16K --> 9K 4K 2K 1K 第二次:2k的bafhlst_t被占用 第三次:释放至1k位置,2k的bafhlst_t被占用,算法结束,后面的4k就没有被回收了?
作者回复: 666666666
共 2 条评论 - 艾恩凝2022-04-14打卡,代码全部分析完了,分配的时候,我发现并没有把bafhlst_h 中的af_frelst 这个链表中空闲的 转到 af_alclst中去,释放的时候这个af_alclst 也没用到,那这不是白定义了 ,代码解释太粗糙,还是自己慢慢来看代码。用导图再重新梳理一遍,查漏
作者回复: 不是白定义 是算法没完全实施 在课程的代码中 没用到而已
- 沈畅2021-09-08花了三天时间对着代码把物理内存管理内容看完了。收益很大。虽然还有一些字段不明白意思,后续继续研究。这里有个疑问,在释放内存pages时,需要进行page的合并,遍历bafhlst_t数组,这样会不会性能上比较低?
作者回复: 不会的 这个数组不会动态增加 也不是全部遍历