六：操作系统虚拟内存补充之虚拟内存中的页面换入换出：原理、策略与优化_虚拟内存与基于访问热度频率的数据替换策略-CSDN博客

本文链接：https://blog.csdn.net/weixin_44007213/article/details/147970832

虚拟内存中的页面换入换出：原理、策略与优化

引言

在现代计算机系统中，虚拟内存是一项基础且关键的技术，它让应用程序能够使用比物理内存更大的地址空间。实现这一机制的核心是内存页面的换入换出策略，有效的页面置换算法可以显著提高系统性能，减少磁盘I/O操作，优化内存资源的使用。本文将详细探讨内存页到磁盘的换入换出机制、常见的置换算法以及相关的优化策略。

虚拟内存与页面置换基本原理

虚拟内存的工作机制

虚拟内存的核心思想是将物理内存视为硬盘的高速缓存，只将活跃使用的程序部分保留在内存中，其余部分存储在磁盘上。整个过程对应用程序透明，程序感知到的是一个连续、大容量的内存空间，而实际上这些内存地址被映射到物理内存或磁盘上的不同位置。

系统通过"分页"技术实现虚拟内存管理：

将虚拟地址空间划分为固定大小的页面(通常为4KB)
将物理内存划分为同样大小的页框(page frame)
使用页表记录虚拟页面与物理页框的映射关系

为什么需要页面换出

当系统物理内存不足时，操作系统需要决定哪些页面应该保留在内存中，哪些应该被换出到磁盘，这就是页面置换(Page Replacement)机制的核心问题。这种机制是必要的，原因如下：

物理内存有限：与虚拟地址空间相比，物理内存总是有限的
多进程并发：多个进程同时运行时，它们共享物理内存资源
局部性原理：程序在执行过程中通常只集中访问其地址空间的一小部分

页面换入换出的基本流程

页面换出(Page-out)过程

当物理内存不足需要为新页面腾出空间时，系统会执行以下步骤：

根据置换算法选择一个"牺牲页"(victim page)
如果该页被修改过(脏页)，将其内容写回磁盘
更新页表，将该虚拟页面标记为"不在内存中"
释放对应的物理页框

页面换入(Page-in)过程

当程序访问的页面不在内存中时，会触发缺页异常(Page Fault)，系统处理流程如下：

CPU捕获到缺页异常，控制权转移到操作系统
操作系统确认该虚拟地址有效且页面在磁盘上
寻找一个空闲的物理页框(如果没有空闲页框，需要先换出某个页面)
从磁盘读取所需页面到物理页框
更新页表，建立新的映射关系
恢复程序执行，重新执行导致缺页异常的指令

页面置换算法

页面置换算法用于决定当内存不足时应该换出哪些页面，这对系统性能有重大影响。以下是几种经典的置换算法：

最优置换算法(OPT/Belady’s Algorithm)

原理：选择将来最长时间内不会被访问的页面进行置换。

优点：理论上可达到最低的缺页率。

缺点：需要预知未来的访问序列，在实际系统中难以实现。

示例：
假设内存可容纳3个页面，当前内存中有页面[1,2,3]，未来的访问序列是[4,2,1,5,3]，那么在需要为页面4腾出空间时，应该置换页面3，因为它在未来会最晚被访问。

先进先出算法(FIFO)

原理：置换最先进入内存的页面。

优点：实现简单，只需维护一个队列。

缺点：不考虑页面的使用频率，可能会置换出经常使用的页面；存在Belady异常(增加物理页框反而导致缺页率上升)。

示例：
内存可容纳3个页面，访问序列[1,2,3,4,1,2,5,1,2,3,4]

初始状态：内存为空[]
访问1：缺页，装入1，内存为[1]
访问2：缺页，装入2，内存为[1,2]
访问3：缺页，装入3，内存为[1,2,3]
访问4：缺页，置换最早的1，内存为[2,3,4]
访问1：缺页，置换最早的2，内存为[3,4,1]
…以此类推

最近最少使用算法(LRU)

原理：置换最长时间未被访问的页面。

优点：较好地反映了程序的局部性原理，性能接近最优算法。

缺点：实现复杂，需要记录每个页面的最后访问时间或维护一个访问顺序栈。

示例：
内存可容纳3个页面，访问序列[1,2,3,4,1,2,5]

前三次访问后，内存为[1,2,3]
访问4：置换最久未使用的1，内存为[4,2,3]
访问1：置换最久未使用的3，内存为[4,2,1]
访问2：2已在内存中，不需置换，内存仍为[4,2,1]
访问5：置换最久未使用的4，内存为[5,2,1]

最不经常使用算法(LFU)

原理：置换访问频率最低的页面。

优点：考虑了页面的访问频率。

缺点：不考虑时间局部性；新页面因计数器值小而可能很快被置换出去；需要维护计数器增加开销。

示例：
假设页面访问计数为：页面1(10次)、页面2(5次)、页面3(7次)，需要为新页面腾出空间，则会置换页面2，因为它的访问频率最低。

时钟置换算法(Clock)

原理：对FIFO的改进，使用一个循环队列和"使用位"来模拟时钟，只置换未被访问过的页面。

实现：

页表项增加一个"使用位"(referenced bit)
当页面被访问时，将使用位设为1
指针按FIFO顺序在循环队列中移动：
- 如果指向页面的使用位为1，则清零并继续移动
- 如果使用位为0，则置换该页面

优点：实现简单，开销小，性能接近LRU。

示例：
假设内存中有页面[1,2,3,4]，使用位分别为[1,0,1,0]，时钟指针指向页面1：

检查页面1，使用位为1，清零后指针移动到页面2
检查页面2，使用位为0，置换页面2
新页面5进入内存，现在内存为[1,5,3,4]，使用位为[0,1,1,0]

改进的时钟算法(Enhanced Clock)

原理：在基本时钟算法基础上增加"修改位"(dirty bit)的考量，优先置换未被修改的页面，减少磁盘写操作。

实现：考虑使用位®和修改位(M)的组合(R,M)，优先级从低到高为：

(0,0)：未被访问且未被修改
(0,1)：未被访问但被修改
(1,0)：已被访问但未被修改
(1,1)：已被访问且被修改

页面缓冲策略

为了提高系统性能，现代操作系统通常采用以下缓冲策略：

双重分页缓冲

系统保持一个空闲页框列表，以便在需要时快速分配。同时，还维护一个最近被换出的页面列表(页面缓存)，如果这些页面被再次请求，可以快速恢复而无需从磁盘读取。

预取策略

基于程序的空间局部性原理，当一个页面被调入内存时，系统可能会预见性地加载相邻的几个页面，减少未来的缺页中断。

例如：程序顺序访问大型数组时，预取相邻页面可以显著提高性能。如果程序正在访问数组第1页的末尾元素，系统可能会预先加载第2页，以便在程序继续执行时减少等待时间。

抖动问题与工作集模型

抖动(Thrashing)

定义：系统将大量时间用于页面换入换出而几乎没有实际工作的状态。

原因：当物理内存不足以容纳多个进程的工作集时，进程执行一小段时间后就会发生缺页，导致频繁的页面置换。

解决方法：

减少系统中的进程数量
增加物理内存
使用工作集模型来控制多道程序度

工作集模型

定义：进程在一段时间窗口内实际访问的页面集合。

原理：

只有当进程的工作集能完全装入内存时，才允许该进程运行
如果所有活跃进程的工作集总和超过可用物理内存，系统会暂停部分进程

示例：
假设进程A的工作集大小为10MB，进程B的工作集为15MB，但系统只有20MB可用内存，则系统可能会暂停进程A或B，而不是让两者同时运行导致抖动。

现代操作系统实现举例

Linux的页面置换策略

Linux使用多层次的页面管理机制：

活跃/不活跃列表：维护两个列表来跟踪页面活跃度
最近最少使用(LRU)近似算法：通过页表的访问位来估计页面使用情况
预读机制：基于文件访问模式预读页面
回写策略：脏页不会立即写回磁盘，而是被放入回写队列，定期刷新

具体例子：
当Linux系统内存压力增大时，首先从不活跃列表中选择页面进行回收。如果页面干净(未修改)，直接释放；如果是脏页，先写回磁盘。同时，系统会周期性地将长时间未访问的页面从活跃列表移至不活跃列表。

Windows的内存管理

Windows使用一种称为"修改后的时钟"算法，结合了工作集模型和老化算法：

维护每个进程的工作集
使用页面使用位和修改位进行置换决策
采用"软页错误"和"硬页错误"区分不同类型的缺页

换入换出性能优化技术

页面压缩(Page Compression)

原理：将换出的页面压缩后存储在内存特定区域，而不是直接写入磁盘。

优点：减少磁盘I/O，提高系统响应速度。

例子：Linux中的zram/zswap模块可以创建压缩的内存交换空间。

页面合并(Page Coalescing)

原理：检测并合并具有相同内容的页面，节省物理内存。

例子：KSM(Kernel Samepage Merging)在Linux系统中广泛用于虚拟化环境，可以检测并合并虚拟机中的重复页面。

混合存储系统

原理：使用SSD或NVMe设备作为交换空间，显著提高换入换出的速度。

例子：配置一个10GB的SSD分区作为主要交换空间，与传统硬盘交换分区相比，可以将页面换入换出的延迟从毫秒级降低到微秒级。

结论

内存页面换入换出是虚拟内存管理的核心机制，直接影响系统的性能和响应速度。良好的页面置换算法和优化策略能够显著减少页面置换开销，提高系统效率。随着新型存储技术的发展，内存管理策略也在不断演进，以适应现代计算环境的需求。

对于开发人员和系统管理员而言，理解这些机制有助于优化应用程序和系统配置，避免内存不足和抖动等问题，从而提供更好的用户体验。