跳表：有序链表的加速技巧-CSDN博客

本文链接：https://blog.csdn.net/qq_39032307/article/details/149305689

跳表：有序链表的加速技巧

想象一下你在图书馆找一本书。如果所有的书都杂乱无章地堆在一起，你需要一本一本翻看才能找到目标。但如果图书管理员已经按照字母顺序排列好了书籍，你就可以使用二分查找快速定位。跳表(Skip List)就是这样一个为链表添加"快速通道"的聪明数据结构，让我们能在有序链表中实现接近二分查找的效率。

一、从链表到跳表：为什么需要它？

理解了链表查找效率低下的问题后，我们来看看跳表是如何解决这个问题的。链表是我们熟悉的基础数据结构，它由一系列节点组成，每个节点包含数据和指向下一个节点的指针。链表的插入和删除操作非常高效，时间复杂度是O(1)，但查找操作却需要O(n)的时间复杂度，因为它必须从头开始逐个遍历。

以上流程图说明了链表的基本特性及其主要问题：查找效率低下。

跳表通过在原始链表上添加多层"快速通道"来解决这个问题。每一层都是一个链表，但包含的节点数量逐层减少，形成一种"金字塔"结构。查找时可以从顶层开始，快速跳过大量节点，然后逐步降层，直到找到目标。

以上流程图展示了跳表的基本构建过程：通过逐层添加索引来加速查找。

二、跳表的工作原理

理解了跳表的基本概念后，让我们深入探讨它的工作原理。跳表的核心思想是通过概率性地构建多层索引来加速查找。每一层都是下一层的"快速通道"，包含的节点数量大约是下一层的一半。

跳表的查找过程就像在一个有多条道路的城市中导航：

以上序列图展示了跳表的查找过程：从顶层开始，逐步降层，最终在底层找到目标节点。

跳表的节点结构比普通链表节点更复杂，因为它需要维护多个层次的指针：

class SkipListNode {
    int value;
    SkipListNode[] forward; // 各层的下一个节点指针
    
    public SkipListNode(int value, int level) {
        this.value = value;
        this.forward = new SkipListNode[level + 1];
    }
}

上述代码定义了跳表节点的基本结构，包含存储的值和指向各层下一个节点的指针数组。

跳表的关键操作

1. 查找操作

查找是跳表的核心操作，其时间复杂度可以达到O(log n)。查找过程从最高层开始，向右移动直到找到比目标值大的节点，然后降一层继续查找，直到最底层。

public boolean contains(int value) {
    SkipListNode current = header;
    
    // 从最高层开始查找
    for (int i = currentLevel; i >= 0; i--) {
        while (current.forward[i] != null && current.forward[i].value < value) {
            current = current.forward[i];
        }
    }
    
    // 现在在最底层
    current = current.forward[0];
    return current != null && current.value == value;
}

上述代码实现了跳表的查找操作，展示了如何从高层到底层逐步缩小查找范围。

2. 插入操作

插入操作需要先确定新节点的层数（这是跳表的关键特性之一），然后在各层中插入新节点。层数的确定通常使用随机算法，保证高层节点数量大约是低层的一半。

public void insert(int value) {
    // 1. 确定新节点的层数
    int level = randomLevel();
    
    // 2. 创建新节点
    SkipListNode newNode = new SkipListNode(value, level);
    
    // 3. 查找各层的插入位置并更新指针
    SkipListNode current = header;
    for (int i = currentLevel; i >= 0; i--) {
        while (current.forward[i] != null && current.forward[i].value < value) {
            current = current.forward[i];
        }
        
        if (i <= level) {
            newNode.forward[i] = current.forward[i];
            current.forward[i] = newNode;
        }
    }
    
    // 4. 更新跳表的最高层数
    if (level > currentLevel) {
        currentLevel = level;
    }
}

private int randomLevel() {
    int level = 0;
    while (Math.random() < PROBABILITY && level < MAX_LEVEL) {
        level++;
    }
    return level;
}

上述代码展示了跳表的插入操作，包括随机确定节点层数、查找各层插入位置和更新指针的过程。

以上状态图描述了插入操作的主要步骤和状态转换。

3. 删除操作

删除操作需要找到待删除节点在各层的前驱节点，然后更新它们的指针以跳过被删除节点。

public boolean delete(int value) {
    boolean found = false;
    SkipListNode current = header;
    
    // 从最高层开始查找
    for (int i = currentLevel; i >= 0; i--) {
        while (current.forward[i] != null && current.forward[i].value < value) {
            current = current.forward[i];
        }
        
        if (current.forward[i] != null && current.forward[i].value == value) {
            found = true;
            current.forward[i] = current.forward[i].forward[i];
        }
    }
    
    // 如果删除了最高层的节点，可能需要降低跳表层数
    while (currentLevel > 0 && header.forward[currentLevel] == null) {
        currentLevel--;
    }
    
    return found;
}

上述代码实现了跳表的删除操作，展示了如何从各层中移除目标节点并更新相关指针。

三、跳表的性能分析

了解了跳表的基本操作后，我们来看看它的性能特点。跳表最吸引人的地方在于它能够在保持链表简单性的同时，提供接近平衡二叉搜索树的查找性能。

时间复杂度

查找: O(log n) 平均情况，最坏情况下O(n)
插入: O(log n) 平均情况
删除: O(log n) 平均情况

空间复杂度

跳表需要额外的空间来存储多层索引，平均每个节点需要大约1.5个指针（相比普通链表的1个指针）。因此空间复杂度是O(n)。

与平衡树的比较

跳表与平衡二叉搜索树（如AVL树、红黑树）相比有几个显著优势：

实现更简单，不需要复杂的旋转操作
支持高效的区间查询
并发环境下更容易实现无锁操作

以上思维导图总结了跳表相比平衡树的主要优势。

四、跳表的实际应用

理解了跳表的原理和性能后，我们来看看它在实际系统中的应用。跳表由于其简单的实现和良好的性能，被广泛应用于多种系统中。

1. Redis的有序集合

Redis使用跳表来实现其有序集合(Sorted Set)数据类型。当有序集合中的元素数量较多或者元素较长时，Redis会使用跳表来存储数据。

Redis选择跳表而不是平衡树的原因包括：实现简单、区间查询高效、内存占用更可预测，以及在并发环境下更容易实现无锁操作。

2. LevelDB/RocksDB

这些键值存储引擎使用跳表作为内存中的数据结构，用于快速查找和排序操作。

3. Lucene

Lucene搜索引擎在某些情况下使用跳表来加速文档ID的查找。

五、实现一个简单的跳表

现在让我们动手实现一个简单的跳表，以便更好地理解它的工作原理。我们将实现一个支持插入、查找和删除操作的整数跳表。

import java.util.Random;

public class SkipList {
    private static final int MAX_LEVEL = 16; // 最大层数
    private static final double PROBABILITY = 0.5; // 层数增加的概率
    
    private final SkipListNode header = new SkipListNode(Integer.MIN_VALUE, MAX_LEVEL);
    private int currentLevel = 0; // 当前使用的最大层数
    private final Random random = new Random();
    
    // 跳表节点定义
    private static class SkipListNode {
        int value;
        SkipListNode[] forward;
        
        SkipListNode(int value, int level) {
            this.value = value;
            this.forward = new SkipListNode[level + 1];
        }
    }
    
    // 查找操作
    public boolean contains(int value) {
        SkipListNode current = header;
        
        for (int i = currentLevel; i >= 0; i--) {
            while (current.forward[i] != null && current.forward[i].value < value) {
                current = current.forward[i];
            }
        }
        
        current = current.forward[0];
        return current != null && current.value == value;
    }
    
    // 插入操作
    public void insert(int value) {
        SkipListNode[] update = new SkipListNode[MAX_LEVEL + 1];
        SkipListNode current = header;
        
        // 查找各层的插入位置
        for (int i = currentLevel; i >= 0; i--) {
            while (current.forward[i] != null && current.forward[i].value < value) {
                current = current.forward[i];
            }
            update[i] = current;
        }
        
        // 确定新节点的层数
        int level = randomLevel();
        
        // 如果新节点的层数高于当前层数，更新高层指针
        if (level > currentLevel) {
            for (int i = currentLevel + 1; i <= level; i++) {
                update[i] = header;
            }
            currentLevel = level;
        }
        
        // 创建新节点并在各层插入
        SkipListNode newNode = new SkipListNode(value, level);
        for (int i = 0; i <= level; i++) {
            newNode.forward[i] = update[i].forward[i];
            update[i].forward[i] = newNode;
        }
    }
    
    // 删除操作
    public boolean delete(int value) {
        SkipListNode[] update = new SkipListNode[MAX_LEVEL + 1];
        SkipListNode current = header;
        
        // 查找各层的前驱节点
        for (int i = currentLevel; i >= 0; i--) {
            while (current.forward[i] != null && current.forward[i].value < value) {
                current = current.forward[i];
            }
            update[i] = current;
        }
        
        current = current.forward[0];
        
        // 如果找到目标节点，从各层中删除
        if (current != null && current.value == value) {
            for (int i = 0; i <= currentLevel; i++) {
                if (update[i].forward[i] != current) {
                    break;
                }
                update[i].forward[i] = current.forward[i];
            }
            
            // 如果删除了最高层的节点，降低跳表层数
            while (currentLevel > 0 && header.forward[currentLevel] == null) {
                currentLevel--;
            }
            
            return true;
        }
        
        return false;
    }
    
    // 随机生成节点层数
    private int randomLevel() {
        int level = 0;
        while (random.nextDouble() < PROBABILITY && level < MAX_LEVEL) {
            level++;
        }
        return level;
    }
    
    // 打印跳表结构（用于调试）
    public void print() {
        System.out.println("SkipList:");
        for (int i = currentLevel; i >= 0; i--) {
            System.out.print("Level " + i + ": ");
            SkipListNode node = header.forward[i];
            while (node != null) {
                System.out.print(node.value + " ");
                node = node.forward[i];
            }
            System.out.println();
        }
    }
}