为什么Python的列表pop末尾元素比pop指定位置快，从源码看如何体现

访客源码剖析 2026-06-04 22:40:46 1

Python列表的pop行为：为什么末尾删除比指定位置快1000倍？从源码深度解析

📑 目录导读

现象：一个简单的性能测试
底层数据结构：动态数组的内存布局
CPython源码中的pop实现
性能差异的根源：内存搬移与指针操作
常见问题与最佳实践
理解数据结构选择对性能的影响

现象：一个简单的性能测试

运行下面这段代码,你会看到惊人的差异：

import time
lst = list(range(1000000))
# 测试pop末尾
start = time.time()
for _ in range(100000):
    lst.pop()  # 删除最后元素
print("pop末尾耗时:", time.time() - start)
lst2 = list(range(1000000))
# 测试pop指定位置（比如第0个）
start = time.time()
for _ in range(100000):
    lst2.pop(0)  # 删除第一个元素
print("pop位置0耗时:", time.time() - start)

典型输出：

pop末尾耗时：0.003秒
pop位置0耗时：3.2秒

性能差距超过1000倍，这个差异不是Python语言层面的问题,而是底层C语言实现的数据结构设计决定的。

底层数据结构：动态数组的内存布局

Python的list在CPython源码中实现为动态数组（dynamic array），核心结构体定义在Include/listobject.h中：

typedef struct {
    PyObject_VAR_HEAD  // 头部信息：包含引用计数和类型
    PyObject **ob_item; // 指向元素数组的指针
    Py_ssize_t allocated; // 已分配的内存空间大小
} PyListObject;

关键理解：

ob_item是一个连续内存块，存储指向实际对象的指针
元素在内存中按索引顺序紧密排列

lst = [a, b, c]在内存中的布局是：

索引:  [0]    [1]    [2]
      ┌──────┬──────┬──────┐
指针: │ &a   │ &b   │ &c   │
      └──────┴──────┴──────┘
      连续内存地址

这种结构的优点是通过索引访问元素是O(1)，因为是直接计算偏移量：*(ob_item + index)。

CPython源码中的pop实现

查看CPython的Objects/listobject.c源码（Python 3.10+）,pop操作的实现逻辑如下：

1 pop() 无参数 → 删除末尾

static PyObject *
list_pop(PyListObject *self, PyObject *args)
{
    Py_ssize_t i;
    PyObject *v;
    if (!PyArg_ParseTuple(args, "|n:pop", &i))
        return NULL;
    if (self->ob_size == 0) {
        PyErr_SetString(PyExc_IndexError, "pop from empty list");
        return NULL;
    }
    // 关键代码：如果没传参数，i = -1
    if (i < 0)
        i += self->ob_size;  // -1 + size = 最后一个索引
    // 检查索引有效性
    if (i < 0 || i >= self->ob_size) {
        PyErr_SetString(PyExc_IndexError, "pop index out of range");
        return NULL;
    }
    v = self->ob_item[i];  // 获取要删除的元素指针
    // 这里后面会根据i的位置决定是否搬移内存
    ...
}

对于pop()无参数的情况，i被计算为size-1，即最后一个元素,此时删除操作非常简单：

获取最后一个元素的指针
修改ob_size减1（其他元素不动）

什么也不搬移。

2 pop(i) 有参数 → 删除指定位置

对于pop(0)（指定索引0）,源码中的搬移逻辑：

if (i < self->ob_size - 1) {
    // 关键：需要将后续所有元素向前搬移
    memmove(self->ob_item + i,
            self->ob_item + i + 1,
            (self->ob_size - i - 1) * sizeof(PyObject *));
}

memmove函数的作用：

将索引i+1到末尾的所有元素指针，整体向前移动一个位置
需要移动的元素个数：(size - i - 1)个

当i=0时，需要移动n-1个元素指针，对于一个100万元素的列表，需要搬移99.9999万个指针。

性能差异的根源：内存搬移与指针操作

1 时间复杂度对比

操作	时间复杂度	内存操作
`pop()`	O(1)	仅修改长度计数器
`pop(0)`	O(n)	搬移n-1个8字节指针
`pop(mid)`	O(n-k)	搬移size-index-1个指针

2 为什么搬移这么慢？

内存访问延迟：memmove需要遍历连续内存，每次读取和写入都有延迟
CPU缓存失效：搬移后后续元素地址改变，之前缓存的数据失效
内存带宽消耗：搬移100万指针约8MB数据（64位系统）

3 源码注释的证实

在Objects/listobject.c中有一段关键注释说明了设计选择（Python 3.11版本）：

/* Algorithms for popping:
   - If popping the last element, just decrement size and return.
   - If popping an interior element, need to shift elements.
     This is O(n) because of the memmove operation.
*/

注释明确承认：末尾pop只需要减size，内部pop需要O(n)的memmove。

4 测试不同位置的性能梯度

import time
def test_pop_position(size=100000):
    lst = list(range(size))
    # 测试不同位置的pop
    positions = [size-1, size//2, 0]
    for pos in positions:
        temp = lst[:]  # 复制列表
        start = time.time()
        for _ in range(1000):
            temp.pop(pos)
        print(f"pop位置{pos}: {time.time()-start:.4f}秒")
test_pop_position(100000)

典型结果：

pop位置99999（末尾）：0.0001秒
pop位置50000（中间）：0.023秒
pop位置0（开头）：0.046秒

越靠近开头，需要搬移的元素越多，耗时越长。

常见问题与最佳实践

Q1：如果我想频繁删除头部元素，怎么办？

答案：使用collections.deque，它是基于双向链表实现的：

from collections import deque
d = deque(range(1000000))
# popleft() 和 pop() 都是O(1)
d.popleft()  # O(1)

deque的pop两端都是O(1)，因为它直接修改指针,不需要内存搬移。

Q2：为什么Python不把list改成链表？

答案：因为list设计为随机访问数据结构，链表虽然pop头部O(1)，但索引访问变成O(n)，Python大部分场景需要快速索引（如lst[5000]）,所以选择了动态数组。

Q3：pop指定位置的底层是否有优化？

答案：CPython对pop有小优化：如果pop的是最后一个元素（无论是否传参pop(-1)），都会走O(1)路径,但pop非最后一个元素必须搬移。

Q4：删除多个元素时，有什么更好的方式？

答案：

# ❌ 错误：多次pop(0)导致O(n²)
for _ in range(1000):
    lst.pop(0)
# ✅ 更好：一次切片删除O(n)
lst = lst[1000:]  # 创建新列表，整体复制O(n)
# ✅ 如果用deque：popleft多次O(n)
d = deque(lst)
for _ in range(1000):
    d.popleft()  # 每次O(1)

理解数据结构选择对性能的影响

角度	pop末尾(`pop()`)	pop指定位置(`pop(i)`)
时间复杂度	O(1)	O(n)
内存操作	修改长度计数器	memmove搬移后续元素
适用场景	栈（Stack）操作	任意位置删除
源码体现	直接返回最后一个元素	调用memmove函数