这个案例能帮你解释Python的局部变量查找为什么比全局变量快吗

访客源码剖析 2026-06-05 03:28:14 1

局部变量为何比全局变量快？用这个案例帮你彻底搞懂Python变量查找机制

目录导读

为什么Python局部变量比全局变量快？一个代码案例引发的问题
Python变量查找的底层原理：LEGB规则详解
局部变量 vs 全局变量：执行速度对比实验
案例解析：同一个函数内局部与全局变量的性能差异
影响性能的关键因素：字节码与符号表
实战建议：如何写出高效且符合Python规范的代码
常见问答（FAQ）

为什么Python局部变量比全局变量快？一个代码案例引发的问题

很多Python开发者都听说过“局部变量比全局变量快”的结论，但很少有人真正理解背后的技术细节,我们先看一个简单但非常说明问题的案例：

import time
global_var = 100
def test_global():
    total = 0
    for i in range(1000000):
        total += global_var
    return total
def test_local():
    local_var = 100
    total = 0
    for i in range(1000000):
        total += local_var
    return total
start = time.time()
test_global()
print("全局变量耗时:", time.time() - start)
start = time.time()
test_local()
print("局部变量耗时:", time.time() - start)

运行这个案例，你会发现test_local()总是比test_global()快0.05~0.15秒左右。这个案例能帮你解释Python的局部变量查找为什么比全局变量快——它直观地展示了同一个加操作，仅仅因为变量作用域不同,性能就产生了差异。

为什么？接下来我们从Python的变量查找机制入手,揭秘背后的原理。

Python变量查找的底层原理：LEGB规则详解

Python在查找变量时，遵循一套叫做LEGB的规则（Local → Enclosing → Global → Built-in）,这套规则决定了Python解释器从哪个作用域中获取变量值：

L（Local）：当前函数内部的局部作用域
E（Enclosing）：嵌套函数的外层函数作用域
G（Global）：模块级别的全局作用域
B（Built-in）：Python内置作用域（如len、print等）

速度差距的核心原因在于：局部变量（L）在LEGB规则中处于最顶层，解释器可以直接在函数自身的命名空间中找到它；而全局变量（G）处于第三层，解释器必须先检查本地作用域、嵌套作用域,最后才能访问全局作用域。

换言之，全局变量的查找路径比局部变量长,这就导致每次访问都需要多走几步。

局部变量 vs 全局变量：执行速度对比实验

为了让你更清楚地看到差异，我们可以做一个更精确的测试——使用timeit模块来消除系统误差：

import timeit
global_var = 100
def test_global():
    total = 0
    for i in range(1000):
        total += global_var
    return total
def test_local():
    local_var = 100
    total = 0
    for i in range(1000):
        total += local_var
    return total
# 执行10000次取平均值
print("全局变量平均耗时:", timeit.timeit(test_global, number=10000))
print("局部变量平均耗时:", timeit.timeit(test_local, number=10000))

测试结果通常显示：局部变量访问速度比全局变量快30%~50%，这个差异在循环次数较少时几乎无感，但当循环次数达到百万级别时,就会变成明显的性能瓶颈。

关键结论：如果你在函数内部频繁访问某个全局变量（比如在for循环中），将其复制为局部变量后,速度提升明显。

# 慢版本
def slow():
    for i in range(1000000):
        result = math.sqrt(i)  # math是全局模块，每次访问都要查全局
# 快版本
def fast():
    sqrt = math.sqrt  # 将全局函数绑定为局部变量
    for i in range(1000000):
        result = sqrt(i)

fast()比slow()快30%以上，因为每次循环只需访问局部变量sqrt，而非全局变量math.sqrt。

案例解析：同一个函数内局部与全局变量的性能差异

回到开头的案例，我们进一步分析：为什么test_local比test_global快？

关键点在于字节码层面，Python代码在运行前会被编译成字节码，你可以通过dis模块查看：

import dis
print("test_global的字节码:")
dis.dis(test_global)
print("\ntest_local的字节码:")
dis.dis(test_local)

输出片段对比：

# 全局变量版本中的关键字节码：
LOAD_GLOBAL     0 (global_var)   # 查找全局变量
# 局部变量版本中的关键字节码：
LOAD_FAST       0 (local_var)    # 快速加载局部变量

LOAD_FAST 是专门用于局部变量的操作码，它直接通过索引定位变量，速度极快，而 LOAD_GLOBAL 需要先检查全局字典（globals()），然后进行哈希查找,速度慢得多。

核心原理：局部变量在函数编译时就已经分配到固定索引位置，访问时直接根据索引偏移量读取；全局变量则存储在字典中，每次访问都需要哈希运算和字典查找，字典查找的时间复杂度虽然是O(1),但常数项远大于索引查找。

影响性能的关键因素：字节码与符号表

要深入理解Python变量查找的速度差异,需要理解两个概念：

1 符号表（Symbol Table）

Python在编译函数时，会为每个函数生成一个符号表（co_varnames），记录了该函数内所有局部变量的名称，运行时，局部变量通过索引访问,无需进行名称解析。

而全局变量存储在模块的全局字典（globals()）中，任何时候访问全局变量,Python都需要：

检查全局字典中是否存在该键
获取对应的值
每次还要处理可能的变量修改（如global声明）

2 字节码优化

局部变量：编译为LOAD_FAST、STORE_FAST等指令,直接操作栈和局部数组。
全局变量：编译为LOAD_GLOBAL、STORE_GLOBAL,每次都要进行字典操作。

这也是为什么包含大量循环的代码中,将全局变量转换为局部变量能带来显著性能提升。

实战建议：如何写出高效且符合Python规范的代码

基于以上原理,我给你几条可直接落地的建议：

循环内避免重复访问全局变量

# 慢
for i in range(n):
    result = GLOBAL_DATA[i]  # 每次循环都要查全局
# 快
local_data = GLOBAL_DATA
for i in range(n):
    result = local_data[i]

函数内频繁使用的全局变量，使用参数传递
将全局变量作为函数参数传入，自动变为局部变量。

# 慢
def process():
    for i in range(n):
        x = math.pi * i
# 快
def process(pi=math.pi):  # pi现在为局部变量
    for i in range(n):
        x = pi * i

对于模块级别的函数，使用from ... import

from math import sqrt   # sqrt变为局部函数引用
# 比 import math； math.sqrt() 快

性能敏感的代码段，可考虑使用局部变量缓存
如Pandas、NumPy等库的处理函数中，经常看到：

def fast_calc(df):
    col = df['col']  # 将DataFrame的列缓存为局部变量
    for i in range(len(col)):
        # 直接操作 col，避免重复df['col']

不要滥用全局变量，它既影响性能也增加耦合度
全局变量不仅慢，还容易导致多线程/多进程环境下的意外错误，尽可能保持函数无状态（纯函数）。

常见问答（FAQ）

Q1：为什么局部变量查找比全局变量快这么多？是Python解释器的bug吗？
A：不是bug，而是设计选择，Python为了灵活性允许在运行时动态修改全局变量，导致全局变量必须通过字典查找；而局部变量在编译时就固定了索引，因此访问速度更快,这是易用性与性能的平衡。

Q2：局部变量总是比全局变量快吗？
A：基本是的，但在极罕见情况下（如访问绝对不可变的全局常量，且解释器能优化）可能接近，不过作为通用规则,局部变量更快。

Q3：我可以把全局变量改为global声明来加速吗？
A：不能，相反，global声明会让Python知道该变量是全局的，每次访问依然走LOAD_GLOBAL，而且global会增加额外的符号表检查开销,有时甚至更慢。

Q4：LOAD_FAST和LOAD_GLOBAL具体差多少纳秒？
A：精确数据因Python版本和CPU而异，一般而言，LOAD_FAST耗时约10~20ns，而LOAD_GLOBAL耗时约30~60ns，在百万次循环中,差距可达数十毫秒。

Q5：嵌套函数中的外层变量（Enclosing作用域）速度如何？
A：比全局变量快，但比局部变量慢，因为需要通过LOAD_DEREF指令访问闭包变量，涉及闭包对象查找，所以如果性能敏感,尽量将外层变量也复制到内层作为局部变量。

Q6：我应该在所有地方都尽量使用局部变量吗？
A：建议在频繁执行的代码段（如循环、递归、回调函数）中将全局变量转为局部变量，对于一次性调用的代码，使用局部变量收益甚微,可能影响代码可读性。

Q7：这个原理在CPython、PyPy、MicroPython等不同实现中都适用吗？
A：CPython中差异最明显，PyPy使用JIT技术，可能将全局变量访问内联优化，差异变小，MicroPython等嵌入式实现依赖具体设计,但基本原理相似。

局部变量比全局变量快，根本原因在于Python的变量查找机制——局部变量通过索引访问（LOAD_FAST），全局变量通过字典查找（LOAD_GLOBAL），通过开头的案例代码，你不仅能看到性能差异，更能理解背后的字节码逻辑，建议你在实际项目中，对性能敏感的函数，主动将全局变量缓存为局部变量,这是最简单且最有效的Python性能优化技巧之一。

标签：全局变量查找

本文地址： https://dfhcn.com/post/137.html

文章来源：访客