缓存穿透解决方案？

访客全栈框架 2026-06-05 17:58:55 2

从原理到实战，彻底避免数据库雪崩

目录导读

什么是缓存穿透？ – 概念与危害
缓存穿透的三种典型场景 – 业务触发因素
五大主流解决方案详解 – 技术选型对比
实战代码示例 – Java/Python/Go核心实现
QA常见问题 – 面试与运维高频问答

什么是缓存穿透？

缓存穿透是指用户查询的数据在缓存中不存在，每次请求都直接穿透缓存层打到数据库，当大量请求同时查询一个不存在的数据时，数据库会承受巨大压力,甚至引发雪崩。

举例说明：假设电商系统商品ID为纯数字，恶意用户持续请求id=-1或id=999999999（不存在）,所有请求都会绕过缓存直接查数据库。

危害：

数据库连接数飙升，查询超时
可能引发连锁故障：DB宕机→业务中断→整个服务不可用
攻击者容易利用此漏洞进行DDoS

缓存穿透的三种典型场景

场景	示例	特征
业务数据不存在	查询已删除的用户	合法请求但无数据
恶意攻击	遍历不存在的ID	大量无效请求
缓存预热失败	新上线功能无缓存	高并发瞬时冲库

五大主流解决方案详解

缓存空对象（最简单）

当查询数据库返回空结果时，仍然将该键存入缓存，value设为空对象（如null、），并设置较短的过期时间（如5分钟）。

优点：实现简单
缺点：会存储大量空键，占用内存；短时间无法更新真实数据

适用场景：数据不频繁更新、内存充足

布隆过滤器（最常用）

使用布隆过滤器预先判断key是否“可能存在”，若布隆过滤器判断不存在,则直接拒绝请求。

核心原理：

使用多个哈希函数将key映射到位数组
若所有哈希位均为1，则“可能存在”（有误判率）
若有任何哈希位为0，则“一定不存在”

误判率：可通过调整位数组长度和哈希函数数量控制（通常设为1%以下）

优点：内存占用极小（1亿条数据约120MB）
缺点：不支持删除；需要维护全量数据

接口限流与降级

对于可疑请求（如同一IP高频访问不存在key）,直接拒绝或限流。

实现方式：

使用Redis计数器统计单位时间内的请求次数
超过阈值时返回错误或降级数据

优点：阻止恶意攻击
缺点：可能误伤正常用户

请求合并与互斥锁

当多个线程同时查询同一个空key时，只让一个线程去数据库查询,其他线程等待结果。

实现策略：

使用分布式锁（如Redis SetNX）保护查询数据库的动作
第一个线程获取锁后查询并填充缓存
其他线程获取锁失败后等待或直接返回

优点：减少数据库压力
缺点：增加请求延迟，可能出现死锁

热点数据预加载+分层缓存

对于可预见的空数据（如节假日不可用的接口）,提前预热并设置永不过期。

分层方案：

L1：本地缓存（Caffeine/Guava） – 最快
L2：Redis集群 – 次快
L3：数据库 – 兜底

超出特定key的请求频率时,自动触发本地缓存更新。

实战代码示例

Java（布隆过滤器 + Redis）

// 使用Redis的布隆过滤器模块
if (!bloomFilter.exists(key)) {
    return null; // 直接返回，不查数据库
}
String cache = redis.get(key);
if (cache != null) {
    return JSON.parse(cache);
}
// 同步锁查询数据库
synchronized (key.intern()) {
    // 双重检查
    cache = redis.get(key);
    if (cache != null) return JSON.parse(cache);
    Object db = dao.query(key);
    if (db == null) {
        redis.setex(key, 300, "NULL_VALUE");
    } else {
        redis.setex(key, 600, JSON.toJSON(db));
    }
    return db;
}

Python（空对象缓存 + 限流）

class CachePenetrationPrevent:
    def __init__(self):
        self.redis = Redis()
        self.rate_limiter = RateLimiter(threshold=100, window=60)
    def get_data(self, key, user_ip):
        # 限流检查
        if not self.rate_limiter.check(user_ip):
            return "请求过于频繁", 429
        # 缓存获取
        cached = self.redis.get(key)
        if cached == "NULL_VALUE":
            return None  # 空对象返回
        if cached:
            return json.loads(cached)
        # 数据库查询
        data = database.query(key)
        if data is None:
            self.redis.setex(key, 300, "NULL_VALUE")  # 缓存空对象5分钟
        else:
            self.redis.setex(key, 1800, json.dumps(data))
        return data

Go（布隆过滤器实现）

func PreventPenetration(key string) interface{} {
    // 位数组大小为1亿，误判率0.1%
    filter := bloom.NewWithEstimates(100_000_000, 0.001)
    if !filter.TestString(key) {
        return nil
    }
    // 后续流程...
}