你能否用一个文本脱敏案例展示如何替换敏感信息（如身份证号）

访客自然语言处理 2026-06-04 20:13:23 1

本文目录导读：

实现代码示例（Python）
关键点说明
脱敏效果对比
注意事项

原始文本：
“用户张三，身份证号：110101199001011234，住址：北京市朝阳区XX路1号。”

脱敏规则：
保留身份证号的前6位（地区代码）和后4位（顺序码），中间部分用星号（*）替换,总长度保持不变。

脱敏后文本：
“用户张三，身份证号：1101011234，住址：北京市朝阳区XX路1号。”

实现代码示例（Python）

import re
def desensitize_id_card(text):
    # 匹配18位身份证号（允许最后一位是X）
    pattern = r'\b(\d{6})\d{8}(\d{4}[0-9Xx]?)\b'
    # 替换为：保留前6位 + 8个星号 + 后4位
    replacement = r'\1********\2'
    return re.sub(pattern, replacement, text)
# 测试
original = "用户张三，身份证号：110101199001011234，住址：北京市朝阳区XX路1号。"
desensitized = desensitize_id_card(original)
print(desensitized)
# 输出：用户张三，身份证号：110101********1234，住址：北京市朝阳区XX路1号。