如何用Python实现一个能解析域名的DNS查询工具

访客网络编程 2026-06-05 08:01:11 1

用Python实现一个高效的DNS查询工具

📖 文章导读

DNS查询基础原理 – 理解域名解析的核心流程
Python实现环境准备 – 必要的库与工具
核心代码实现 – 手写DNS查询客户端
高级功能扩展 – 支持自定义DNS服务器与缓存
常见问题与优化技巧 – 错误处理、超时与并发查询
总结与实战建议 – 如何测试与部署

DNS查询基础原理

问题：为什么浏览器输入`example.com`就能打开网页？

答案：DNS（域名系统）将人类可读的域名转换为机器可读的IP地址，当你在浏览器访问一个网站时，系统会先向DNS服务器发起查询请求，获取该域名对应的IP,再通过IP建立连接。

关键流程：

缓存查询 → 本地hosts文件 → 递归DNS服务器 → 根服务器 → 顶级域服务器 → 权威服务器
使用UDP协议（端口53）发送DNS报文，报文结构包含：事务ID、标志位、问题记录、回答记录、权威记录、附加记录

理解这个流程后,我们就能用Python模拟整个查询过程。

Python实现环境准备

问题：实现DNS查询需要安装第三方库吗？

答案：不需要，Python标准库中的socket和struct模块足以完成底层UDP通信与二进制数据解析，若希望更简洁，可选dnspython库（通用场景推荐），但本文重点展示原生实现以巩固原理。

环境要求：

Python 3.6+
无需额外安装（若使用dnspython则执行pip install dnspython）

核心代码实现：手写DNS查询客户端

构建DNS查询报文

import socket
import struct
import random
def build_query(domain):
    # 生成随机事务ID
    tid = random.randint(0, 65535)
    # 标志位：标准查询（0x0100）
    flags = 0x0100
    # QDCOUNT（问题数）= 1
    header = struct.pack('>HHHHHH', tid, flags, 1, 0, 0, 0)
    # 将域名转换为DNS格式（如"example.com" -> "7example3com0"）
    question = b''
    for part in domain.split('.'):
        question += struct.pack('B', len(part)) + part.encode()
    question += b'\x00'  # 域名结束符
    # 查询类型A（IPv4）和类IN
    question += struct.pack('>HH', 1, 1)
    return header + question

发送UDP请求并接收响应

def query_dns(domain, server='8.8.8.8', port=53):
    sock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
    sock.settimeout(5)
    request = build_query(domain)
    sock.sendto(request, (server, port))
    response, _ = sock.recvfrom(4096)
    sock.close()
    return response

解析DNS响应报文

def parse_response(response):
    # 跳过头部（12字节）和问题部分（动态长度）
    # 获取回答记录数（第6-7字节）
    ancount = struct.unpack('>H', response[6:8])[0]
    offset = 12
    # 跳过问题部分（找到域名结束符\x00+4字节类型和类）
    while response[offset] != 0:
        offset += 1
    offset += 5  # \x00 + TYPE + CLASS
    ip_list = []
    for _ in range(ancount):
        # 跳过查询名（可能为指针，2字节）和类型/类
        if response[offset] & 0xC0 == 0xC0:  # 指针
            offset += 2
        else:
            while response[offset] != 0:
                offset += 1
            offset += 1
        # 跳过TYPE(2) + CLASS(2) + TTL(4) + RDLENGTH(2)
        rdlength = struct.unpack('>H', response[offset+8:offset+10])[0]
        offset += 10
        if rdlength == 4:  # IPv4
            ip = '.'.join(str(b) for b in response[offset:offset+4])
            ip_list.append(ip)
        offset += rdlength
    return ip_list

主函数调用

if __name__ == '__main__':
    domain = 'example.com'
    response = query_dns(domain)
    ips = parse_response(response)
    print(f'域名 {domain} 解析结果: {ips}')

运行效果：输出类似 域名 example.com 解析结果: ['93.184.216.34']

高级功能扩展

问题：如何支持自定义DNS服务器和记录类型？

答案：将DNS服务器地址作为参数传入query_dns，并修改查询报文中的类型值（如AAAA为28代表IPv6）。

缓存功能实现

from functools import lru_cache
@lru_cache(maxsize=128)
def cached_query(domain, server='8.8.8.8'):
    return parse_response(query_dns(domain, server))

并发查询优化

使用concurrent.futures.ThreadPoolExecutor批量查询多个域名：

from concurrent.futures import ThreadPoolExecutor
domains = ['google.com', 'github.com', 'stackoverflow.com']
with ThreadPoolExecutor(max_workers=5) as executor:
    results = executor.map(lambda d: (d, cached_query(d)), domains)
    for domain, ips in results:
        print(f'{domain}: {ips}')

常见问题与优化技巧

超时与重试机制

import time
def robust_query(domain, retries=3):
    for i in range(retries):
        try:
            return query_dns(domain)
        except socket.timeout:
            if i == retries-1:
                raise
            time.sleep(1)

错误处理：响应格式异常

try:
    response = query_dns(domain)
    if len(response) < 12:
        raise ValueError('响应报文过短')
except Exception as e:
    print(f'查询失败: {e}')

安全考量：防止DNS劫持

使用DNSSEC验证（需额外库支持）
指定可信DNS服务器（如9.9.9.9、1.1.1.1）

总结与实战建议

本文从DNS协议底层讲起，完整实现了基于Python原生的域名解析工具，通过这段代码,你可以：

理解DNS报文结构（字节级别的打包与解析）
掌握UDP套接字编程
扩展工具功能（缓存、并发、自定义服务器）

下一步改进方向

支持更多记录类型（MX、CNAME、TXT）
添加命令行参数解析（使用argparse）
集成代理DNS功能

权威建议：生产环境建议使用dnspython库，但自研代码对学习网络协议价值极高，请将测试范围限制在自己可控的域名上,避免对公共DNS服务造成压力。

问答回顾：

Q1：为什么我的查询返回空列表？
A：检查域名格式（如不带www可能无A记录）,或尝试更换DNS服务器。
Q2：如何查询IPv6地址？
A：将build_query中的类型值从1（A）改为28（AAAA）。
Q3：UDP丢包怎么办？
A：实现重试机制（见第五部分），或尝试使用TCP（需修改协议标识）。

标签： Python实现

本文地址： https://dfhcn.com/post/190.html

文章来源：访客