束搜索是什么？

访客自然语言处理 2026-06-06 03:35:47 2

本文目录导读：

这是一个非常经典且重要的搜索算法概念，为了让你彻底理解它，我会从它的核心理念讲起,然后通过对比和例子来说明。

简单一句话概括：束搜索（Beam Search）是一种用于寻找“最优”路径的启发式搜索算法，它通过在每个步骤中只保留“最有希望”的有限个节点（这个数量称为“束宽”），来牺牲一部分准确性，换取极高的计算效率。

核心思想：在“广”和“深”之间找平衡

要理解束搜索，最好先回顾一下它的两个“亲戚”：

宽度优先搜索（BFS，Breadth-First Search）：像地毯式排查，一层一层把所有可能性都看一遍。优点：保证能找到最短路径。缺点：计算量巨大，占用内存极高（例如下棋时，所有可能的走法都考虑）。
深度优先搜索（DFS，Depth-First Search）：像一条路走到黑，不撞南墙不回头。优点：内存占用小。缺点：可能找到的不是最优解,甚至陷入无限循环。

束搜索就像是一个“有节制”的宽度优先搜索。 它不会展开每一层的所有节点,而是：

关键参数——束宽（Beam Width）

假设你要用机器翻译把英文句子 I am a student 翻译成中文。

有可能丢失正确答案：这是最大的风险，如果当前看似“不好”的节点（被丢弃的）后续能发展成一条非常优秀的路径，就永远错过了，这就是所谓的“贪婪的短视”。
受限于束宽：如果真正的正确答案需要很宽的探索才能找到,束宽设得太小就没用。
输出多样性差：由于总是保留分数最高的节点，最终生成的几个结果往往非常相似，缺乏创造性，比如在写诗或创意写作时，它会倾向于输出最“安全”的句子。

特性	说明
算法类型	启发式搜索、贪心算法的一种变体
核心思想	每一步只保留分数最高的 K 个候选，丢弃其余
关键参数	束宽（K）：控制搜索的宽度和计算量
优点	比 BFS 快很多，比 DFS 更可靠，适合大规模搜索空间
缺点	可能错过最优解，输出多样性不足
主要应用	自然语言处理（机器翻译、语音识别、文本生成）、图像识别（目标检测中的序列生成）、对话系统