本文目录导读:
这是一个很好的问题,从不同的维度来看,“问答系统”可以有不同的分类方法。
问答系统从技术实现和应用场景两个角度来分类最为常见。
从技术实现和复杂度来分(由简到繁)
这是最核心的分类方式,决定了系统的“智能”程度。
-
基于规则/模板的问答系统
- 原理: 预先定义好问题和答案的匹配规则或模板(如“XX的营业时间是什么?”),系统通过关键词匹配、正则表达式或简单的语法分析来找到预设的答案。
- 优点: 精确度高、实现简单、响应快、易于控制。
- 缺点: 泛化能力差、维护成本高、无法处理未预定义的问法,显得“死板”。
- 应用: 早期的客服FAQ机器人、IVR(交互式语音应答)系统。
-
基于信息检索的问答系统
- 原理: 这是目前最主流、效果最稳定的方法之一,它将问题看作是信息检索的查询,在海量文档库(如知识库、网页、文档)中搜索最相关的文档片段,然后从中提取出答案。
- 流程: 用户问题 -> 查询理解 -> 文档检索 -> 答案抽取 -> 答案。
- 技术: 使用BM25、TF-IDF等传统算法,或基于BERT、Sentence-BERT等深度学习的语义检索模型(向量检索)。
- 优点: 能处理大量知识,覆盖范围广,相对灵活。
- 缺点: 答案的质量依赖于检索到的文档质量,可能无法进行复杂推理。
- 应用: 智能客服(如电商、银行)、企业内部知识库问答、搜索引擎的“直接回答”功能。
-
基于知识图谱的问答系统
- 原理: 将知识和实体(如人物、地点、事件)以及它们之间的关系(如“出生于”、“任职于”)组织成一个图谱,系统将用户问题转化为图谱查询语言(如SPARQL),然后从图谱中查询出精确答案。
- 例子: “周杰伦的妻子是谁?” -> 解析出实体“周杰伦”和关系“妻子” -> 在图谱中查询得到“昆凌”。
- 优点: 答案精准、结构化、具备推理能力(如多跳问答:A的父亲的朋友是谁?)。
- 缺点: 构建和维护知识图谱成本高、覆盖面有限、对自然语言理解要求高(需要将自然语言转化为结构化查询)。
- 应用: 垂直领域的专家系统(如医疗、法律)、Google Knowledge Graph问答。
-
基于生成模型的问答系统
- 原理: 这是近年来大语言模型(LLM)兴起后的主要范式,系统首先检索到相关的上下文(文档片段),然后将其连同用户问题一起输入给一个强大的预训练语言模型(如GPT-4、Claude、文心一言),由模型“理解”后,自动生成一个自然流畅的答案。
- 核心方法: 检索增强生成(RAG,Retrieval-Augmented Generation),检索保证了知识的准确性和时效性,生成保证了回答的自然和灵活性。
- 优点: 回答非常自然、流畅、灵活,可以处理复杂推理和总结概括,能进行多轮对话。
- 缺点: 仍存在“幻觉”(编造事实)的风险,计算成本高,速度相对较慢。
- 应用: 现在最先进的ChatGPT类应用、Coze/Dify等智能体平台、新一代智能客服。
从应用场景和知识领域来分
-
开放域问答系统
- 特点: 知识来源是互联网,问题包罗万象(时事、科学、娱乐等),没有领域限制。
- 挑战: 知识极度广泛,答案可能是多源的、有争议的。
- 代表: 搜索引擎(如Google、百度)、ChatGPT。
-
封闭域问答系统
- 特点: 知识来源是某个特定领域(如公司内部文档、医疗指南、法律条文),问题也限定在该领域内。
- 优势: 可以控制答案的权威性和准确性,更容易维护。
- 挑战: 需要高质量的领域知识库。
- 代表: 企业智能客服(只回答产品相关问题)、医疗咨询机器人(只回答医学知识)。
从问答形式来分
- 单轮问答: 一次提问,一次回答,不依赖上下文,这是最常见的一种。
- 多轮问答(对话式问答): 系统能记住对话历史,理解指代(如“它的颜色呢?”中的“它”),进行多轮交互以澄清意图、追问细节或完成复杂任务,这是最先进的智能客服和AI助手(如Siri、Copilot)的核心能力。
| 分类维度 | 类别 | 核心特点 | 典型代表 |
|---|---|---|---|
| 技术实现 | 基于检索的 (RAG类型) | 精确、稳定、可解释 | 大部分企业智能客服 |
| 基于生成的 (纯LLM) | 自然、灵活、有幻觉风险 | ChatGPT、文心一言 | |
| 基于知识图谱的 | 精准、结构化、可推理 | 专业知识库查询系统 | |
| 应用场景 | 开放域 | 知识广,问题无限制 | 搜索引擎、通用AI助手 |
| 封闭域 | 知识专,问题有限制 | 银行客服、法律咨询 | |
| 问答形式 | 单轮 | 简单直接 | FAQ机器人 |
| 多轮 | 复杂、有上下文 | 智能助手、高级客服 |
你现在常接触到的、最先进的“问答系统”,绝大多数是封闭域(内部知识库)或开放域(互联网)的、基于检索增强生成(RAG)的、支持多轮对话的智能问答系统。 你可以根据自己需要搭建的系统的特点,从上述分类中找到对应的类型和设计思路。
标签: 任务型