什么是RAG？

RAG 可以把它理解成“AI 先去查资料，再根据查到的资料回答你”，而不是只靠自己记忆瞎猜。它最适合用在“知识经常变、需要基于你自己的文档回答、还要求尽量少胡说”的场景里。

一个最容易理解的例子是“公司制度问答机器人”。员工问“出差报销上限是多少”，普通大模型可能凭训练时见过的相似规则来猜，但 RAG 会先去你上传的报销制度 PDF、内部 wiki 或网页里检索相关段落，再把这些段落连同问题一起交给模型生成答案，所以更像“查资料后回答”。

再换成生活化一点的例子，RAG 就像一个会说话的图书管理员。你问它问题时，它不是马上凭印象回答，而是先去书架上找最相关的几页内容，翻给你看，再用自然语言把答案整理出来。

它有什么用

RAG 最常见的用途是企业知识库问答、客服机器人、文档问答、搜索增强和专业领域助手，因为这些场景都要求答案尽量基于最新资料，而不是依赖模型训练时的旧知识。

它也适合处理长文档总结、技术手册问答、论文或合同检索辅助，因为系统会先把文档切成小块，建立索引，再从中找最相关的内容来辅助生成答案。这样做的好处是能降低幻觉、提升可追溯性，并让模型使用你自己的私有知识，而不一定要去做成本更高的微调。

标准 RAG 流程通常分成三步：先把文档切块并向量化建立索引，再把用户问题也向量化进行相似度检索，最后把检索到的内容拼进提示词里，让大模型据此生成答案。

如果再说得更白一点，就是“先备资料库、再找资料、最后组织答案”。很多文章都强调，RAG 的关键不是模型更聪明了，而是它回答前多了一步外部检索，所以它能结合最新资料和私有数据。

如果你是普通用户，可以直接把 RAG 用成 3 类工具：

以下为官方提供的网盘地址，windows 的用户直接下载对应的版本即可，大部分的普通用户直接下载：‘Cherry-Studio-1.7.13-x64-setup.exe’，下载完毕安装。

注册地址如上，注册后，点击左侧菜单栏的-账户管理-API 密钥，然后，“新建 API 密钥”-“点击密钥复制”

点击软件顶部的设置后，选择“模型服务”，选择“硅基流动”，粘贴 API 密钥，点击“测试“，选择一个模型测试，通过即可。

点击底部“管理”按钮，在弹窗内选择“嵌入”，找到“Qwen3-Embeddding-8B”，点击右侧的“+”符号添加模型。

在切换到“推理”，选择 “DeepSeek-v3.2”，点击右侧的“+”符号添加模型。

这样前置的模型添加工作就已经完毕，那么后续就是新建知识库，然后开始使用 RAG。

新建一个知识库，选择嵌入模型，并且上传该知识库的对应的文档、电子书等文件，或者网址。

新建话题，选择对话模型，在对话框底部，选择知识库后，即可提问知识库相关的内容,ai 将会总结并输出你的问题。

这就是最简单的一个本地的知识库。