什么是RAG?
RAG 可以把它理解成“AI 先去查资料,再根据查到的资料回答你”,而不是只靠自己记忆瞎猜。 它最适合用在“知识经常变、需要基于你自己的文档回答、还要求尽量少胡说”的场景里。
一个最容易理解的例子是“公司制度问答机器人”。员工问“出差报销上限是多少”,普通大模型可能凭训练时见过的相似规则来猜,但 RAG 会先去你上传的报销制度 PDF、内部 wiki 或网页里检索相关段落,再把这些段落连同问题一起交给模型生成答案,所以更像“查资料后回答”。
再换成生活化一点的例子,RAG 就像一个会说话的图书管理员。你问它问题时,它不是马上凭印象回答,而是先去书架上找最相关的几页内容,翻给你看,再用自然语言把答案整理出来。
它有什么用
RAG 最常见的用途是企业知识库问答、客服机器人、文档问答、搜索增强和专业领域助手,因为这些场景都要求答案尽量基于最新资料,而不是依赖模型训练时的旧知识。
它也适合处理长文档总结、技术手册问答、论文或合同检索辅助,因为系统会先把文档切成小块,建立索引,再从中找最相关的内容来辅助生成答案。 这样做的好处是能降低幻觉、提升可追溯性,并让模型使用你自己的私有知识,而不一定要去做成本更高的微调。
怎么工作的
标准 RAG 流程通常分成三步:先把文档切块并向量化建立索引,再把用户问题也向量化进行相似度检索,最后把检索到的内容拼进提示词里,让大模型据此生成答案。
如果再说得更白一点,就是“先备资料库、再找资料、最后组织答案”。很多文章都强调,RAG 的关键不是模型更聪明了,而是它回答前多了一步外部检索,所以它能结合最新资料和私有数据。
你可以怎么用
如果你是普通用户,可以直接把 RAG 用成 3 类工具:
- 个人知识库,把自己的 PDF、笔记、会议纪要、课程资料放进去后提问。
- 团队助手,把公司制度、产品手册、售后 FAQ、培训材料接进去做内部问答。
- 专业阅读助手,把论文、合同、技术文档导入后做检索、摘要和对比问答。
实操:CherryStudio 个人知识库
CherryStudio 下载并安装
以下为官方提供的网盘地址,windows 的用户直接下载对应的版本即可,大部分的普通用户直接下载:‘Cherry-Studio-1.7.13-x64-setup.exe’,下载完毕安装。
注册硅基流动获取 API_KEY
注册地址如上,注册后,点击左侧菜单栏的-账户管理-API 密钥,然后,“新建 API 密钥”-“点击密钥复制”
基础使用
点击软件顶部的设置后,选择“模型服务”,选择“硅基流动”,粘贴 API 密钥,点击“测试“,选择一个模型测试,通过即可。
添加 RAG 所需的嵌入模型
点击底部“管理”按钮,在弹窗内选择“嵌入”,找到“Qwen3-Embeddding-8B”,点击右侧的“+”符号添加模型。
在切换到“推理”,选择 “DeepSeek-v3.2”,点击右侧的“+”符号添加模型。
这样前置的模型添加工作就已经完毕,那么后续就是新建知识库,然后开始使用 RAG。
知识库搭建和使用
新建一个知识库,选择嵌入模型,并且上传该知识库的对应的文档、电子书等文件,或者网址。
新建话题,选择对话模型,在对话框底部,选择知识库后,即可提问知识库相关的内容,ai 将会总结并输出你的问题。
这就是最简单的一个本地的知识库。

https://www.cherry-ai.com/download/Shot2026-04-April-Pwf1Nf9m.jpg)
/Shot2026-04-April-INH36RPC.jpg)
/Shot2026-04-April-8e8a9Ji6.jpg)
/Shot2026-04-April-nWWVK9dH.jpg)
/Shot2026-04-April-v7rIfeBY.jpg)
/Shot2026-04-April-vM8bbqax.jpg)
/Shot2026-04-April-hkAKcJG4.jpg)
/Shot2026-04-April-bHNRhTCD.jpg)