RAG 工作原理交互流程图

Retrieval-Augmented Generation (检索增强生成)

1. 用户查询 "帮我总结这些文档..." 2. 向量检索 计算相似度 (Embedding) 知识库/向量数据库 存储切片文档信息 3. 提示词增强 问题 + 检索到的上下文 = 丰富的 Prompt 4. LLM 生成回答 基于提供的信息总结 检索相关文档段落... 将文档作为上下文注入

✨ AI 场景原理解析

输入一个应用场景,让 Gemini 为你拆解该场景下的 RAG 运作细节:

检索 (Retrieval)

根据问题在外部知识库中定位精准信息。

生成 (Generation)

LLM 结合检索到的事实进行逻辑总结。