Kernel Memory 入门系列： RAG 简介

风晓 2023-12-30 09:44:43  47868 赞同 0 反对 0

分类：资源

当我们有了一定的产品资料或者知识内容之后，自然想着提供一个更加方便的方式让用户能够快速地找到自己想要的信息，或者得到一个更加智能的答案。以往的时候可能需要通过一些搜索引擎或者问答系统来实现，但是这些系统往往需要极高的维护成本，而且对于用户来说也不是很友好。很多时候仍然需要用户自己去思考问题的表达方式，然后再去搜索或者提问，可以说是费事费力。如今有了大语言模型，我们就可以考虑通过它来实现一个更加智能的问答系统，为用户提供一个更加友好的交互方式。

从对话开始

当我们直接接入大语言的模型的时候，往往会遇到一个很常见的问题，就是它对于我们私有的数据，小众领域的信息或者较新的知识并不知道。

Alt text

这源自于大语言模型的训练数据集的限制，它的数据往往来自于大众的语料库，所以对于公开的信息了解的就比较多，但是对于私有的数据，小众领域的信息都不在它的知识范围内，而且由于训练成本和时间的限制，它也不可能实时地去更新模型本身的知识。

这个时候得到“不知道”的答案反而是一个好事儿，起码看得出来这个模型是有一定的智能的，它知道自己不知道，而不是随便瞎猜。毕竟处理大模型的幻觉也是很大的一个问题。

补充上下文

那么这个时候如果想要让模型能够为我们所用的，就需要上一点技术手段了。
最简单的方法就是在与大模型沟通的时候，增加一些上下文的信息。

Alt text

那这里的上下文就是我们所能够提供给模型的，用于回答用户问题的信息了。

那么接下来的问题就是，这个上下文信息是怎么来的？

RAG

我们需要从整个流程来回溯一下：

首先用户提出问题，这个问题从始至终不会发生变化
然后我们需要理解用户的问题，知道用户提问的意图和方向
接下来就是我们需要根据用户的问题，去检索我们的知识库，找到与用户问题相关的信息，查找出与之相关的的文档或者文本内容
最后我们需要将这些文档或者文本内容进行整合，组成一个完整的提示词，提供给大语言模型用于生成
最后通过大语言模型生成相对精确的答案，返回给用户

Alt text

这个过程就被称为 RAG(Retrieval Augmented Generation)，也就是检索增强生成。

如果您发现该资源为电子书等存在侵权的资源或对该资源描述不正确等，可点击“私信”按钮向作者进行反馈；如作者无回复可进行平台仲裁，我们会在第一时间进行处理！

评价 0 条

相关资源

openstack如何创建项目上传含kernel、initramfs和rootfs三者的镜像 2024-01-31 48094 浏览
openstack如何创建项目上传含kernel、initramfs和rootfs三者的镜像
如何解决C++运行时错误：’out of memory exception’？ 2024-01-09 50314 浏览
引言：在C++编程中，经常会遇到内存不足的情况，特别是在处理大数据集合或者复杂的算法时。当程序无法再分配额外的内存来满足其需要时，就会抛出’out of memory exception’（内存不足异常）。本文将介绍如何解决这类问题，并给出相应的代码示例。
奔图P2200、P2500系列打印机如何查看碳粉余量？ 2023-12-20 54327 浏览
常用打印面的朋友们，应该都会经常监控打印机的碳粉用量，以便可以及时地购买耗材，避免正打印这一堆文件却没碳粉的尴尬，查看碳粉余量，难道每次都要麻烦地连接电脑吗？今天教你如何快速查看碳粉余量？适用用奔图PP2200、P2500系列打印机
奔图P3010-P3300、M6700-7300系列打印机如何调整纸盒？ 2023-12-20 48819 浏览
采购选定了奔图A4幅面打印面，可是入手后发现纸盒的长度不够，无法平整放入A4纸，2步教你如何调整纸盒。适用奔图P3010-P3300、M6700-7300系列打印机
电脑入门级最基础知识 2023-12-21 51501 浏览
适用于电脑操作人员,最基础知识
PowerShell系列（一）：PowerShell介绍和cmd命令行的区别 2023-12-25 51130 浏览
什么是Windows系统的命令行环境，之前我们在使用XP、Win7系统的时候，用的最多的就是微软官方自带的cmd命令窗口了，我们通过敲命令行窗口可以实现和操作系统之间的交互。当然随着微软技术的快速发展，到了目前比较流行的Win10操作系统，默认采用的就是PowerShell命令行交互工具了，今天就给大家介绍Powershell相关的知识，希望对大家学习能带来一些帮助！
PowerShell系列（二）：PowerShell和Python之间的差异介绍 2023-12-25 51823 浏览
今天给大家聊聊PowerShell和Python之间有哪些共同之处，各自有哪些优势，希望对运维的朋友了解两种语言能提供一些有用的信息。
PowerShell系列（三）：PowerShell发展历程梳理 2023-12-25 51702 浏览
今天给大家聊聊PowerShell的发展历程，以及各个版本之间有什么亮点。
飞腾软件认证动态 | 2024年5月124 款软件适配飞腾系列自主核心芯片 2024-06-28 31115 浏览
飞腾软件认证动态|2024年5月124款软件适配飞腾系列自主核心芯片
PowerShell系列（五）：PowerShell通过脚本方式运行笔记 2023-12-25 52432 浏览
上一篇文章讲解了Powershell通过交互环境运行命令的相关知识，今天给大家介绍实际工作当中使用最频繁的方式——通过脚本运行，简单来说就是和咱们实际编写代码一样，先编写代码，然后通过开发工具执行。同样的为了实现PowerShell脚本的保存、方面在别的服务器迁移，一般都是先编写脚本，然后通过脚本文件执行完成相应的运维任务。首先打开 WindowPowerShell ISE 开发环境新建一个test.ps1，脚本内容如下： $arr1=1..10#定义一个1~10的数组 $arr1#打印数组

Kernel Memory 入门系列： RAG 简介

从对话开始

补充上下文

RAG

相关资源

关注我们