外挂知识库 RAG 向量检索架构：解决大模型胡编乱造问题，引领 AI 领域新变革_三国故事

自从大模特流行起来，大模特强大的知识储备就征服了无数人。不过，唯一的缺点是他们不了解大模型的知识。有时他们开始认真编造事情。一不小心，说不定就会被带进沟里，这也是最受诟病的地方。

然后插件知识库的RAG向量检索架构就出现了，它可以让我们的问题与知识库中的相关知识结合起来，形成完整的提示并交给LLM。有了相关的背景和严格的限制，它可以得到很大的改善。模型就不再废话了。

三国演义小说txt下载_三国演义小说下载到手机上_三国演义小说下载pdf

不得不说，现在的AI领域变化实在是太快了。真的感觉人工智能的一天将在地球上持续十年。

我还没搞清楚RAG。不久前，微软推出了GrpahRAG。既然我们有了 RAG，为什么还要推出 GraphRAG？

事实证明，RAG虽然不错，但有时表现不佳，答题时文字不正确。为了让大型模型能够更好地应用知识库中的知识，微软将知识图谱与LLM相结合，推出了GraphRAG。

下面就带大家一步步使用GraphRAG，然后让它带我们一起读三国志，领略英雄并列、诸侯争霸的战国时代。

必要的前提条件是先安装Python 3.10-3.12环境，或者直接下载安装anaconda，它可以直接帮你安装所有需要的依赖项。

打开命令行并执行以下命令安装GraphRAG

pip install graphrag

找个地方手动创建以下目录或者执行以下命令创建目录

mkdir -p ./ragtest/input

之后，您可以通过百度或谷歌搜索小说《三国演义》txt版本并下载，或者任何您喜欢的小说；将下载的txt版本的小说重命名为book.txt，然后将book.txt放入输入目录中；然后在ragtest目录外执行以下命令。该命令用于初始化工作区变量。

python -m graphrag.index --init --root ./ragtest

命令执行成功后，会在ragtest目录下生成以下目录和文件。

三国演义小说下载到手机上_三国演义小说txt下载_三国演义小说下载pdf

.env 文件中的 KEY 可以替换为您自己的 openAI 密钥。在settings.yaml中，您可以选择要使用的模型，也可以选择预定义的gpt-4-trubo-preview模型。我这里选择了gpt-。 4o-mini 型号，因为它更小、更便宜。

三国演义小说下载pdf_三国演义小说下载到手机上_三国演义小说txt下载

一切准备就绪后，就可以执行以下命令来创建索引了。这个过程需要很长时间。我花了大约半个小时才等到所有索引都创建完成。与此同时，这也是真正的金钱开始被消耗的地方。。

python -m graphrag.index --root ./ragtest

‍以下是创建过程中的一些日志输出：

三国演义小说下载到手机上_三国演义小说下载pdf_三国演义小说txt下载

三国演义小说下载pdf_三国演义小说txt下载_三国演义小说下载到手机上

三国演义小说下载到手机上_三国演义小说下载pdf_三国演义小说txt下载

三国演义小说下载到手机上_三国演义小说txt下载_三国演义小说下载pdf

索引创建好之后，我看了一下openAI的消费面板，发现确实挺贵的。光是《三国志》这本书就花了 1.37 美元。

三国演义小说下载到手机上_三国演义小说txt下载_三国演义小说下载pdf

三国演义小说下载pdf_三国演义小说txt下载_三国演义小说下载到手机上

等待了大约半个小时，所有索引终于创建完成；现在我们可以开始向它提问。我们首先使用全局搜索来提问：

python -m graphrag.query --root ./ragtest --method \global "吕布为什么要杀董卓?"

‍

三国演义小说下载pdf_三国演义小说txt下载_三国演义小说下载到手机上

接下来，我们尝试本地搜索并提问：

python -m graphrag.query --root ./ragtest --method \ local "诸葛亮在最后一次北伐中原死后为什么要杀魏延?"

三国演义小说txt下载_三国演义小说下载到手机上_三国演义小说下载pdf

全局搜索和局部搜索的区别如下：

三国演义小说txt下载_三国演义小说下载到手机上_三国演义小说下载pdf

三国演义小说下载pdf_三国演义小说txt下载_三国演义小说下载到手机上

最后是电脑配置：

三国演义小说txt下载_三国演义小说下载到手机上_三国演义小说下载pdf

本文采摘于网络，不代表本站立场，转载联系作者并注明出处：https://www.fwsgw.com/a/sanguo/206042.html

外挂知识库 RAG 向量检索架构：解决大模型胡编乱造问题，引领 AI 领域新变革