自从大模特流行起来,大模特强大的知识储备就征服了无数人。不过,唯一的缺点是他们不了解大模型的知识。有时他们开始认真编造事情。一不小心,说不定就会被带进沟里,这也是最受诟病的地方。
然后插件知识库的RAG向量检索架构就出现了,它可以让我们的问题与知识库中的相关知识结合起来,形成完整的提示并交给LLM。有了相关的背景和严格的限制,它可以得到很大的改善。模型就不再废话了。

不得不说,现在的AI领域变化实在是太快了。真的感觉人工智能的一天将在地球上持续十年。
我还没搞清楚RAG。不久前,微软推出了GrpahRAG。既然我们有了 RAG,为什么还要推出 GraphRAG?
事实证明,RAG虽然不错,但有时表现不佳,答题时文字不正确。为了让大型模型能够更好地应用知识库中的知识,微软将知识图谱与LLM相结合,推出了GraphRAG。
下面就带大家一步步使用GraphRAG,然后让它带我们一起读三国志,领略英雄并列、诸侯争霸的战国时代。
必要的前提条件是先安装Python 3.10-3.12环境,或者直接下载安装anaconda,它可以直接帮你安装所有需要的依赖项。
打开命令行并执行以下命令安装GraphRAG
pip install graphrag
找个地方手动创建以下目录或者执行以下命令创建目录
mkdir -p ./ragtest/input
之后,您可以通过百度或谷歌搜索小说《三国演义》txt版本并下载,或者任何您喜欢的小说;将下载的txt版本的小说重命名为book.txt,然后将book.txt放入输入目录中;然后在ragtest目录外执行以下命令。该命令用于初始化工作区变量。
python -m graphrag.index --init --root ./ragtest
命令执行成功后,会在ragtest目录下生成以下目录和文件。

.env 文件中的 KEY 可以替换为您自己的 openAI 密钥。在settings.yaml中,您可以选择要使用的模型,也可以选择预定义的gpt-4-trubo-preview模型。我这里选择了gpt-。 4o-mini 型号,因为它更小、更便宜。

一切准备就绪后,就可以执行以下命令来创建索引了。这个过程需要很长时间。我花了大约半个小时才等到所有索引都创建完成。与此同时,这也是真正的金钱开始被消耗的地方。 。
python -m graphrag.index --root ./ragtest
以下是创建过程中的一些日志输出:




索引创建好之后,我看了一下openAI的消费面板,发现确实挺贵的。光是《三国志》这本书就花了 1.37 美元。


等待了大约半个小时,所有索引终于创建完成;现在我们可以开始向它提问。我们首先使用全局搜索来提问:
python -m graphrag.query --root ./ragtest --method \global "吕布为什么要杀董卓?"

接下来,我们尝试本地搜索并提问:
python -m graphrag.query --root ./ragtest --method \local "诸葛亮在最后一次北伐中原死后为什么要杀魏延?"

全局搜索和局部搜索的区别如下:


最后是电脑配置:

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.fwsgw.com/a/sanguo/206042.html
