Kotaemon本地部署流程

最新推荐文章于 2025-05-31 18:00:37 发布

Ashleyyyi

最新推荐文章于 2025-05-31 18:00:37 发布

阅读量1.9k

点赞数 5

CC 4.0 BY-SA版权

文章标签：人工智能语言模型知识图谱

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/handsome_lionet/article/details/142954333

kotaemon是一个基于RAG的开源框架，用于与文档进行对话，用于与你的文档聊天，它支持实现Hybrid RAG和Graph RAG

链接： https://cinnamon.github.io/kotaemon/

这里我采用的离线安装方式

一、安装kotaemon，映射本地端口访问

conda create -n kotaemon python=3.10

conda activate kotaemon

git clone https://github.com/Cinnamon/kotaemon

cd kotaemon

pip install -e "libs/kotaemon[all]"

pip install -e "libs/ktem"

export HF_ENDPOINT=https://hf-mirror.com

cd scripts

bash run_linux.sh

这里就已经可以访问127.0.0.1：7860来进入ui界面了

Default username / password are: admin / admin.

如果是远程服务器，可以做映射

ssh hoo@10.12.1.44 -L 127.0.0.1:7860:127.0.0.1:7860

端口默认是7860，当然也可以自己改

二、设置本地LLM及Embedding模型

由于本地服务器无法访问huggingface的api，所以这里我们选择设置本地LLM及Embedding模型，推荐Ollama OpenAI兼容的服务

1、安装ollama并启动程序

curl -fsSL https://ollama.com/install.sh | sh

拉取模型

ollama pull llama3.1:8b

ollama pull nomic-embed-text

2、在Resources页面中的LLMs和Embedding分别设置LLM和Embedding

api_key: ollama

base_url: http://localhost:11434/v1/

model: llama3.1:8b (for llm) | nomic-embed-text (for embedding)

3、使用本地模型用于RAG

1) 将本地LLM和Embedding模型设置为default

2) 将File Collection中的Embedding设置为本地模型(例如: ollama)

3) 在Retrieval Setting页面，选择本地模型作为LLM相关模型。

现在就可以上传文件进行文档问答体验了。

三、设置本地的GraphRAG

pip install graphrag

piip install

为了使用本地模型来用GraphRAG，我们需要修改.env文件中的USE_CUSTOMIZED_GRAPHRAG_SETTING=true

然后调整 settings.yaml.example里面如下几个设置为true

参考：https://zhuanlan.zhihu.com/p/720088106

博客等级

码龄7年

28
原创

138
点赞

253
收藏

105
粉丝

关注

私信

热门文章

上一篇：: 常用数据网站

下一篇：: 论文阅读：Mixture-of-Agents Enhances Large Language Model Capabilities

最新评论

CUDA12.3安装pytorch2.1.0
的一确二: 博主，你下载的就是2.1版本的pytorch吗？我的cudashi 12.3的，我用的pip install torch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn 但是还是显示高了
CUDA12.3安装pytorch2.1.0
2302_80390354: 谢谢谢谢谢谢
论文阅读：Deep Learning–based Solar Flare Forecasting Model. III. Extracting Precursors from EUV Images
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读：Making Large Language Models Perform Better in Knowledge Graph Completion
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读：Domain Specialization as the Key to Make Large Language Models Disruptive: A Comprehensive Surv
Ashleyyyi: 哦我还没看完这个文章...你可以直接搜论文或者等几天我写完再说

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。