Ollma+DeepSeek+AnythingLLM打造私有知识库
前天有朋友问我,这个DeepSeek我部署好了,但它怎么训练呢。一句话把我搞蒙了,这玩意儿能训练吗,不都是官方提供好的模型吗?后来想了想,这不就是之前写的文章《[【AI】初体验AI大模型应用平台]》里面的Dify知识库吗,但是Dify需要一些编程知识,稍微有点门槛,我们今天就用AnythingLLM来打造私有的知识库。
需要的软件及工具
•Ollama•DeepSeek•nomic-embed-text•AnythingLLM
安装Ollama+DeepSeek
(鉴于很多朋友无法下载ollama和anythingllm,这里给大家整理好了安装包,扫描领取即可↓↓↓↓)
安装nomic-embed-text
nomic-embed-text主要用于文本嵌入和句子相似度任务,能够将这些任务应用于分类、聚类、检索等多种自然语言处理场景。该模型在处理短文和长文本任务方面表现出色,适用于各种NLP任务,如文本相似度计算、分类、聚类、检索。 1、拉取安装nomic-embed-text
安装AnythingLLM
AnythingLLM官网:https://anythingllm.com/
1、进入官网
2、进入下载页面,根据自己的电脑配置进行下载
3、安装时间比较长,耐心等待下
安装完成之后,直接启动
4、启动之后,点击Get started
5、进入Ollama
6、点击选择,就会出现我们部署的DeepSeek模型,点击右侧的箭头进入下一步
7、这一步类似一个免责声明,点击右侧箭头,进入下一步
8、这边我选择跳过
9、创建工作空间
10、AnythingLLM设置-LLM首选项
此处为选择大语言模型,起始设置时我们已经选择了Ollama
11、AnythingLLM设置-Embedder首选项
这边是在选择矢量模型,我们选择刚安装的nomic-embed-text,保存更改
12、工作区》设置》聊天设置,修改大语言模型提供者为DeepSeek
13、更新工作空间
14、工作区》设置》代理配置,修改大语言模型提供商为DeepSeek,并更新工作空间
知识文件
在上传文件(投喂数据)之前,我们先问下DeepSeek两个它不知道的问题
第一个问题:CodeIsPower公众号是干什么的
第二个问题:2025年2月7日股市涨了多少个点
PS:因为DeepSeek的模型数据只更新到了2023年12月份,对于之后的问题它是无法回答的
上面可以看出来对于它不知道的问题,它也确实无法回答,这个时候如果我们给它投喂一些数据呢,教教它
第一个文件:CodeIsPower简介.txt
第二个文件:2025年02月07日股市情况.txt
1、在工作区界面,点击上传两个文件
2、选择文件移动到右侧工作空间
3、保存并导入
4、更新成功
5、更新完成之后,向量数据库中显示向量数据为2
6、上传数据之后再问,来看看得到的信息
可以看到我们在上传完数据之后,DeepSeek准确的回答了相关问题,按照这个方法,我们也可以上传自己的多个文件,让DeepSeek帮你从中提取信息、总结归纳、生成内容。快来试试吧
(鉴于很多朋友无法下载ollama和anythingllm,这里给大家整理好了安装包,扫描领取即可↓↓↓↓)