实现本地化部署deepseek模型 + Cherry Studio + 导入知识库

1.首先去 ollama官网下载 ollama客户端

网址:https://ollama.com/

2.安装 deepseek-r1命令

根据自己电脑配置选择版本

https://ollama.com/library/deepseek-r1

ollama run deepseek-r1:1.5b

ollama run deepseek-r1:7b

在这里插入图片描述

3.安装文本嵌入模型命令

ollama pull nomic-embed-text	

4.安装Cherry Studio 客户端网址

https://cherry-ai.com/

5.设置模型

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
至此就完成本地化部署了

### 配置Deepseek Cherry Studio本地模型 #### 环境准备 为了确保Deepseek Cherry Studio本地模型能够顺利运行,需先确认操作系统支持并安装必要的软件包。通常推荐使用Linux或macOS作为开发环境。 #### 安装依赖项 通过pip工具来管理Python环境中所需的库文件。对于Cherry Studio项目来说,主要依赖于PyTorch框架以及其他辅助性的机器学习库: ```bash pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cpu pip install transformers datasets evaluate accelerate sentence-transformers ``` 以上命令会下载并安装PyTorch以及Hugging Face提供的Transformers等必要组件[^3]。 #### 下载预训练模型 按照官方文档指示操作,利用`ollama run`指令加载指定名称的预训练模型实例,例如针对`deepseek-coder`系列中的某个具体版本执行如下命令: ```bash ollama run deepseek-ai/DeepSeek-R1`这样的提示信息,表明模型已被正确部署本地环境当中[^2]。 #### 构建索引与查询接口 构建一个简单的Flask Web服务端点用于接收来自用户的自然语言请求并向其返回相应的答案摘要。此部分涉及创建向量数据库以存储文档片段及其对应的嵌入表示形式;同时还需要定义API路由以便处理HTTP POST请求并将输入文本转换成特征向量后传递给已加载好的推理引擎进行预测计算。 ```python from flask import Flask, request, jsonify import numpy as np from sentence_transformers import SentenceTransformer app = Flask(__name__) model = SentenceTransformer('path_to_your_model') @app.route('/query', methods=['POST']) def query(): data = request.json['text'] embeddings = model.encode([data]) # 这里可以加入更复杂的逻辑,比如相似度匹配算法... response = { 'embedding': embeddings.tolist(), 'message': "Embedding generated successfully." } return jsonify(response) if __name__ == '__main__': app.run(debug=True) ``` 上述代码展示了如何基于Sentence-BERT架构快速搭建起一套RESTful风格的服务层面上的应用程序原型。 #### 常见问题排查指南 如果遇到无法启动应用或者性能不佳的情况,则可以从以下几个方面入手解决问题: - **内存不足**:当尝试加载大型神经网络结构时可能会消耗大量RAM资源,此时建议减少批量大小参数值或是采用混合精度模式加速运算过程; - **CUDA驱动不兼容**:检查GPU设备是否被正确识别并且NVIDIA显卡驱动版本号满足最低要求; - **数据集路径错误**:仔细核对所有外部资源链接地址无误后再重新编译整个工程; - **第三方插件冲突**:禁用不必要的扩展功能直至定位出引发异常的具体原因所在为止。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值