
AI
文章平均质量分 56
Mr小林
软件工程师的成才之路。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
xinference-docker安装脚本
需要在启动时增加gpu_memory_utilization参数,或者max_model_len参数,具体数字根据实际情况调整,比如根据上面的提示修改gpu_memory_utilization=0.8或max_model_len=20480。手动下载模型(不建议比较复杂)则需要去modelscope中下载并存放到/root/.cache/modelscope目录下,如/root/.cache/modelscope/hub/Qwen/Qwen3-0___6B/允许容器访问所有可用的 GPU 资源。原创 2025-07-08 17:38:56 · 272 阅读 · 0 评论 -
如何将Ollama安装到指定目录和模型指定目录(
如何将Ollama安装到指定目录(非models路径)_ollama指定安装目录-CSDN博客Ollama 路径修改_ollama修改模型路径-CSDN博客Ollama安装 指定路径_ollama安装到指定路径-CSDN博客原创 2025-05-28 17:29:14 · 189 阅读 · 0 评论 -
Milvus 与 Spring Boot 集成
Spring Boot 与 Milvus 的基本集成。:实际生产环境需要创建索引(如IVF_FLAT):建议使用连接池管理客户端连接。性能优化(批量操作、异步处理):建议添加全局异常处理。集合管理(创建/删除)REST API 接口。原创 2025-03-24 16:12:00 · 498 阅读 · 0 评论 -
SpringBoot集成Milvus
Milvus是一款向量数据库,主要用于在大模型领域做向量查询的相关操作。milvus在之前的版本中其实是存在一些弊端的,尤其是在一些类似于mysql的查询方面,有一些缺点,这里简单唠叨几句。首先milvus不支持多个向量字段,其次milvus的模糊匹配只支持前缀匹配,再次milvus不支持排序。不过这些功能在最新版的milvus中都已经解决了。但是我还没来得及体验最新的版本,所以不知道支持情况如何。转载 2025-03-24 14:47:37 · 275 阅读 · 0 评论 -
Milvus Java SDK
Java(8 或更高版本)原创 2025-03-24 14:42:27 · 734 阅读 · 0 评论