- 博客(75)
- 收藏
- 关注
原创 SpringAI系列---【RAG(知识库 ChatPDF)】
PDFReader:读取文档并拆分为片段向量大模型:将文本片段向量化向量数据库:存储向量,检索向量要解决大模型的知识限制问题,需要外挂知识库受到大模型上下文限制,知识库不能简单的直接拼接在提示词中我们需要从庞大的知识库中找到与用户问题相关的一小部分,再组装成提示词这些可以利用文档读取器向量大模型向量数据库来解决。第一阶段(存储知识库)将知识库内容切片,分为一个个片段将每个片段利用向量模型向量化将所有向量化后的片段写入向量数据库第二阶段(检索知识库)
2025-07-01 23:36:00
826
原创 SpringAI系列---【SpringAI如何接入阿里云百炼大模型?】
如果是要接入阿里云百炼模型,首先推荐使用Spring AI Alibaba,而不是使用SpringAI。当然了,因为百炼的通义模型都遵循了openai规范,所以,我们若非要用SpringAI接入百炼大模型,我们可以使用引入openai的依赖来接入百炼大模型。阿里云百炼的通义千问模型支持 OpenAI 兼容接口,您只需调整 API Key、BASE_URL 和模型名称,即可将原有 OpenAI 代码迁移至阿里云百炼服务使用。因为这个是游戏,不需要保存聊天记录,游戏结束就结束了,所以不持久化会话id了。
2025-06-21 02:31:00
283
原创 SpringAI系列---【大模型如何实现会话记忆?】
我们已经知道,role中的user角色存储的是用户输入的内容,system角色是用来指定大模型角色和任务背景的系统指令。大模型是没有会话记忆的,如果想实现会话记忆功能,唯一的办法就是把之前聊过天的内容与新的提示词,一起发给大模型。这里我们就要借助大模型的一个重要角色assistant来实现。assistant里存储的是大模型生成的消息,可能是上一轮生成的结果。注意:用户可能与模型产生多轮对话,每轮对话模型都会生成不同的结果。
2025-06-16 03:25:00
311
原创 SpringAI系列---【SpringAI如何记录会话日志?】
SpringAI利用AOP原理提供了AI会话日志的拦截,增强等功能,也就是Advisor。响应日志会慢一点,会等所有都返回,才会输出。
2025-06-15 00:51:00
316
原创 NIFI系列---【如何执行自定义sql?实现in的逻辑】
content中的json{"SQL_NAME": "张三","HOBBIES": ["2132","34534","22464"]}Attribute中的内容:SQL_NAME: $.SQL_NAME使用:ExtractText组件下面举例说明:例如:上一步的json格式的flow-content的内容为:["2132","34534","22464"],要转换成('2132','34534','22464')使用ReplaceText组件:设置search value:^[(.*)]$re
2025-05-25 21:34:00
283
原创 Xinference系列---【Windows在线如何安装Xinference?】
确定cuda是否安装,以及cuda的版本。,如下图,则说明安装成功。
2025-04-22 00:39:00
390
原创 Python系列---【如何安装anaconda管理Python环境?】
选择下载好的安装包,一路点击下一步,选择要安装的位置,可以自定义,默认的也行,记住这个目录,安好之后配置环境变量要用。命令测试是否安装成功,如下,显示conda版本号即表示已安装成功,不用重启系统。下面根据你的系统,选择合适的安装包。下面可以用谷歌账号登录。
2025-04-21 23:21:00
365
原创 NodePad--系列---【如何快速格式化字符串成字典?】
把字典字符串"1:男;',(这个根据第一对字典后面的字符确定,可能是空格),替换为:'\r','\r'-代表换行,下面的查找模式选扩展;然后同理,把code和name之间的冒号':'替换成tab键'\t',这样就处理好了,选中excel的第一列的第一个单元格,手动复制格式化后的内容到excel中即可。3:其他",数据库里面的字段的备注里,经常会有这种格式的字典注释,我们的系统通常支持批量导入字典,但是需要你整理成excel两列code,name的格式。
2025-04-16 21:06:00
153
原创 ElasticSearch系列---【使用reindex做跨集群数据迁移】
此时使用kibana执行任何命令,都会报上面的错,或者其他错,这里我想表达的是,会导致集群不可用。我执行了新建索引的dsl,也无法执行。
2025-04-09 22:34:00
223
原创 Linux系列---【如何查看目录权限】
目录的详细权限信息。假设 AFC 用户对应的是 Linux 用户。命令的输出,意思是列出。这行是 Linux 中。意味着任何用户都能写入。
2025-04-08 11:03:00
263
原创 ElasticSearch系列---【可视化工具】
优点:Dsl语法能注释,提示友好,dsl查询语句不用带引号,监控简洁,支持windows,macos,linux系统桌面化安装,支持AI。优点:属于Elastic Stack家族,根正描红,功能齐全,首当推荐,切记要和es的版本对应。优点:浏览器插件,便于安装,适用于服务器资源有限的场景。界面简洁,适用于对比数据库学习Es使用。缺点: 相对kibana来说,功能简单很多。缺点: 功能过于简单,希望以后会越来越强大。缺点:需要自己单独部署。
2025-04-04 23:08:00
380
原创 ElasticSearch系列---【ElasticSearch使用教程】
2004 年,有一个以色列小伙子,名字叫谢伊·班 农( Shay Banon),他成亲不久来到伦敦,因为当时他的夫人正好在伦敦学厨师。初 来乍到,也没有找到工作,于是班农就打算写一个叫作 iCook 的小程序来管理和搜索菜 谱,一来练练手,方便找工作;二来这个小工具还可以给其夫人用。
2025-03-26 16:35:00
1019
原创 Embedding系列---【好用的中文模型合集】
shaw/dmeta-embedding-zh是一个只有 100M 参数的中文嵌入模型,支持 1024 的上下文长度,计算效率高,适用于多种任务场景。它在 MTEB 基准测试中取得了优异的成绩,特别适用于语义向量检索、RAG 和其他 LLM 应用。nomic-embed-text 是一个大上下文长度的文本编码器,在短上下文和长上下文任务上的性能超过了 OpenAI text-embedding-ada-002 和 text-embedding-3-small。
2025-03-25 00:42:00
147
原创 SpringAI系列---【MCP协议与AI Agent技术解析】
当MCP协议成为AI与物理世界的"通用语",当Spring AI将协议封装为可编程接口,开发者终于能跳出API适配的泥潭,专注于创造真正的智能体验。这场由协议驱动的变革,正在重塑我们与机器的协作方式——不是冰冷的代码调用,而是充满可能性的智能对话。未来已来:你准备好迎接"一句话连接万物"的时代了吗?
2025-03-25 00:01:00
796
原创 少年攻城狮 ElasticSearch系列---【es常用devtools语法】
下面的内容建议直接粘进kibana的DevTools(开发工具devtools)里,作为一个查询模板。
2025-03-21 19:57:03
458
原创 SpringBoot系列---【SpringBoot集成Skywalking】
skywalking ui页面上最终查看到的效果如下图,此时不会有默认的那一堆没用的了。
2025-03-20 01:03:00
1209
原创 IDEA系列---【idea中git远程分支回退到指定版本】
1.找到git的log记录2.选择模式3.强制推送到远程在git命令行中执行git push -f
2025-02-21 16:21:00
286
原创 Ollama系列---【ollama使用gpu运行大模型】
一、安装CudaToolkit使用控制台命令查看当前显卡驱动中的cuda版本nvidia-smi二、下载CudaToolkit注意:CudaToolkit版本要低于上面的显卡Cuda版本。Cuda各版本下载地址:https://developer.nvidia.com/cuda-toolkit-archive下载好之后,一路下一步,一直默认即可。如果安装到了自定义的位置,记得加环...
2025-02-09 19:40:00
5515
6
原创 Oracle系列---【如何修改Oracle字符集?】
1. 字符集修改的一般步骤:su - oracle # 切换到 oracle 用户sqlplus /as sysdba # 以 sysdba 身份登录到数据库shutdown immediate; # 停止数据库startup mount; # 启动数据库到 MOUNT 状态,数据库在这个状态下可以修改字符集然后尝试执行以下 SQL 命令来修改字符集:alter dat...
2025-01-21 23:21:00
1024
原创 Oracle系列---【解决oracle误设置VARCHAR2长度,错把字节当字符】
1.查看当前 Oracle 数据库的字符集SELECT * FROM v$nls_parameters t WHERE t.PARAMETER = 'NLS_CHARACTERSET';执行结果:PARAMETERVALUENLS_CHARACTERSETAL32UTF8如果oracle库一开始没有设置好字符集,后续要修改字符集相当麻烦。AL32UTF8:表...
2025-01-21 22:58:00
448
原创 Oracle系列---【Smallfile模式的表空间如何确定单个数据文件的最大大小?】
如果你的数据版本是oracle12c以上的版本,直接跳到最下面执行5.1和5.4即可。在 Oracle 数据库中,MAXSIZE 参数用于限制数据文件的最大大小,确保表空间不会无限制增长。MAXSIZE 的最大值主要受到以下因素的影响:1. 操作系统的文件系统限制不同的操作系统和文件系统有不同的单个文件大小限制。例如:ext4 文件系统(Linux):单个文件最大支持 16TB...
2025-01-15 15:11:00
648
原创 Oracle系列---【ORA-01017用户名密码无效】
1.问题项目启动时,报:ORA-01017用户名密码不对的错误,但是没有报具体哪个库错误,因为我是多数据源的项目。2.解决方案2.1定位到连接数据报错的用户和库名select * from dba_audit_session where ACTION_NAME='LOGON' AND RETURNCODE=1017 ORDER BY TIMESTAMP DESC;1.OS_USERN...
2025-01-15 11:10:00
722
原创 Oracle系列---【Oracle中密码的策略如何设置】
在 Oracle 数据库中,profile 是一个与用户关联的配置集合,用于控制用户账户的资源使用情况和密码策略。例如,profile 可以定义用户的密码过期时间、账户锁定策略、并发会话数限制等。简单来说,profile 是一组规则的集合,这些规则可以应用到一个或多个数据库用户,从而限制或管理他们的行为。1. profile 的作用每个数据库用户都可以被分配到一个特定的 profile,...
2025-01-15 10:39:00
798
原创 SpringBoot系列---【SpringBoot集成健康探针和prometheus】
1.前提资料大多说的都是2.3.x,实际亲测,spring-boot-starter-parent支持健康探针的最低版本是2.3.3.RELEASE。为什么要集成健康探针?健康探针通常包括 存活探针(Liveness Probe) 和 就绪探针(Readiness Probe),用于检查应用容器的健康状态。2.引入pom<dependency> <groupI...
2025-01-15 00:22:00
385
原创 idea系列---【idea中的Debug常用功能】
idea中的Debug常用功能1.方法断点(打在方法上的断点(菱形)):适用场景:当一个接口有多个实现类时,在接口的方法上打个断点,执行到这个方法的时候,就会自动进入使用的实现类的方法里的第一行,可以帮我们快速定位使用的哪个实现类。2.字段断点(打在字段上(眼睛形)):适用场景:观察字段的值被改变的地方,会停留在字段值发生改变的行。3.避免操作资源(force return):适用场...
2025-01-10 16:59:00
691
原创 Dify系列---【离线安装Dify】
1.环境要求这里以centos7,4c8g为例,先安装好docker和docker-compose。2.下载安装包GitHub地址:https://github.com/langgenius/dify3.上传到/opt/app/middles/dify目录下并解压unzip dify-main.zip4.docker-compose安装difycd difycd dockerc...
2025-01-08 14:09:00
4937
7
原创 Ollama系列---【如何离线安装ollama?】
1.环境本文以centos7.9安装ollama为例2.下载ollama安装包官网地址:https://ollama.com/download/linuxGitHub手动安装文档地址:https://github.com/ollama/ollama/blob/main/docs/linux.md安装包下载地址:https://ollama.com/download/ollama-lin...
2025-01-08 11:50:00
2460
1
原创 Linux系列---【如何配置环境变量?】
1.profile,bashrc,bash_profile,bashrc的区别/etc/profile:此文件为系统的每个用户设置环境信息,当用户第一次登录时,该文件被执行.并从/etc/profile.d目录的配置文件中搜集shell的设置.所以如果你有对/etc/profile有修改的话必须得重启你的修改才会生效,此修改对每个用户都生效。/etc/bashrc:为每一个运行bash s...
2025-01-08 11:36:00
169
原创 Ollama系列---【常用属性设置】
常用属性设置OLLAMA_HOST=0.0.0.0 解决外网访问问题OLLAMA_MODELS=E:\ollamaimagers 解决模型默认下载C 盘的问题OLLAMA_KEEP_ALIVE=24h 设置模型加载到内存中保持24个小时(默认情况下,模型在卸载之前会在内存中保留 5 分钟)OLLAMA_HOST=0.0.0.0:8080 解决修改默认端口11434端口...
2025-01-08 01:31:00
1031
原创 Ollama系列---【Ollama常用命令】
ollama常用命令1.启动ollama服务ollama serve2.创建模型 (create)使用 Modelfile 来创建一个新模型。你需要提供一个包含模型信息的 Modelfile。ollama create /path/to/Modelfile3.显示模型信息 (show)查看特定模型的详细信息,例如模型名称、版本等。ollama show model_name4....
2025-01-08 01:16:00
2354
原创 Docker系列---【离线安装docker-compose】
1.安装docker-compose查看系统版本,如下可知,系统是X86_64的uname -r2.下载文件打开github.com官网,在登录页面的右上角搜索compose找到docker/compose再找releases,(网址:https://github.com/docker/compose/releases) 如下找到X86_64的版本:docker-compose-linu...
2025-01-07 15:33:00
385
原创 xxl_job系列---【Glue(java)模式如何通过动态参数传参?】
1.编辑GLUE(Java)模式的定时任务这里以传递json参数为例:修改任务参数:{"startDate": "","endDate": "","desc": "入参日期格式:yyyyMMdd"}保存。2.编辑此定时任务的GLUE脚本import添加:import com.xxl.job.core.context.XxlJobHelper;import cn.hutool.cor...
2025-01-07 11:55:00
394
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人