自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(56)
  • 问答 (5)
  • 收藏
  • 关注

原创 【大模型入门】访问GPT_API实战案例

聊天机器人,翻译助手,联网搜索

2025-07-06 20:23:36 362

原创 【大模型入门】访问GPT的API

本文介绍了免费访问GPT API的方法及使用技巧。主要内容包括:1) 环境变量设置和API基础配置;2) 非流式输出实现(使用requests和OpenAI库);3) 流式输出实现及数据处理;4) 带历史记录的对话实现方法;5) 嵌入向量(embeddings)的创建和应用。文章详细讲解了API请求的全流程,包括参数设置、响应处理和结果解析,并提供了两种调用方式(requests和OpenAI库)的代码示例,特别强调了流式输出的实现和对话历史的保存机制。最后还介绍了嵌入向量的生成和使用方法。

2025-07-05 18:56:11 989

原创 【大模型原理与技术-毛玉仁】第六章 检索增强生成RAG(完结撒花!!!)

大模型生成的内容可能存在“幻觉”现象——生成内容看似合理但实际上逻辑混乱或与事实相悖。RAG通常集成了等多个功能模块。具体而言,给定一个自然语言问题(Query),检索器将问题进行编码,并从知识库(如维基百科)中高效检索出与问题相关的文档。然后,将一并传递给大语言模型,大语言模型根据检索到的知识和原始问题生成最终的输出。RAG 的核心优势在于不需要对大语言模型的内部知识进行更新,便可改善大语言模型的幻觉现象,提高生成质量。

2025-06-15 16:23:52 355

原创 【大模型原理与技术-毛玉仁】第五章 模型编辑

在模型编辑的相关研究中,使用最广泛的是由Omer Levy 等人提出的zsRE数据集。zsRE是一个问答任务的数据集,通过众包模板问题来评估模型对于特定关系(如实体间的“出生地”或“职业”等联系)的编辑能力。在模型编辑中,zsRE数据集用于检查模型能否准确识别文本中的关系,以及能否根据新输入更新相关知识,从而评估模型编辑方法的。

2025-06-07 16:54:11 411

原创 【大模型原理与技术-毛玉仁】第四章 参数高效微调

下游任务适配对于预训练数据涉及较少的垂直领域,大语言模型需要对这些领域及相应的下游任务进行适配。上下文学习和指令微调是进行下游任务适配的有效途径,但它们在效果或效率上存在缺陷。为弥补这些不足,参数高效微调(Parameter-Efficient Fine-Tuning, PEFT)技术应运而生。通过上述方法构建完数据集后,可以用完全监督的方式对预训练模型进行微调,在给定指令和输入的情况下,通过顺序预测输出中的每个token来训练模型。参数高效微调参数附加方法。

2025-05-28 12:12:58 747

原创 【大模型原理与技术-毛玉仁】第三章 Prompt工程

在 Prompt 进入大模型之前,需要将它拆分成一个Token 的序列,其中Token 是。

2025-05-28 12:10:03 1004

原创 【大模型原理与技术-毛玉仁】第二章 大语言模型架构

然而模型规模和数据规模的增长并非没有代价,它们带来了更高的计算成本和存储需求,这要求我们在模型设计时必须在资源消耗和性能提升之间找到一个恰当的平衡点。为了应对这一挑战,大语言模型的应运而生。模型训练数据规模以及参数数量的不断提升,不仅带来了上述学习能力的稳步增强,还为大模型“解锁”了一系列新的能力,例如值得注意的是,这些新能力并非通过在特定下游任务上通过训练获得,而是随着模型复杂度的提升凭空自然涌现。这些能力因此被称为大语言模型的。

2025-05-28 12:07:30 845

原创 【大模型原理与技术-毛玉仁】第一章 语言模型基础

语言是概率的。并且,语言的概率性与认知的概率性也存在着密不可分的关系。语言模型(Language Models, LMs)旨在的概率。

2025-05-28 12:02:09 955

原创 Pytorch深度学习快速入门笔记【小土堆】

nn.Sequential是PyTorch中一个非常重要的类,用于构建简单的顺序连接模型。可以将其看做一个容器,它允许用户通过顺序堆叠多个层来创建神经网络模型。这个类的主要作用是简化模型的构建过程,使得用户可以通过简单、直观的方式定义复杂的网络结构。CIFAR 10 model结构图如下:最后两步的线性层略有省略,在此补充:# 64个数据,每个数据3个通道,每个通道32×32(每个值都是1.0)# (模型,模型的输入数据),

2024-09-10 19:23:56 1129

原创 深度学习环境搭建

在安装深度学习环境时,要满足cuda,pytorch,torchvision,Python它们之间的兼容,具体可见下表,我这里选择的组合用红框标出来了。CUDA 是使 GPU 能够进行高效并行计算的技术,PyTorch 是一个利用 CUDA 加速深度学习计算的框架。GPU 是一种专门设计用于处理图形和图像的硬件,拥有大量的处理核心,能够并行处理大量的数据。PyTorch 是一个开源的深度学习框架,提供了强大的工具和库用于构建和训练神经网络。3、CUDA,GPU,Pytorch是什么及它们之间的关系。

2024-08-22 22:57:04 539

原创 Numpy

Numpy是一个开源的Python科学计算库,用于快速处理多维数组。Numpy支持常见的数组和矩阵操作。对于同样的数值计算任务,使用Numpy比直接使用Python简洁的多。Numpy使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器。

2024-06-24 21:54:08 918

原创 软件测试理论

假设有一个用户筛选功能,有三个输入分别是体型、年龄段、性别,体型有三个取值(胖、适中、瘦),年龄段有三个取值(老人、青年、儿童),性别有两个取值(男、女),请设计测试用例。介于黑盒测试与白盒测试之间的一种测试,多用于集成测试阶段,不仅关注输入输出的正确性,同时也关注程序内部的情况。当可能的输入数据或者输入数据的组合数量很大时,由于不可能为每个输入组合创建测试用例,可以采用这种方法。有多个输入和多个输出,而且输入与输入之间有相互的组合关系,输入和输出之间有相互的依赖关系。缺点:依赖于需求,不适应需求的变化;

2024-02-18 22:33:43 1053

原创 Python之TCP网络编程

1.TCP网络应用程序开发分为客户端程序开发和服务端程序开发。2.主动发起建立连接请求的是客户端程序。3.等待接受连接请求的是服务端程序。

2022-11-20 21:01:30 3411

原创 Python多任务编程

1.进程(Process)是资源分配的最小单位。2.多进程是Python程序中实现多任务的一种方式,使用多进程可以大大提高程序的执行效率。1.多线程是Python程序中实现多任务的一种方式。2.线程是程序执行的最小单位。3.同属一个进程的多个线程共享进程所拥有的全部资源。

2022-11-19 19:22:25 716

原创 Python异常、模块与包

1. 如何自定义模块并导入?在Python代码文件中正常写代码即可,通过import、from关键字和导入Python内置模块一样导入即可使用。2. __main__变量的功能是?if __name_ == “__main__”表示,只有当程序是直接执行的才会进入if内部,如果是被导入的,则if无法进入。3. 注意事项不同模块,同名的功能,如果都被导入,那么后导入的会覆盖先导入的。__all__变量可以控制import *的时候哪些功能可以被导入。1. 什么是Python的包?包就是一个。

2022-11-16 19:01:30 636

原创 Python面向对象

也是对子类的一种软性约束,要求子类必须复写(实现)父类的一些方法并配合多态使用,获得不同的工作状态。如,定义函数(方法),通过类型注解声明需要父类对象,实际传入子类对象进行工作,从而获得不同的工作状态。注意:只可以在子类内部调用父类的同名成员,子类的实体类对象调用默认是调用子类复写的。pass是占位语句,用来保证函数(方法)或类定义的完整性,表示无内容,空的意思。继承就是一个类,继承另外一个类的成员变量和成员方法。注意:函数是定义在类外的,而方法是定义类内的。同一个行为,使用不同的对象获得不同的状态。

2022-11-16 19:00:42 582

原创 Python文件操作

1.操作文件需要通过open函数打开文件得到文件对象。2.文件对象有如下读取方法:3.文件读取完成后,要使用文件对象.close()方法关闭文件对象,否则文件会被程序一直占用。

2022-11-10 16:31:51 1333

原创 Python之函数进阶

传入计算逻辑,而非传入数据。根据参数位置来传递参数。函数本身是可以作为参数。

2022-11-09 19:26:41 555

原创 Python之数据容器

列表的定义语法:[元素,元素,元素,...]元素:数据容器内的每一份数据,都称之为元素。元素的数据类型无限制,甚至元素可以是列表,这样就定义了嵌套列表。字典可以提供基于Key检索Value的场景实现,就像查字典一样。字典的定义语法:# 定义字典my_dict = {"张三":99,"李四":88,"王五":77}# 内容:{'张三': 99, '李四': 88, '王五': 77},类型:

2022-10-23 19:26:02 3600 2

原创 Request & Response

request对象是用来封装请求数据的对象。response对象是用来封装响应数据的对象。

2022-10-22 19:16:22 797

原创 Servlet

Servlet入门

2022-10-08 16:47:27 389

原创 HTTP简述

HyperText Transfer Protocol,超文本传输协议,规定了浏览器和服务器之间数据传输的规则。基于TCP协议:面向连接,安全。基于请求-响应模型的:一次请求对应一次响应。HTTP协议是无状态的协议:对于事务处理没有记忆能力。每次请求-响应都是独立的。缺点:多次请求间不能共享数据。Java中使用会话技术(Cookie、Session)来解决这个问题。优点:速度快。

2022-09-23 20:05:38 598

原创 使用burpsuite伪造数据包数据

代理设置:本地环回地址(如:127.0.0.1)和端口(8080),浏览器请求的数据包就会先发送到127.0.0.1:8080上,然后在转发给服务端。使用bp在127.0.0.1:8080上监听,开启拦截功能,就会抓到请求的数据包,点击forward才将数据包转发给服务端。根据题目要求,使用bp抓取关键数据包,更改数据包的数据,再转发出去,达到伪造的效果。搜索引擎可以辅助解题。

2022-09-19 22:39:56 4113 1

原创 JDBC入门

JDBC 就是使用Java语言操作关系型数据库的一套API。全称:( Java DataBase Connectivity ) Java 数据库连接。1.2 JDBC本质官方(sun公司)定义的一套操作所有关系型数据库的规则,即接口。各个数据库厂商去实现这套接口,提供数据库驱动jar包。我们可以使用这套接口(JDBC)编程,真正执行的代码是驱动jar包中的实现类。

2022-09-17 20:48:11 169

原创 Python爬虫之requests

requests库是Python拥有的库,和第三方库urllib库类似,但是比它更简单。具体表现在:参数不需要编码,不需要请求对象的定制,url后面的?可以省略

2022-08-26 21:09:44 1450

原创 Python爬虫之Urllib

urllib.request库主要用来获取网页的源码,需要找准是get请求还是post请求,分析合适的网络接口对应的请求头,数据等等。需要UA就需要请求对象的定制,需要动态cookie或者代理就需要更高级的请求头,用到handler

2022-08-20 19:23:13 1624

原创 Python基础

python环境安装,pip使用,python基础入门

2022-08-17 17:09:28 1504

原创 Linux高级

linux日志管理,备份与恢复,可视化工具,面试题

2022-08-09 22:46:01 1157

原创 CentOS下搭建JavaEE环境与Python开发平台Ubuntu

CentOS下搭建JavaEE环境,Python开发平台Ubuntu

2022-07-29 15:56:27 464

原创 Shell编程

Shell是一个命令行解释器,它为用户提供了一个向Linux内核发送请求以便运行程序的界面系统级程序。用户可以用Shell来启动、挂起、停止甚至是编写一些程序。对于Linux运维工程师来说,编写Shell程序来进行服务器管理。对于JavaEE和Python程序员来说,编写Shell程序来进行服务器的维护或者定时备份数据库。对于大数据程序员来说,编写Shell程序来管理集群。LinuxShell中的变量分为系统变量和用户自定义变量。系统变量3.2.1基本语法定义变量变量名=值。...

2022-07-28 17:45:22 318

原创 Linux实操

程序员首选软件,解决了中文乱码的问题。Xshell是一个强大的安全终端模拟软件,它支持SSH1,SSH2,以及MicrosoftWindows平台的TELNET协议。Xshell可以在Windows界面下用来访问远端不同系统下的服务器,从而比较好的达到远程控制终端的目的。是一个基于windows平台的功能强大的SFTP、FTP文件传输软件。使用了Xftp以后,windows用户能安全地在UNIX/Linux和WindowsPC之间传输文件。Linux系统会内置vi文本编辑器。0。...

2022-07-26 14:52:31 1648

原创 Linux基础

Linux文件系统采用层级式的树状目录结构。最上层是根目录“/”,然后在此目录下创建其他目录。在Linux世界里,一切皆文件。

2022-07-15 18:45:16 292

原创 MySQL高级应用

MySQL入门:https://blog.csdn.net/m0_60121089/article/details/125521332 存在的问题:将能够完成特定功能的SQL指令进行封装(指令集),编译之后存储在服务器上,并且为之取一个名字。客户端可以通过名字调用指令集,获取执行结果。(类似于编程语言中的函数)。优点:缺点:Java语法中,方法可以有有参数和返回值的;存储过程中,可以有输入参数和输出参数。语法实例局部变量:定义在存储过程中的变量,只能在存储过程内部使用。语法实例

2022-07-13 21:37:58 1037 2

原创 WireShark

目录一、WireShark概述1.1 WireShark简介​​​​​​​1.2 WireShark应用二、WireShark抓包及快速定位数据包技巧2.1使用WireShark进行抓包2.2WireShark的过滤器使用三、使用WireShark对常用协议抓包并分析原理3.1ARP协议3.2ICMP协议分析3.3TCP协议分析3.4HTTP协议分析 四、WireShark抓包解决服务器被黑上不了网的问题WireShark是一个网络封包分析软件。其功能是撷取网络封包,并尽可能显示出最为详细的网络封包资料。W

2022-07-09 22:51:52 9750 5

原创 MySQL入门

目录一、数据库介绍1.1数据库概念1.2关系型数据库与非关系型数据库1.3常见的数据库产品1.4数据库术语二、MySQL数据库环境准备2.1MySQL下载2.2MySQL安装2.3MySQL配置2.4MySQL服务的启动与停止2.5MySQL卸载三、MySQL的管理工具四、MySQL逻辑结构4.1逻辑结构4.2记录/元组五、SQL结构化查询语言5.1SQL概述5.2SQL分类5.3SQL基本语法5.4DDL数据定义语言5.4.1DDL-数据库操作5.4.2DDL-数据表操作5.5MySQL数据类型5.5.1

2022-07-09 19:02:07 649

原创 主动信息收集

目录1.原理1.1特点1.2发现目标主机的过程2.基于ping命令的探测2.1ping、traceroute2.2arping2.3netdiscover2.4fping3.基于Nmap的扫描方式3.1Nmap的基本扫描方式3.2Nmap的半连接扫描3.3使用nc扫描端口4.DDOS攻击防御-SYN Flood4.1DDOS攻击的原理4.2DDOS攻击的三种方式4.3TCP三次握手4.4tcpdump抓包查看三次握手过程4.5Hping3进行SYN Flood洪水攻击4.4DDOS攻击的防护ping命令用于

2022-07-01 16:57:36 950

原创 被动信息收集

被动信息收集

2022-06-24 17:05:05 2624 2

原创 Java基础之异常

目录1.异常概述2.异常处理机制2.1try...catch...2.2throws3.Throwable的成员方法4.编译异常与运行异常的区别5.自定义异常1.异常概述异常:就是程序出现了不正常的情况异常体系Error:严重问题,不需要处理Exception:称为异常类,它表示程序本身可以处理的问题RuntimeException:在编译期是不检查的,出现问题后,需要我们回来修改代码非RuntimeException:编译期就必须处理的,否则程序

2022-05-31 19:45:38 219

原创 Java基础之常用API

目录1.Math类1.1概述1.2常用方法2.System类2.1概述2.2常用方法3.Object3.1toString方法3.2equals方法4.Arrays4.1冒泡排序4.2概述和常用方法5.基本类型包装类5.1概述​5.2Integer类的概述和使用5.3int和String的相互转换(本小节最常用的操作)5.4字符串中数据排序5.5自动装箱和拆箱6.日期类6.1Date类6.2SimpleDateFo.

2022-05-31 19:43:32 312

原创 Java基础之内部类

目录1.内部类概述2.成员内部类3.局部内部类4.匿名内部类5.匿名内部类在开发中的使用1.内部类概述内部类:就是在一个类中定义一个类。举例:在一个类A的内部定义一个类B,类B就被称为内部类。内部类的定义格式内部类的访问特点内部类可以直接访问外部类的成员,包括私有 外部类要访问内部类的成员,必须创建对象Outer.javapackage com.ydh_01;public class Outer { private int n...

2022-05-31 19:38:04 115

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除