自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

二分掌柜的

二分掌柜的

  • 博客(1503)
  • 资源 (32)
  • 收藏
  • 关注

原创 深度学习 目标分类 目标检测 多目标跟踪 基础 进阶

flyfish

2024-09-07 08:37:15 2178 1

原创 大模型系列

flyfish

2024-09-06 17:20:29 1068

原创 知识蒸馏 - 基于KL散度的知识蒸馏 KL散度的方向

flyfish

2025-08-07 20:08:42 634

原创 Python 位置参数(positional arguments)

flyfish

2025-08-07 20:06:50 550

原创 微调训练时,ignore_empty_think是怎么保护模型的思考能力?

flyfish

2025-08-06 19:22:52 399

原创 在对 Qwen3 进行微调训练时,如何保护模型的思考能力?

在使用不包含思考过程的数据集进行模型微调时,为避免模型因过度学习 “直接输出答案” 的模式而丢失深层思考能力,本文从数据结构和训练策略层面减少对思考能力的破坏。

2025-08-06 15:19:14 879

原创 知识蒸馏 - 基于KL散度的知识蒸馏 HelloWorld 示例 KL散度公式变化

flyfish

2025-08-04 19:55:30 912

原创 中文基于Qwen3-235B-2507蒸馏数据集的操作

flyfish

2025-08-04 19:54:55 838

原创 知识蒸馏 - 基于KL散度的知识蒸馏 HelloWorld 示例 采用PyTorch 内置函数F.kl_div的实现方式

flyfish

2025-08-03 15:03:40 254

原创 知识蒸馏 - 基于KL散度的知识蒸馏 HelloWorld 示例 代码中KL散度公式 为什么 dim=-1

flyfish

2025-08-03 14:42:51 975

原创 知识蒸馏 - 基于KL散度的知识蒸馏 HelloWorld 示例 KL散度公式对应

flyfish

2025-08-03 14:42:26 306

原创 道格拉斯-普克算法 - 把一堆复杂的线条变得简单,同时尽量保持原来的样子

flyfish

2025-08-03 14:41:58 268

原创 知识蒸馏 - 基于KL散度的知识蒸馏 HelloWorld 示例

flyfish

2025-08-02 12:10:10 1842

原创 知识蒸馏 - 最小化KL散度与最小化交叉熵是完全等价的

flyfish

2025-08-02 12:09:47 538

原创 知识蒸馏 - 信息熵中的平均为什么是按概率加权的平均

flyfish

2025-08-02 12:09:24 557

原创 知识蒸馏 - 根据真实事件的真实概率分布对其进行编码

flyfish

2025-08-02 12:08:54 883

原创 知识蒸馏 - 自信息量是单个事件的信息量,而平均自信息量(即信息熵)是所有事件自信息量以其概率为权重的加权平均值

flyfish

2025-08-02 12:08:19 681

原创 知识蒸馏 - 信息量的公式为什么是对数

flyfish

2025-08-02 12:07:42 963

原创 知识蒸馏 - 对数函数的单调性

flyfish

2025-08-02 12:06:57 900

原创 知识蒸馏 - 通过引入温度参数T调整 Softmax 的输出

flyfish

2025-07-28 19:21:26 777

原创 知识蒸馏 - 蒸的什么

flyfish

2025-07-28 19:02:28 869

原创 Qwen 系列模型实现文本改写工具

flyfish

2025-07-28 19:01:48 439

原创 LLaMA-Factory 微调可配置的模型基本参数

flyfish

2025-07-21 19:10:08 505

原创 LLaMA-Factory 微调可配置的LoRA参数

flyfish

2025-07-21 19:09:28 1121

原创 微调大模型后 预训练模型与LoRA适配器是如何合并的?

flyfish

2025-07-18 09:32:30 1120

原创 大模型学习到的知识是怎么存储的

flyfish

2025-07-18 09:31:17 364

原创 如果让计算机理解人类语言 - 文本是如何变成向量的

flyfish

2025-07-11 13:42:04 1170

原创 Qwen3大语言模型客户端 - 轻松连接vLLM服务

flyfish

2025-07-11 09:55:55 626

原创 如果让计算机理解人类语言- Qwen3 Embedding (2025)

flyfish

2025-07-07 18:35:18 955

原创 如果让计算机理解人类语言- Word2Vec(Word to Vector,2013)

flyfish

2025-07-07 18:34:45 601

原创 如果让计算机理解人类语言- 词袋模型(Bag of Words, BoW,1970s)

flyfish

2025-07-07 18:34:22 681

原创 如果让计算机理解人类语言- One-hot 编码(One-hot Encoding,1950s)

flyfish

2025-07-07 18:33:49 1577

原创 Python async 通过协程(coroutine)机制实现高效的并发操作

flyfish

2025-07-07 18:33:10 685

原创 因果语言模型、自回归语言模型、仅解码器语言模型都是同一类模型

flyfish

2025-07-04 19:03:26 944

原创 vLLM - 使用Qwen3 请求数据的变化

flyfish

2025-07-04 19:02:29 972

原创 LLaMA-Factory 自定义图像数据集

flyfish

2025-07-03 19:43:11 284

原创 孪生素数猜想 - 为什么传统工具难以触及孪生素数猜想

flyfish

2025-07-03 19:41:41 1020

原创 孪生素数猜想 - 张益唐的核心贡献和陶哲轩的改进

flyfish

2025-07-03 19:39:53 1197

原创 孪生素数猜想 - 素数的扎堆现象

flyfish

2025-07-03 19:38:44 664

原创 孪生素数猜想 - 什么是素数(质数)

flyfish

2025-07-03 19:37:50 573

Tree control的使用

Tree Control的单击响应 只遍历根节点,非递归遍历具有两层目录的节点 递归遍历所有节点

2010-11-29

List Control 可编辑任意item文本,设置行高

List Control 可编辑任意item文本,设置行高 使用Owner Draw实现List Control的重绘

2010-11-22

限制Edit Control输入的字符

限制Edit Control的输入字符,只允许输入字母和数字。控件子类化.

2010-11-20

vc实现时间延时 延时时间 包括 秒 毫秒 微秒

用Sleep函数延时,如何时间太长,程序就像无响应一样,采用消息泵可以解决这个问题 延时 时间 包括 秒 毫秒 微秒

2010-11-13

MFC下实现SOAP服务端和SOAP客户端

MFC下实现SOAP服务端和SOAP客户端

2012-05-14

leveldb-windows

Windows下编译LevelDB 环境:windows x64 编译器: VC2010

2015-07-08

单击按钮在固定位置创建子窗口,单击父窗口的时自动隐藏子窗口.

单击按钮在固定位置创建子窗口,单击父窗口的时自动隐藏子窗口

2010-12-07

boost log 简单使用

环境 vc2010 MFC Unicode

2014-11-08

在固定位置创建子窗口,点击父窗口自动隐藏子窗口

在固定位置创建子窗口,点击父窗口自动隐藏子窗口

2010-12-08

创建ED2K链接源代码

创建ED2K链接源代码,学习eMule不错的代码

2009-01-08

C++ 开发SOAP服务端和SOAP客户端

利用gSOAP自带的Calc例子 仿写一个 网络中使用计算器 客户端发送需要操作的数据,服务端计算完之后,将结果返回给客户端 编写之后 我们的服务端可独立使用。像在安装了IIS或者用Apache配置的Web服务器。

2012-05-14

CString与其他数据类型的转换

CString与其他数据类型的转换 包括char*,COLOREF,16进制,格式化字符串,将字符串分解为子串等

2010-11-04

List Control可编辑item文本(只支持第一列)

List Control可编辑item文本(只支持第一列)

2010-11-19

VC中使用ATL编写控件

VC中使用ATL编写控件 vc2005编译通过

2010-10-29

软件架构及设计 台湾-高焕堂

软件架构及设计 台湾-高焕堂 比较好的资料

2009-01-08

gloox即时通讯编程

这其中包含即时通讯编程(二)文章中提到中的类,还有三个release 版的lib

2009-05-30

boost-1820-ndk25-api28

boost_1820_ndk25_api28

2023-08-09

boost-1-82-0-for-android

ndk25 api24 编译 boost boost_1_82_0

2023-08-07

NDK25 API28 curl

NDK25 API28 curl

2023-08-01

ncnn vulkan x86-64下的使用 完整源码

ncnn vulkan x86_64下的使用 完整源码

2023-07-14

Vulkan ,编译ffmpeg 硬件加速时使用

Vulkan ,编译ffmpeg 硬件加速时使用

2023-07-05

single-producer, single-consumer lock-free queue

single-producer, single-consumer lock-free queue

2023-06-29

ncnn vulkan 以类的方式推理示例

https://flyfish.blog.csdn.net/article/details/131323138

2023-06-21

CEF使用示例

CEF使用示例

2016-05-23

Agg在Windows下的编译 字符集 Unicode

Agg在Windows下的编译与使用 AGG(Anti-Grain Geometry)是一个开源免费的图形库。 官网地址: www.antigrain.com 环境: Win10 x64 Visual Studio 2013 字符集 Unicode 主要是编译称为Lib库,然后提供给其他程序使用

2017-12-27

C++实现的BOSN bson-cpp的编译

C++实现的BOSN bson-cpp的编译

2015-07-24

MFC中使用duilib

MFC中使用duilib MFC为框架,以duilib美化界面 MFC窗口是父窗口,duilib窗口作为其子窗口

2017-10-18

grpc编译安装所需文件

grpc所需文件包括benchmark-master.zip googletest-master.zip thrift-master.zip c-ares-1.14.0.tar.gz grpc-master.zip zlib-master.zip gflags-master.zip protobuf-master.zip

2018-07-31

TensorFlow inception-2015-12-05.tgz

TensorFlow inception-2015-12-05.tgz 该压缩包 包含 classify_image_graph_def.pb imagenet_2012_challenge_label_map_proto.pbtxt 等

2017-09-18

bson-cpp的编译

编译环境: VC2010 64位 需要配置Boost库

2015-07-31

Duilib的设计工具DuiDesigner

Duilib的设计工具DuiDesigner 包括源码 方便设计 已在vs2013下编译通过

2017-10-19

一个曾经商业化的MFC library Ultimate Grid 现在免费提供

一个曾经商业化的MFC library Ultimate Grid 现在免费提供 原文的demo 的字符集是多字节的,现在更改为 使用Unicode字符集 平台工具集更改为 Visual Studio 2013 - Windows XP(v120_xp)

2017-10-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除