- 博客(8)
- 收藏
- 关注
原创 大模型指令遵从微调——从数据清洗到合成
本教程主要实现了一个大模型的指令遵从微调方法。为了便于实现,减少代码量,本文使用了🤗HuggingFace的TRL框架实现。该框架除了支持SFT外,对DPO、PPO、GRPO等流行的强化微调算法都有很好的支持。虽然使用框架能够极大的减少工作量,但是不可避免的为新手学习带来了困扰。因此本教程会尽量附上完整的文档引用来帮助读者进一步学习框架。诚然从使用pytorch实现微调过程能够极大的提升对过程的理解,社区也有相当多优秀的项目。
2025-03-30 18:32:45
1036
原创 AI医疗影像入门教程:UNet进行X光影像分割 + CoreHub平台使用
本文使用的是阿里天池平台中的MICCAI 2023 Challenges:STS-基于2D全景图像的牙齿分割任务中的数据。数据分为两部分:初赛训练集提供2000张牙齿全景图像、测试集500张。训练集包括原图以及对应的mask,测试集仅提供原图。复赛共提供4000张牙齿图像,包含2000张有标签的牙齿图像(提供原图以及对应的mask)以及2000张无标签的牙齿全景图像。复赛的测试集包含1000张牙齿全景图像,只提供原图,不提供mask。考虑到只是练手项目,我们使用初赛数据集就可以了。天池的官方提供了。
2025-01-08 15:59:35
951
原创 Qwen2.5思维链微调代码实操 + 多卡Lora微调完整代码
网上关于思维链微调的实操比较少,甚至对于Qwen的指令微调高质量的文章都不多,许多细节都描述的不清楚,希望这篇文章能够进一步帮助到读者微调Qwen时能够关注到一些细节。
2024-12-15 04:49:41
1520
原创 MindSpore的NPU环境安装教程+疑难杂症排查(附上测试代码)
本博客记录一下MindSpore环境安装流程和第一次安装会遇到的一些小问题
2024-12-08 02:04:58
1134
原创 目标检测框架mmdetection如何使用swanlab远程查看训练日志
平常做一些涉及物品检测的项目或者课题的时候觉得mmdetection非常好用。其设计的config功能能够让我们快速拉起多个实验,也方便多个人开启实验时使用git管理。有空了可以专门写一期如何将自己的项目改写成config模式的博客(先挖坑)。mmdetection的框架非常好用,里面不仅带了很多数据集预处理的脚本,还有一些实验日志记录的脚本和框架支持。不过在多个人一起搞项目的时候还是会使用一些在线实验日志记录工具,国内的推荐SwanLab。
2024-05-21 19:58:38
583
1
原创 使用UNet+mmsegmentation完成全景X射线图像牙齿分割任务(阿里天池题目)
使用UNet+mmsegmentation完成全景X射线图像牙齿分割任务(阿里天池题目), SwanLab可视化训练日志
2024-05-20 18:38:19
2221
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人