ubuntu18.04下用yolov5训练自己的数据集
时间: 2025-04-17 19:46:30 浏览: 30
### 准备工作
为了在 Ubuntu 18.04 上使用 YOLOv5 训练自定义数据集,需先安装必要的依赖项并设置好 Python 环境。确保已安装最新版本的 Git 和 PyTorch 库[^1]。
```bash
sudo apt-get update && sudo apt-get install git python3-pip -y
pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cpu
```
### 下载与配置 YOLOv5
获取官方仓库中的 YOLOv5 源码,并切换至所需分支:
```bash
git clone https://github.com/ultralytics/yolov5.git
cd yolov5
git checkout tags/v6.2 -b v6.2
pip3 install -r requirements.txt
```
上述命令会克隆最新的稳定版源码,并安装所需的 Python 包以支持项目运行[^2]。
### 数据准备
创建一个新的文件夹用于存储自定义的数据集,在该目录下建立 `images` 和 `labels` 文件夹分别放置图像及其对应的标签文件。按照 COCO 或者 VOC 格式的标注方式整理图片和 XML 文档,再通过工具转换成 YOLO 所需 `.txt` 形式的边界框坐标表示法[^3]。
编写 `custom_dataset.yaml` 描述数据路径以及类别名称列表:
```yaml
train: ../datasets/custom/images/train/
val: ../datasets/custom/images/validation/
nc: 80 # 类别数量
names: ['person', 'car'] # 自定义目标类名数组
```
此 YAML 文件指定了训练集验证集的位置还有分类数目及各物体的名字[^4]。
### 开始训练
执行如下指令启动训练流程,其中 `-data` 参数指定之前编辑好的 dataset configuration file 路径;而 `-weights` 则指向预训练权重位置(可选),比如 yolov5s.pt 是轻量级模型初始参数之一[^5]:
```bash
python3 train.py --img 640 --batch 16 --epochs 50 --data custom_dataset.yaml --cfg models/yolov5s.yaml --name my_custom_training_run --cache
```
以上命令设置了输入尺寸、批量大小、迭代次数等超参选项来调整学习效率[^6]。
### 结果评估
完成一轮完整的 epoch 后,默认会在 runs/train/my_custom_training_run 目录内保存 checkpoint checkpoints 及最终得到的最佳权值 best.pt 。可以利用 evaluate script 对新获得的结果做进一步分析[^7]。
```python
from utils.general import strip_optimizer, set_logging
strip_optimizer('runs/train/exp/weights/best.pt') # 剥离优化器状态字典
set_logging() # 设置日志记录等级
```
阅读全文
相关推荐


















