🟥 1. Ground Truth Box(真值框)
数据集中人工标注的真实目标位置。
• 📦 是“答案”,模型训练的目标。
• 标注格式通常是 [x, y, w, h, class_id]
• 比如一张猫的图,它的真实框就是 ground truth box。
⸻
🟦 2. Anchor Box(锚框)
预设的一些模板框,模型学习时的“参考基准”。
• 是一些固定的宽高组合(比如[10×13]、[16×30]等),
• 每个 grid cell 会分配若干 anchor,用来“捕捉”可能存在的目标。
• 训练时,模型会尝试让某个 anchor 去拟合最接近的 ground truth box。
⸻
🟨 3. Bounding Box(预测框)
模型预测出来的目标框,最终输出结果。
• 是你跑推理时看到的结果。
• 每个 anchor 最终预测一个 bounding box(包含位置 + 置信度 + 类别)。
名称 | 中文 | 角色 | 是否固定 | 举例 |
---|---|---|---|---|
Ground Truth Box | 真值框 | 训练目标 | ❌ 否 | [80, 120, 60, 90] |
Anchor Box | 锚框 | 初始模板 / 参考框 | ✅ 是 | [10, 13], [116, 90] 等 |
Bounding Box | 预测框 | 模型的最终输出 | ❌ 否 | [78, 118, 65, 85] |