【目标检测数据集】VOC2012 数据集与 SBD dataset 介绍

发布网友发布时间：2024-10-16 06:18

共1个回答

热心网友时间：2024-10-16 10:05

VOC数据集，源自PASCAL VOC Challenge，详情可访问host.robots.ox.ac.uk/pa...，其常用的RGB均值为(122.67891434, 116.66876762, 104.00698793)，而Pytorch中通用的归一化参数为mean=(0.485, 0.456, 0.406)和std=(0.229, 0.224, 0.225)。VOC2012包含20类物体（含背景）：人、动物（如鸟、猫等）、车辆、室内物品等，共21类。PASCAL VOC挑战赛涵盖对象分类、目标检测、目标分割和行为识别等任务，区别在于语义分割与实例分割的精细程度。

Annotations文件夹存储了图像的标签和边界框信息，ImageSets用于存放不同任务的数据集划分，JPEGImages存放17125张彩色原图，其中2913张用于分割。SegmentationClass包含2913张PNG格式的语义分割label，SegmentationObject则对应实例分割。更多细节请参阅VOC2007的数据集介绍。

SBD（VOC的Augmented dataset）扩展了数据集，包含img、cls和inst等子文件夹，提供了额外的11355张图片和对应的label，train.txt和val.txt用于训练和验证集索引。要使用这些数据，需将.mat格式的label转换为8-bit灰度PNG。JPEGImages与SBD的img目录需合并，确保分割图像对应无误。

要获取VOC2012和SBD dataset，请访问相关链接。最后，鼓励大家关注公众号@AI算法与电子竞赛，共同探索更多可能。让我们以开放的心态面对挑战，不断前行！