【目标检测数据集】VOC2012 数据集与 SBD dataset 介绍
发布网友
发布时间:2024-10-16 06:18
我来回答
共1个回答
热心网友
时间:2024-10-16 10:05
VOC数据集,源自PASCAL VOC Challenge,详情可访问host.robots.ox.ac.uk/pa...,其常用的RGB均值为(122.67891434, 116.66876762, 104.00698793),而Pytorch中通用的归一化参数为mean=(0.485, 0.456, 0.406)和std=(0.229, 0.224, 0.225)。VOC2012包含20类物体(含背景):人、动物(如鸟、猫等)、车辆、室内物品等,共21类。PASCAL VOC挑战赛涵盖对象分类、目标检测、目标分割和行为识别等任务,区别在于语义分割与实例分割的精细程度。
Annotations文件夹存储了图像的标签和边界框信息,ImageSets用于存放不同任务的数据集划分,JPEGImages存放17125张彩色原图,其中2913张用于分割。SegmentationClass包含2913张PNG格式的语义分割label,SegmentationObject则对应实例分割。更多细节请参阅VOC2007的数据集介绍。
SBD(VOC的Augmented dataset)扩展了数据集,包含img、cls和inst等子文件夹,提供了额外的11355张图片和对应的label,train.txt和val.txt用于训练和验证集索引。要使用这些数据,需将.mat格式的label转换为8-bit灰度PNG。JPEGImages与SBD的img目录需合并,确保分割图像对应无误。
要获取VOC2012和SBD dataset,请访问相关链接。最后,鼓励大家关注公众号@AI算法与电子竞赛,共同探索更多可能。让我们以开放的心态面对挑战,不断前行!