正文

目标检测yolov5跑通voc2007数据集(代码片段)

zstar-_  zstar-_  2023-03-14  407

关键词：

前言

如果经常阅读我博客的读者，想必对YOLOv5并不陌生。在Pytorch：YOLO-v5目标检测(上)一文中，我使用了coco128数据集，非常轻松的跑通了。然而在使用VOC2007数据集时，却遇到重重阻碍。主要问题在数据标签转化这个阶段，VOC数据集标注形式是xml，需要将其转换为txt。很多博文并未把文件的放置位置交代清楚，导致走了不少弯路，本篇博文就记录如何不走弯路地跑通VOC数据集。

VOC数据集

我是用的VOC数据集是VOC2007，它的文件格式长这样：

注：官网上下载的话训练验集和测试集是分成两个压缩包VOCtrainval_06-Nov-2007.tar和VOCtest_06-Nov-2007.tar，此处我将其进行合并，如需下载我合并后的数据集，可跳转到文末进行下载。

Annotations
该文件包含数据标注的xml文件
ImageSets
该文件包含数据集的划分
JPEGImages
该文件包含图像数据集

拿到数据集，第一件需要干的事是把JPEGImages文件夹名称改成images，具体原因后面解释，改完之后如图所示：

数据集处理

从GitHub上，下载Yolov5代码
项目地址：
https://github.com/ultralytics/yolov5
下载完之后，在文件中新建一个文件，我起名为voc_label.py，起名，位置均随意，这个文件主要干两件事：

1、将ImageSets中的训练集、测试集、验证集提出来，拼凑成可以直接访问的绝对路径，如图所示
2、把xml格式的标注转换成txt格式，如图所示：

图中红色方框圈住的是要提取出的数据，对于每一个目标，txt格式的数据有5个，分别为(class, x , y , w, h)，即类别、中心点(x,y)，宽高(w,h)。这里的转换公式在代码中有写道，不作细述。注意class必须是以0开始的序号，否则训练时会出现类别溢出的报错。

voc_label.py

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join

sets = ['train', 'test', 'val']

Imgpath = 'D:/Desktop/Work/VOC2007/images' 
xmlfilepath = 'D:/Desktop/Work/VOC2007/Annotations/'  
ImageSets_path = 'D:/Desktop/Work/VOC2007/ImageSets/Segmentation/'
Label_path = 'D:/Desktop/Work/VOC2007/'
classes = ["aeroplane", "bicycle", "bird", "boat", "bottle", "bus", "car", "cat", "chair", "cow", "diningtable", "dog", "horse", "motorbike", "person", "pottedplant", "sheep", "sofa", "train", "tvmonitor"]



def convert(size, box):
    dw = 1. / size[0]
    dh = 1. / size[1]
    x = (box[0] + box[1]) / 2.0
    y = (box[2] + box[3]) / 2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return (x, y, w, h)


def convert_annotation(image_id):
    in_file = open(xmlfilepath + '%s.xml' % (image_id))
    out_file = open(Label_path + 'labels/%s.txt' % (image_id), 'w')
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\\n')


for image_set in sets:
    if not os.path.exists(Label_path + 'labels/'):
        os.makedirs(Label_path + 'labels/')
    image_ids = open(ImageSets_path + '%s.txt' % (image_set)).read().strip().split()
    list_file = open(Label_path + '%s.txt' % (image_set), 'w')
    for image_id in image_ids:
        list_file.write(Imgpath + '/%s.jpg\\n' % (image_id))
        convert_annotation(image_id)
    list_file.close()

使用时，替换路径和类别classes即可。

运行之后，会在数据集文件夹下生成四个文件，labels中的txt文件和images中的图片名称一一对应。

训练准备

YOLOv5是通过yaml格式的配置文件来找到对应的训练测试数据，因此在训练前需要对该文件进行简单配置。
尽管YOLOv5已有自带的voc.yaml配置文件，但为了之后训练自己的数据，我这里还是新建一个mydata.yaml来将VOC数据进行导入。

train: D:/Desktop/Work/VOC2007/train.txt
val: D:/Desktop/Work/VOC2007/val.txt
test: D:/Desktop/Work/VOC2007/test.txt

# number of classes
nc: 20

# class names
names: [ 'aeroplane', 'bicycle', 'bird', 'boat', 'bottle', 'bus', 'car', 'cat', 'chair', 'cow', 'diningtable', 'dog', 'horse', 'motorbike', 'person', 'pottedplant', 'sheep', 'sofa', 'train', 'tvmonitor' ]

文件内容很简单，需要指定三个数据集的路径，类别个数和类别名称。

开始训练

打开train.py文件
主要需要调整三个参数
我使用yolov5s作为预训练模型，如下图所示进行修改。

运行之后，程序会自动从官网下载yolov5s.pt模型文件，放在根目录下面。
如果前面的操作和我一样，到此时应该能顺利跑通训练程序。
程序默认的epochs为300，为了尽快看到效果，可以改小些，训练完后，会在runs -> train -> exp 中看到训练和验证的文件。

如果再次运行，会发现生成了一个新的文件夹exp2…这是由于yolov5默认将每次运行结果单独放一个文件夹存储。
具体代码可参见train.py的518行

opt.save_dir = increment_path(Path(opt.project) / opt.name, exist_ok=opt.exist_ok | opt.evolve)  # increment run

这里的increment_path函数就是每次累加exp序号，如果需要将结果保存到指定路径，可以直接将路径替换到等号右边。

当然，Yolov5也提供了一种便捷的方式放置不断生成exp文件。
在超参数设定中，有个参数为exist-ok，其默认为False，将其设置为True，则程序再次运行会在最近的exp生成文件。

另外，还有各种不同的参数，参数含义补充如下，可供研究参考。

    parser = argparse.ArgumentParser()
    parser.add_argument('--weights', type=str, default='yolov5s.pt', help='initial weights path')
    parser.add_argument('--cfg', type=str, default='models/yolov5s.yaml', help='model.yaml path  模型配置和网络结构的yaml文件路径')
    parser.add_argument('--data', type=str, default='data/mydata.yaml', help='data.yaml path 数据集配置的yaml文件路径，包括数据集的路径，类名等关键信息')
    parser.add_argument('--hyp', type=str, default='data/hyp.scratch.yaml', help='超参数配置的yaml文件路径')
    parser.add_argument('--epochs', type=int, default=2)
    parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs')
    parser.add_argument('--img-size', nargs='+', type=int, default=[640, 640], help='[train, test] image sizes  输入图像的分辨率大小')
    parser.add_argument('--rect', action='store_true', help='rectangular training  是否采用矩形图像训练，默认是False')
    parser.add_argument('--resume', nargs='?', const=True, default=False, help='resume most recent training 从给定的path/last.pt恢复训练，如果为空，则从最近保存的path/last.pt恢复训练')
    parser.add_argument('--nosave', action='store_true', help='only save final checkpoint 保存模型，只保存最后的检查点，默认为False')
    parser.add_argument('--notest', action='store_true', help='only test final epoch 训练中不进行test，只测试最后一个轮次，默认为False')
    parser.add_argument('--noautoanchor', action='store_true', help='disable autoanchor check 不自动调整anchor，默认为False')
    parser.add_argument('--evolve', action='store_true', help='evolve hyperparameters 是否进行超参数进化，默认为False')
    parser.add_argument('--bucket', type=str, default='', help='gsutil bucket')
    parser.add_argument('--cache-images', action='store_true', help='cache images for faster training 是否提前缓存图片到内存，以加快训练速度，默认为False')
    parser.add_argument('--image-weights', action='store_true', help='use weighted image selection for training')
    parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
    parser.add_argument('--multi-scale', action='store_true', help='vary img-size +/- 50%% 是否进行多尺度训练，默认为False')
    parser.add_argument('--single-cls', action='store_true', help='train multi-class data as single-class 将所有数据按照一个类别进行训')
    parser.add_argument('--adam', action='store_true', help='use torch.optim.Adam() optimizer 是否使用 torch.optim.Adam() 优化器，默认是False')
    parser.add_argument('--sync-bn', action='store_true', help='use SyncBatchNorm, only available in DDP mode 是否使用跨卡同步BN')
    parser.add_argument('--local_rank', type=int, default=-1, help='DDP parameter, do not modify')
    parser.add_argument('--workers', type=int, default=0, help='maximum number of dataloader workers')
    parser.add_argument('--project', default='runs/train', help='save to project/name')
    parser.add_argument('--entity', default=None, help='W&B entity')
    parser.add_argument('--name', default='exp', help='save to project/name')
    parser.add_argument('--exist-ok', default=True, action='store_true', help='existing project/name ok, do not increment')
    parser.add_argument('--quad', action='store_true', help='quad dataloader')
    parser.add_argument('--linear-lr', action='store_true', help='linear LR')
    parser.add_argument('--label-smoothing', type=float, default=0.0, help='Label smoothing epsilon')
    parser.add_argument('--upload_dataset', action='store_true', help='Upload dataset as W&B artifact table')
    parser.add_argument('--bbox_interval', type=int, default=-1, help='Set bounding-box image logging interval for W&B')
    parser.add_argument('--save_period', type=int, default=-1, help='Log model after every "save_period" epoch')
    parser.add_argument('--artifact_alias', type=str, default="latest", help='version of dataset artifact to be used')
    opt = parser.parse_args()

开始测试

上面的过程只运用到了模型的训练和验证，打开test.py，可使用测试集对模型进行测试。
需要修改的参数和训练程序差不多，值得注意的是，yolov5在每次训练之后会输出两个模型文件，一个是best.pt，即验证集上表现最好(mAP最高)的模型，另一个是last.pt，即最后一轮训练的模型。通常来说，输入best.pt进行测试即可。
测试运行之后，会在runs中生成一个test文件，其中可进行训练结果和标注结果的对比。

开始检测

训练/测试只停留在数据集范围内，下面要对一些数据集之外的数据进行检测，打开detect.py文件
修改source为检测图片的文件夹，运行之后，在run->detect中输出检测结果。

数据集/源码

本文使用的VOC2007数据集下载地址：
https://pan.baidu.com/s/1Be9Ya5__2J9LKJhV5RkhaA?pwd=8888
本文编辑之后的Yolov5文件：
https://pan.baidu.com/s/1GHAbUdU-Rf0dNc-FYgonCA?pwd=8888

目标检测yolov5跑通visdrone数据集(代码片段)

...据集VisDrone和遥感数据集xView，这反映了官方也是在小目标检测中在偷偷发力。这篇博文就来记录如何用YOLOv5跑通VisDrone数据集。数据集我已上传到网盘里，有需要的读者可以进行下载：https://pan.baidu.com 查看详情

目标检测小脚本：数据集划分(代码片段)

需求内容之前写了一篇【目标检测】YOLOv5跑通VOC2007数据集里面写了个脚本是将xml标注格式转换称Yolo格式，同时读取数据集划分。在训练自己的数据时，我发现没有现成的数据集划分文件，于是就写了这个小脚本来读... 查看详情

笔记2：yolov5训练自己的目标检测模型_创建并划分数据集(代码片段)

目标检测---数据集格式转化及训练集和验证集划分_didiaopao的博客-CSDN博客1、我们经常从网上获取一些目标检测的数据集资源标签的格式都是VOC(xml格式)的，而yolov5训练所需要的文件格式是yolo(txt格式)的，这里就需要对x... 查看详情

动手学cv-目标检测入门教程2：voc数据集(代码片段)

3.2目标检测数据集VOC本文来自开源组织DataWhale🐳CV小组创作的目标检测入门教程。对应开源项目《动手学CV-Pytorch》的第3章的内容，教程中涉及的代码也可以在项目中找到，后续会持续更新更多的优质内容，欢迎... 查看详情

动手学cv-目标检测入门教程2：voc数据集(代码片段)

voc数据集目标检测(代码片段)

最近在做与目标检测模型相关的工作,很多都要求VOC格式的数据集.PASCALVOC挑战赛（ThePASCALVisualObjectClasses）是一个世界级的计算机视觉挑战赛,PASCAL全称：PatternAnalysis,StaticalModelingandComputationalLearning，是一个由欧盟资助的网络组织。... 查看详情

深度学习目标检测：yolov5实现车辆检测(含车辆检测数据集+训练代码)(代码片段)

深度学习目标检测：YOLOv5实现车辆检测(含车辆检测数据集+训练代码) 目录YOLOv5实现车辆检测(含车辆检测数据集+训练代码)1.前言2.车辆检测数据集说明（1）车辆检测数据集（2）自定义数据集3.基于YOLOv5... 查看详情

深度学习目标检测：yolov5实现车辆检测(含车辆检测数据集+训练代码)(代码片段)

深度学习和目标检测系列教程17-300：3个类别面罩检测类别数据集训练yolov5s模型(代码片段)

@Author：RunsenYOLO是目前最火爆的的计算机视觉算法之一，今天使用的数据集来源：https://www.kaggle.com/andrewmvd/face-mask-detection这是数据集可以创建一个模型来检测戴口罩、不戴口罩或不正确戴口罩的人。该数据集包含... 查看详情

目标检测实战教程01-使用labelimg标注目标检测数据集|voc转coco数据集(代码片段)

目标检测实战教程01-使用labelimg标注目标检测数据集|voc转COCO数据集b站视频演示：B站视频教学对图像进行编号将收集到的图像进行编号方便统一管理，编号代码如下importospath="E:\\\\image1"filelist=os.listdir(path)#该... 查看详情

paddle学习赛——钢铁目标检测（yolov5ppyoloe+，faster-rcnn）(代码片段)

文章目录一、赛事简介二、ppyoloe+l模型，41.32分（PaddleDetection-voc）2.1安装PaddleDetection2.2数据预处理2.2.1解压数据集2.2.2自定义数据集(感觉很麻烦，暂时放弃）2.2.3准备VOC数据集（直接用这个）2.3修改... 查看详情

目标检测yolov5跑xview数据集/小样本检测策略实验(代码片段)

前言在YOLOv5的6.1版本新出了xView.yaml数据配置文件，提供了遥感数据集xView的检测方法。此篇就使用YOLOv5来试跑xView数据集，并对一些小样本检测的策略进行消融实验。xView数据集下载：https://github.com/zstar1003/Dataset数据... 查看详情

深度学习目标检测：yolov5实现红绿灯检测(含红绿灯数据集+训练代码)(代码片段)

深度学习目标检测：YOLOv5实现红绿灯检测(含红绿灯数据集+训练代码)1.前言本篇博客，我们将手把手教你搭建一个基于YOLOv5的红绿灯目标检测项目。目前，基于YOLOv5s的红绿灯检测精度平均值mAP_0.5=0.93919，mAP_0... 查看详情

深度学习目标检测：yolov5实现红绿灯检测(含红绿灯数据集+训练代码)(代码片段)

voc2007数据集详细分析(代码片段)

VOC数据集官网链接→http://host.robots.ox.ac.uk/pascal/VOC/。 VOC2007数据集官网链接→http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html。 VOC2007数据集百度网盘链接→提取码：z8sd。VOC2007数据集分析： VOC2007数据集有20个... 查看详情

[数据集][voc][目标检测]西瓜数据集目标检测可用yolo训练-1702张介绍

数据集名称：高质量西瓜目标检测数据集数据集地址：数据集VOC格式目标检测数据集西瓜数据集-1702张-数据集文档类资源-CSDN下载数据集介绍：数据集格式：PascalVOC格式(不包含分割路径的txt文件和yolo格式的txt文件... 查看详情

使用python将dota数据集的格式转换成voc2007数据集的格式(代码片段)

...;文件夹ImageSets中存放的是图像划分的集合的txt文件，目标查看详情

使用python将dota数据集的格式转换成voc2007数据集的格式(代码片段)

...;文件夹ImageSets中存放的是图像划分的集合的txt文件，目标查看详情

正文

目标检测yolov5跑通voc2007数据集(代码片段)

前言

VOC数据集

数据集处理

训练准备

开始训练

开始测试

开始检测

更多拓展

超参数注释

更改文件名的逻辑

数据集/源码

目标检测yolov5跑通visdrone数据集(代码片段)

目标检测小脚本：数据集划分(代码片段)

笔记2：yolov5训练自己的目标检测模型_创建并划分数据集(代码片段)

动手学cv-目标检测入门教程2：voc数据集(代码片段)

动手学cv-目标检测入门教程2：voc数据集(代码片段)

voc数据集目标检测(代码片段)

深度学习目标检测：yolov5实现车辆检测(含车辆检测数据集+训练代码)(代码片段)

深度学习目标检测：yolov5实现车辆检测(含车辆检测数据集+训练代码)(代码片段)

深度学习和目标检测系列教程17-300：3个类别面罩检测类别数据集训练yolov5s模型(代码片段)

目标检测实战教程01-使用labelimg标注目标检测数据集|voc转coco数据集(代码片段)

paddle学习赛——钢铁目标检测（yolov5ppyoloe+，faster-rcnn）(代码片段)

目标检测yolov5跑xview数据集/小样本检测策略实验(代码片段)

深度学习目标检测：yolov5实现红绿灯检测(含红绿灯数据集+训练代码)(代码片段)

深度学习目标检测：yolov5实现红绿灯检测(含红绿灯数据集+训练代码)(代码片段)

voc2007数据集详细分析(代码片段)

[数据集][voc][目标检测]西瓜数据集目标检测可用yolo训练-1702张介绍

使用python将dota数据集的格式转换成voc2007数据集的格式(代码片段)

使用python将dota数据集的格式转换成voc2007数据集的格式(代码片段)