当前位置: 首页 > news >正文

YOLOv5s.yaml文件解读

目录

  • 一、YOLOv5s.yaml内容
  • 二、详解
    • 2.1参数配置
    • 2.2 anchors
    • 2.3 backbone
    • 2.4 head
  • 三、如何调整模型

一、YOLOv5s.yaml内容

YOLOv5配置了4种不同大小的网络模型,分别是YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,其中YOLOv5s是网络深度和宽度最小但检测速度最快的模型,其他3中模型都是在YOLOv5s的基础上不断加深、加宽网络使得网络规模扩大,在增强模型检测性能的同时增加了计算资源和速度消耗。

# YOLOv5 🚀 by Ultralytics, GPL-3.0 license

# Parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple
anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

# YOLOv5 v6.0 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]

# YOLOv5 v6.0 head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],  # cat backbone P4
   [-1, 3, C3, [512, False]],  # 13

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],  # cat backbone P3
   [-1, 3, C3, [256, False]],  # 17 (P3/8-small)

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],  # cat head P4
   [-1, 3, C3, [512, False]],  # 20 (P4/16-medium)

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],  # cat head P5
   [-1, 3, C3, [1024, False]],  # 23 (P5/32-large)

   [[17, 20, 23], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)
  ]

二、详解

2.1参数配置

# Parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple    控制模型深度
width_multiple: 0.50  # layer channel multiple  控制Conv通道channel个数(卷积核数量)

depth_multiple:控制子模块数量, = int(number*depth)
width_multiple:控制卷积核的数量, = int(number*width)

通过这两个参数可以实现不同复杂度的模型设计。

2.2 anchors

anchors:
  - [10,13, 16,30, 33,23]  # P3/8 ,检测小目标,10,13是一组尺寸,总共三组检测小目标
  - [30,61, 62,45, 59,119]  # P4/16,检测中目标,共三组
  - [116,90, 156,198, 373,326]  # P5/32,检测大目标,共三组

YOLOv5初始化了9个anchor,在3个Detect层(3个feature map)中使用,每个feature map的每个grid_cell都有3个anchor进行预测。

分配规则:
尺度越大的feature map越靠前,相对原图的下采样率越小,感受野越小,则相对可以预测一些尺度比较小的物体,所有分配到定anchor越小;尺度越小的feature map越靠后,相对原图的下采样率越大,感受野越大,则相对可以预测一些尺寸比较大的物体,所有分配到的anchor也越大。即可以在小特征图(feature map)上检测大目标,也可以在大特征图上检测小目标。

YOLOv5根据工程经验得到了这么3组anchors(9对尺寸参数),对于很多数据集而言已经很合适了。但也不能保证这3组anchor就适用于所有数据集,所以YOLOv5还有一个anchor进化的策略:使用k-means和遗传进化算法,找到与当前数据集最吻合的anchors。

2.3 backbone

backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]

参数含义
from:表示当前模块的输入来自那一层的输出,-1表示来自上一层的输出。
number:表示当前模块的理论重复次数,实际的重复次数还要由上面的参数 depth_multiple 共同决定,决定网络模型的深度。
module:模块类名,通过这个类名去 common.py 中寻找相应的类,进行模块化的搭建网络。
args:是一个 list,模块搭建所需参数,channel,kernel_size,stride,padding,bias等,会在网络搭建过程中根据不同层进行改变.

2.4 head

# YOLOv5 v6.0 head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],  # cat backbone P4
   [-1, 3, C3, [512, False]],  # 13
 
   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],  # cat backbone P3
   [-1, 3, C3, [256, False]],  # 17 (P3/8-small)
 
   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],  # cat head P4
   [-1, 3, C3, [512, False]],  # 20 (P4/16-medium)
 
   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],  # cat head P5
   [-1, 3, C3, [1024, False]],  # 23 (P5/32-large)
 
   [[17, 20, 23], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)
  ]

同上,由四个参数组成

三、如何调整模型

比如:将第4层的C32修改为C31,第6层的C33修改为C32
那么需要调整的地方主要是backbone部分

# YOLOv5 v6.0 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 3, C3, [256]], # 第4层改动
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 6, C3, [512]], # 第6层改动
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]

第4层改为C31,即将60.33=2改成:30.33=1
第6层改为C3
2,即将90.33=3改成:60.33=2
原来
在这里插入图片描述
改动后:
在这里插入图片描述

相关文章:

  • hbuider 做网站/武汉seo排名公司
  • 修改wordpress域名/谷歌google下载安卓版 app
  • 做资讯类网站需要什么资质/广州疫情升级
  • 网站上的链接怎么做的/网络营销怎么做推广
  • 做后期从哪个网站选音乐/app运营需要做哪些
  • 聊城做网站推广费用/沈阳线上教学
  • 数据管理篇之数据质量
  • 5G无线技术基础自学系列 | 5G接入类KPI
  • 彻底卸载2345王牌输入法的方法
  • Python解题 - CSDN周赛第17期 - 拯救公主
  • ImportError: DLL load failed while importing etree: 找不到指定的模块。
  • 太神了!开源大佬的SpringBoot+微服务架构笔记,一般人真肝不出来
  • 为何推荐首选enum class 而非 enum
  • 红队隧道应用篇之Burpsuite设置上游代理访问内网(五)
  • 逆天了!用Numpy开发深度学习框架,透视神经网络训练过程
  • 渗透攻击MS08-067
  • 2022年全国职业院校技能大赛中职组网络安全竞赛试题B模块 —wirehark数据分析与取证captureWH.pcapng(解析教程)
  • vcpkg踩坑记录