洪官燕 發表於 2026-3-15 19:55:00

基于深度学习的工程车辆检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

<h2><span style="font-family: &quot;PingFang SC&quot;, &quot;Smart Quotes&quot;, -apple-system, BlinkMacSystemFont, &quot;Helvetica Neue&quot;, &quot;Microsoft YaHei&quot;, &quot;Source Han Sans SC&quot;, &quot;Noto Sans CJK SC&quot;, &quot;WenQuanYi Micro Hei&quot;, sans-serif">视频演示</span></h2>
<p>基于深度学习的工程车辆检测系统<br></p>
<h2>1. 前言​</h2>
<div>
<div class="qk-md-paragraph"><span style="font-size: 16px"><span class="qk-md-text complete">大家好,欢迎来到Coding茶水间!</span></span></div>
<div class="qk-md-paragraph"><span style="font-size: 16px"><span class="qk-md-text complete">在当前智慧工地与城市数字化管理加速落地的背景下,针对施工现场安全隐患多、监管难度大等痛点,传统的人工巡检模式已难以满足实时性与精准度的需求,而基于深度学习的目标检测技术正成为解决这一难题的关键突破口;今天给大家介绍的题目是</span><strong class="qk-md-strong"><span class="qk-md-text complete">基于YOLO算法的工程车辆检测系统</span></strong><span class="qk-md-text complete" data-spm-anchor-id="5176.28103460.0.i0.38f97d83BKiKey">,这套系统深度融合了最新的YOLOv12及多种主流模型,能够高效、精准地识别复杂场景中的工程车辆,并通过可视化的交互界面实现图片、视频流及摄像头实时的多维度检测,兼具置信度调节、语音播报预警、详细数据统计导出及用户权限管理等实用功能,旨在为施工安全监控提供一套低成本、高效率且易于部署的智能化解决方案。</span></span></div>
</div>
<p><img alt="wechat_副本" data-src="https://img2024.cnblogs.com/blog/3687401/202601/3687401-20260122195459096-454164006.jpg" class="lazyload"></p>
<h2 id="2.%20%E9%A1%B9%E7%9B%AE%E6%BC%94%E7%A4%BA">2. 项目演示</h2>
<h3 id="2.1%20%E7%99%BB%E5%BD%95%E7%95%8C%E9%9D%A2">2.1&nbsp;<strong>用户登录界面</strong></h3>
<p><span style="font-size: 16px">登录界面布局简洁清晰,左侧展示系统主题,用户需输入用户名、密码及验证码完成身份验证后登录系统。</span></p>
<p><img alt="1" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194213095-1620632342.png" class="lazyload"></p>
<h3>&nbsp;</h3>
<h3 id="2.2%20%E7%94%A8%E6%88%B7%E6%B3%A8%E5%86%8C">2.2&nbsp;<strong>新用户注册</strong></h3>
<p><span style="font-size: 16px">注册时可自定义用户名与密码,支持上传个人头像;如未上传,系统将自动使用默认头像完成账号创建。</span></p>
<h3><img alt="ScreenShot_2026-02-02_161731_730" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194221071-421549874.png" class="lazyload"></h3>
<h3>&nbsp;</h3>
<h3>&nbsp;</h3>
<h3 id="2.3%20%E4%B8%BB%E7%95%8C%E9%9D%A2">2.3&nbsp;<strong>主界面布局</strong></h3>
<p><span style="font-size: 16px">主界面采用三栏结构,左侧为功能操作区,中间用于展示检测画面,右侧呈现目标详细信息,布局合理,交互流畅。</span></p>
<p><img alt="2" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194228533-1242705607.png" class="lazyload"></p>
<h3>&nbsp;</h3>
<h3>&nbsp;</h3>
<h3 id="2.4%20%E4%BF%AE%E6%94%B9%E7%94%A8%E6%88%B7%E4%BF%A1%E6%81%AF">2.4&nbsp;<strong>个人信息管理</strong></h3>
<p><span style="font-size: 16px">用户可在此模块中修改密码或更换头像,个人信息支持随时更新与保存。</span></p>
<p><img alt="ScreenShot_2026-02-02_161820_943" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194235551-397532047.png" class="lazyload"></p>
<h3>&nbsp;</h3>
<h3 id="2.5%20%E6%A3%80%E6%B5%8B%E5%8A%9F%E8%83%BD%E5%B1%95%E7%A4%BA">2.5&nbsp;<strong>多模态检测展示</strong></h3>
<p><span style="font-size: 16px">系统支持图片、视频及摄像头实时画面的目标检测。识别结果将在画面中标注显示,并且带有语音播报提醒,并在下方列表中逐项列出。点击具体目标可查看其类别、置信度及位置坐标等详细信息。</span></p>
<p><img alt="3" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194243450-386414298.png" class="lazyload"></p>
<h3>&nbsp;</h3>
<h3>2.6&nbsp;<strong>检测结果保存</strong></h3>
<p><span style="font-size: 16px">可以将检测后的图片、视频进行保存,生成新的图片和视频,新生成的图片和视频中会带有检测结果的标注信息,并且还可以将所有检测结果的数据信息保存到excel中进行,方便查看检测结果。</span></p>
<h3><img alt="004" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194252977-1536516925.jpg" class="lazyload"></h3>
<h3><img alt="ScreenShot_2026-02-02_170449_243" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194257047-841740611.png" class="lazyload"></h3>
<p>&nbsp;</p>
<p>&nbsp;</p>
<h3>2.7&nbsp;<strong>多模型切换</strong></h3>
<p><span style="font-size: 16px">系统内置多种已训练模型,用户可根据实际需求灵活切换,以适应不同检测场景或对比识别效果。</span></p>
<p><img alt="ScreenShot_2026-02-02_162800_142" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194309897-1997369715.png" class="lazyload"></p>
<h2>&nbsp;</h2>
<h2>&nbsp;</h2>
<h2 id="3.%E6%A8%A1%E5%9E%8B%E8%AE%AD%E7%BB%83%E6%A0%B8%E5%BF%83%E4%BB%A3%E7%A0%81">3.模型训练核心代码</h2>
<p><span style="font-size: 16px">本脚本是YOLO模型批量训练工具,可自动修正数据集路径为绝对路径,从pretrained文件夹加载预训练模型,按设定参数(100轮/640尺寸/批次8)一键批量训练YOLOv5nu/v8n/v11n/v12n模型。</span></p>
<div class="cke_widget_wrapper cke_widget_block cke_widget_codeSnippet cke_widget_selected" data-cke-display-name="代码段" data-cke-filter="off" data-cke-widget-id="8" data-cke-widget-wrapper="1">
<pre class="language-python highlighter-hljs"><code># -*- coding: utf-8 -*-
"""
该脚本用于执行YOLO模型的训练。

它会自动处理以下任务:
1. 动态修改数据集配置文件 (data.yaml),将相对路径更新为绝对路径,以确保训练时能正确找到数据。
2. 从 'pretrained' 文件夹加载指定的预训练模型。
3. 使用预设的参数(如epochs, imgsz, batch)启动训练过程。

要开始训练,只需直接运行此脚本。
"""
import os
import yaml
from pathlib import Path
from ultralytics import YOLO

def main():
    """
    主训练函数。
   
    该函数负责执行YOLO模型的训练流程,包括:
    1. 配置预训练模型。
    2. 动态修改数据集的YAML配置文件,确保路径为绝对路径。
    3. 加载预训练模型。
    4. 使用指定参数开始训练。
    """
    # --- 1. 配置模型和路径 ---
   
    # 要训练的模型列表
    models_to_train = [
      {'name': 'yolov5nu.pt', 'train_name': 'train_yolov5nu'},
      {'name': 'yolov8n.pt', 'train_name': 'train_yolov8n'},
      {'name': 'yolo11n.pt', 'train_name': 'train_yolo11n'},
      {'name': 'yolo12n.pt', 'train_name': 'train_yolo12n'}
    ]
   
    # 获取当前工作目录的绝对路径,以避免相对路径带来的问题
    current_dir = os.path.abspath(os.getcwd())
   
    # --- 2. 动态配置数据集YAML文件 ---
   
    # 构建数据集yaml文件的绝对路径
    data_yaml_path = os.path.join(current_dir, 'train_data', 'data.yaml')
   
    # 读取原始yaml文件内容
    with open(data_yaml_path, 'r', encoding='utf-8') as f:
      data_config = yaml.safe_load(f)
   
    # 将yaml文件中的 'path' 字段修改为数据集目录的绝对路径
    # 这是为了确保ultralytics库能正确定位到训练、验证和测试集
    data_config['path'] = os.path.join(current_dir, 'train_data')
   
    # 将修改后的配置写回yaml文件
    with open(data_yaml_path, 'w', encoding='utf-8') as f:
      yaml.dump(data_config, f, default_flow_style=False, allow_unicode=True)
   
    # --- 3. 循环训练每个模型 ---
   
    for model_info in models_to_train:
      model_name = model_info['name']
      train_name = model_info['train_name']
      
      print(f"\n{'='*60}")
      print(f"开始训练模型: {model_name}")
      print(f"训练名称: {train_name}")
      print(f"{'='*60}")
      
      # 构建预训练模型的完整路径
      pretrained_model_path = os.path.join(current_dir, 'pretrained', model_name)
      if not os.path.exists(pretrained_model_path):
            print(f"警告: 预训练模型文件不存在: {pretrained_model_path}")
            print(f"跳过模型 {model_name} 的训练")
            continue
      
      try:
            # 加载指定的预训练模型
            model = YOLO(pretrained_model_path)
            
            # --- 4. 开始训练 ---
            
            print(f"开始训练 {model_name}...")
            # 调用train方法开始训练
            model.train(
                data=data_yaml_path,# 数据集配置文件
                epochs=100,         # 训练轮次
                imgsz=640,            # 输入图像尺寸
                batch=8,             # 每批次的图像数量
                name=train_name,      # 模型名称
            )
            
            print(f"{model_name} 训练完成!")
            
      except Exception as e:
            print(f"训练 {model_name} 时出现错误: {str(e)}")
            print(f"跳过模型 {model_name},继续训练下一个模型")
            continue
   
    print(f"\n{'='*60}")
    print("所有模型训练完成!")
    print(f"{'='*60}")

if __name__ == "__main__":
    # 当该脚本被直接执行时,调用main函数
    main()</code></pre>
<span class="cke_reset cke_widget_drag_handler_container"><img class="cke_reset cke_widget_drag_handler lazyload" height="15" width="15" data-cke-widget-drag-handler="1" data-src="https://img2024.cnblogs.com/blog/3687401/202508/3687401-20250822165457676-1808144825.gif"></span></div>
<h2 id="3.%20%E6%8A%80%E6%9C%AF%E6%A0%88">4. 技术栈</h2>
<ul>
<li>
<p><span style="font-size: 16px">语言:Python 3.10</span></p>
</li>
<li>
<p><span style="font-size: 16px">前端界面:PyQt5</span></p>
</li>
<li>
<p><span style="font-size: 16px">数据库:SQLite(存储用户信息)</span></p>
</li>
<li>
<p><span style="font-size: 16px">模型:YOLOv5、YOLOv8、YOLOv11、YOLOv12</span></p>
</li>
</ul>
<h2>&nbsp;</h2>
<h2>&nbsp;</h2>
<h2 id="4.%20YOLO%E6%A8%A1%E5%9E%8B%E5%AF%B9%E6%AF%94%E4%B8%8E%E8%AF%86%E5%88%AB%E6%95%88%E6%9E%9C%E8%A7%A3%E6%9E%90">5. YOLO模型对比与识别效果解析</h2>
<h3 id="4.1%20YOLOv5%2FYOLOv8%2FYOLOv11%2FYOLOv12%E6%A8%A1%E5%9E%8B%E5%AF%B9%E6%AF%94">5.1 YOLOv5/YOLOv8/YOLOv11/YOLOv12模型对比</h3>
<p><span style="font-size: 16px">基于Ultralytics官方COCO数据集训练结果:</span></p>
<table class="mceItemTable">
<thead>
<tr>
<th>
<p><span style="font-size: 16px">模型</span></p>
</th>
<th>
<p><span style="font-size: 16px">尺寸(像素)</span></p>
</th>
<th>
<p><span style="font-size: 16px">mAPval 50-95</span></p>
</th>
<th>
<p><span style="font-size: 16px">速度(CPU ONNX/毫秒)</span></p>
</th>
<th>
<p><span style="font-size: 16px">参数(M)</span></p>
</th>
<th>
<p><span style="font-size: 16px">FLOPs(B)</span></p>
</th>
</tr>
</thead>
<tbody>
<tr>
<td>
<p><span style="font-size: 16px">YOLO12n</span></p>
</td>
<td>
<p><span style="font-size: 16px">640</span></p>
</td>
<td>
<p><span style="font-size: 16px">40.6</span></p>
</td>
<td>
<p><span style="font-size: 16px">-</span></p>
</td>
<td>
<p><span style="font-size: 16px">2.6</span></p>
</td>
<td>
<p><span style="font-size: 16px">6.5</span></p>
</td>
</tr>
<tr>
<td>
<p><span style="font-size: 16px">YOLO11n</span></p>
</td>
<td>
<p><span style="font-size: 16px">640</span></p>
</td>
<td>
<p><span style="font-size: 16px">39.5</span></p>
</td>
<td>
<p><span style="font-size: 16px">56.1 ± 0.8</span></p>
</td>
<td>
<p><span style="font-size: 16px">2.6</span></p>
</td>
<td>
<p><span style="font-size: 16px">6.5</span></p>
</td>
</tr>
<tr>
<td>
<p><span style="font-size: 16px">YOLOv8n</span></p>
</td>
<td>
<p><span style="font-size: 16px">640</span></p>
</td>
<td>
<p><span style="font-size: 16px">37.3</span></p>
</td>
<td>
<p><span style="font-size: 16px">80.4</span></p>
</td>
<td>
<p><span style="font-size: 16px">3.2</span></p>
</td>
<td>
<p><span style="font-size: 16px">8.7</span></p>
</td>
</tr>
<tr>
<td>
<p><span style="font-size: 16px">YOLOv5nu</span></p>
</td>
<td>
<p><span style="font-size: 16px">640</span></p>
</td>
<td>
<p><span style="font-size: 16px">34.3</span></p>
</td>
<td>
<p><span style="font-size: 16px">73.6</span></p>
</td>
<td>
<p><span style="font-size: 16px">2.6</span></p>
</td>
<td>
<p><span style="font-size: 16px">7.7</span></p>
</td>
</tr>
</tbody>
</table>
<p><span style="font-size: 16px"><strong>关键结论</strong>:</span></p>
<ol>
<li>
<p><span style="font-size: 16px"><strong>精度最高</strong>:YOLO12n(mAP 40.6%),显著领先其他模型(较YOLOv5nu高约6.3个百分点);</span></p>
</li>
<li>
<p><span style="font-size: 16px"><strong>速度最优</strong>:YOLO11n(CPU推理56.1ms),比YOLOv8n快42%,适合实时轻量部署;</span></p>
</li>
<li>
<p><span style="font-size: 16px"><strong>效率均衡</strong>:YOLO12n/YOLO11n/YOLOv8n/YOLOv5nu参数量均为2.6M,FLOPs较低(YOLO12n/11n仅6.5B);YOLOv8n参数量(3.2M)与计算量(8.7B)最高,但精度优势不明显。</span></p>
</li>
</ol>
<p><span style="font-size: 16px"><strong>综合推荐</strong>:</span></p>
<ul>
<li>
<p><span style="font-size: 16px">追求高精度:优先选YOLO12n(精度与效率兼顾);</span></p>
</li>
<li>
<p><span style="font-size: 16px">需高速低耗:选YOLO11n(速度最快且精度接近YOLO12n);</span></p>
</li>
<li>
<p><span style="font-size: 16px">YOLOv5nu/YOLOv8n因性能劣势,无特殊需求时不建议首选。</span></p>
</li>
</ul>
<h3>&nbsp;</h3>
<h3>&nbsp;</h3>
<h3 id="5.2%C2%A0%E6%95%B0%E6%8D%AE%E9%9B%86%E5%88%86%E6%9E%90">5.2&nbsp;数据集分析</h3>
<p><img alt="labels" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194319386-2052863864.jpg" class="lazyload"></p>
<p><span style="font-size: 16px">数据集中训练集和验证集一共650+张图片,数据集目标类别1种:工程车辆<span style="font-family: &quot;PingFang SC&quot;, &quot;Smart Quotes&quot;, -apple-system, BlinkMacSystemFont, &quot;Helvetica Neue&quot;, &quot;Microsoft YaHei&quot;, &quot;Source Han Sans SC&quot;, &quot;Noto Sans CJK SC&quot;, &quot;WenQuanYi Micro Hei&quot;, sans-serif">,识别率是0.87,</span>数据集配置代码如下:</span></p>
<div class="cke_widget_wrapper cke_widget_block cke_widget_codeSnippet cke_widget_selected" data-cke-display-name="代码段" data-cke-filter="off" data-cke-widget-id="6" data-cke-widget-wrapper="1">
<pre class="language-xml highlighter-hljs"><code>train: ../train/images
val: ../valid/images
test: ../test/images

nc: 1
names: ['-']</code></pre>
</div>
<p><img alt="train_batch0" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194415509-326639219.jpg" class="lazyload"><img alt="train_batch1" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194419487-1125651105.jpg" class="lazyload"></p>
<p id="5.%20%E7%BB%93%E6%9D%9F%E8%AF%AD"><span style="font-size: 16px">上面的图片就是部分样本集训练中经过数据增强后的效果标注。</span></p>
<h3>&nbsp;</h3>
<h3 id="5.3%20%E8%AE%AD%E7%BB%83%E7%BB%93%E6%9E%9C">5.3 训练结果</h3>
<p><img alt="confusion_matrix_normalized" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194426602-109718333.png" class="lazyload"></p>
<p><span style="font-size: 16px">混淆矩阵显示中识别精准度显示是一条对角线,矩阵斜线显示每个类别的识别率<span style="font-family: &quot;PingFang SC&quot;, &quot;Smart Quotes&quot;, -apple-system, BlinkMacSystemFont, &quot;Helvetica Neue&quot;, &quot;Microsoft YaHei&quot;, &quot;Source Han Sans SC&quot;, &quot;Noto Sans CJK SC&quot;, &quot;WenQuanYi Micro Hei&quot;, sans-serif">。</span></span></p>
<p><img alt="BoxF1_curve" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194444487-911298103.png" class="lazyload"></p>
<p><span style="font-size: 16px">F1指数(F1 Score)是统计学和机器学习中用于评估分类模型性能的核心指标,综合了模型的精确率(Precision)和召回率(Recall),通过调和平均数平衡两者的表现。&nbsp;</span></p>
<p><span style="font-size: 16px">当置信度为0.242时,所有类别的综合F1值0.84(蓝色曲线)。</span></p>
<p><img alt="BoxPR_curve" data-src="https://img2024.cnblogs.com/blog/3687401/202603/3687401-20260315194501114-904336885.png" class="lazyload"></p>
<p><span style="font-size: 16px">mAP@0.5:是目标检测任务中常用的评估指标,表示在交并比(IoU)阈值为0.5时计算的平均精度均值(mAP)。其核心含义是:只有当预测框与真实框的重叠面积(IoU)≥50%时,才认为检测结果正确。</span></p>
<p><span style="font-size: 16px">图中可以看到综合mAP@0.5值0.891(89.1%)。</span></p>
<h2>&nbsp;</h2>
<h2 id="4.%20YOLO%E6%A8%A1%E5%9E%8B%E5%AF%B9%E6%AF%94%E4%B8%8E%E8%AF%86%E5%88%AB%E6%95%88%E6%9E%9C%E8%A7%A3%E6%9E%90">6. 源码获取方式</h2>
<p>源码获取方式:https://www.bilibili.com/video/BV1YpZJBHEE3</p><br><br>
来源:https://www.cnblogs.com/codingtea/p/19721988
頁: [1]
查看完整版本: 基于深度学习的工程车辆检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)