视频演示
基于深度学习的花朵识别系统
1. 前言
大家好,欢迎来到 Coding 茶水间!
今天我们带来的分享主题是 《基于 YOLO 算法的花朵识别系统》。在进入具体演示前,先简单介绍一下现状与我们团队的定位——这是我们已经完成并可交付使用的成品项目,涵盖从算法研发到可视化系统的全流程落地。如果有定制化开发需求的伙伴,也可以通过私信与我们沟通合作。我们的核心技术覆盖 计算机视觉 全链条,支持 Python 与 MATLAB 双语言开发,业务方向包括 目标检测、图像分类与识别、图像分割与增强,以及 深度学习算法的复现与优化。
本系统可识别 103 种常见花卉,从山茶花、美人蕉、风铃草,到牵牛、矮牵牛、一品红等,覆盖广泛。系统界面采用三区布局,功能按钮、参数调节、实时展示与数据统计一应俱全,并支持 单图、批量图片、视频及摄像头实时流 检测,同时提供 模型切换、置信度与 IOU 调节、语音播报、结果保存与导出 等完整功能。此外,还包含 用户登录管理、脚本化无界面检测、以及完整的模型训练流程,并配套训练集与验证集(共计 5400+ 张图像),支持多模型(YOLOv8、YOLO12 等)训练与评估。
接下来,我们将带大家完整走一遍系统的功能演示,从界面操作到后台训练,帮助大家快速了解这一套可实际落地的花卉识别解决方案。
2. 项目演示
2.1 用户登录界面
登录界面布局简洁清晰,左侧展示系统主题,用户需输入用户名、密码及验证码完成身份验证后登录系统。
2.2 新用户注册
注册时可自定义用户名与密码,支持上传个人头像;如未上传,系统将自动使用默认头像完成账号创建。
2.3 主界面布局
主界面采用三栏结构,左侧为功能操作区,中间用于展示检测画面,右侧呈现目标详细信息,布局合理,交互流畅。
2.4 个人信息管理
用户可在此模块中修改密码或更换头像,个人信息支持随时更新与保存。
2.5 多模态检测展示
系统支持图片、视频及摄像头实时画面的目标检测。识别结果将在画面中标注显示,并且带有语音播报提醒,并在下方列表中逐项列出。点击具体目标可查看其类别、置信度及位置坐标等详细信息。
2.6 检测结果保存
可以将检测后的图片、视频进行保存,生成新的图片和视频,新生成的图片和视频中会带有检测结果的标注信息,并且还可以将所有检测结果的数据信息保存到excel中进行,方便查看检测结果。
2.7 多模型切换
系统内置多种已训练模型,用户可根据实际需求灵活切换,以适应不同检测场景或对比识别效果。
3.模型训练核心代码
本脚本是YOLO模型批量训练工具,可自动修正数据集路径为绝对路径,从pretrained文件夹加载预训练模型,按设定参数(100轮/640尺寸/批次8)一键批量训练YOLOv5nu/v8n/v11n/v12n模型。
4. 技术栈
5. YOLO模型对比与识别效果解析
5.1 YOLOv5/YOLOv8/YOLOv11/YOLOv12模型对比
基于Ultralytics官方COCO数据集训练结果:
|
模型
|
尺寸(像素)
|
mAPval 50-95
|
速度(CPU ONNX/毫秒)
|
参数(M)
|
FLOPs(B)
|
|
YOLO12n
|
640
|
40.6
|
-
|
2.6
|
6.5
|
|
YOLO11n
|
640
|
39.5
|
56.1 ± 0.8
|
2.6
|
6.5
|
|
YOLOv8n
|
640
|
37.3
|
80.4
|
3.2
|
8.7
|
|
YOLOv5nu
|
640
|
34.3
|
73.6
|
2.6
|
7.7
|
关键结论:
-
精度最高:YOLO12n(mAP 40.6%),显著领先其他模型(较YOLOv5nu高约6.3个百分点);
-
速度最优:YOLO11n(CPU推理56.1ms),比YOLOv8n快42%,适合实时轻量部署;
-
效率均衡:YOLO12n/YOLO11n/YOLOv8n/YOLOv5nu参数量均为2.6M,FLOPs较低(YOLO12n/11n仅6.5B);YOLOv8n参数量(3.2M)与计算量(8.7B)最高,但精度优势不明显。
综合推荐:
-
追求高精度:优先选YOLO12n(精度与效率兼顾);
-
需高速低耗:选YOLO11n(速度最快且精度接近YOLO12n);
-
YOLOv5nu/YOLOv8n因性能劣势,无特殊需求时不建议首选。
5.2 数据集分析
数据集中训练集和验证集一共5400+张图片,数据集目标类别103种ingFang SC", "Smart Quotes", -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif">,数据集配置代码如下:
train: ../train/images
val: ../valid/images
nc: 103
names: ['flowers', 'alpine_sea_holly', 'anthurium', 'artichoke',
'azalea', 'ball_moss', 'balloon_flower', 'barbeton_daisy',
'bearded_iris', 'bee_balm', 'bird_of_paradise', 'bishop_of_llandaff',
'black_eyed_susan', 'blackberry_lily', 'blanket_flower', 'bolero_deep_blue',
'bougainvillea', 'bromelia', 'buttercup', 'californian_poppy',
'camellia', 'canna_lily', 'canterbury_bells', 'cape_flower',
'carnation', 'cautleya_spicata', 'clematis', 'colts_foot',
'columbine', 'common_dandelion', 'corn_poppy', 'cyclamen',
'daffodil', 'desert-rose', 'english_marigold', 'fire_lily',
'foxglove', 'frangipani', 'fritillary', 'garden_phlox', 'gaura',
'gazania', 'geranium', 'giant_white_arum_lily', 'globe_flower',
'globe_thistle', 'grape_hyacinth', 'great_masterwort',
'hard-leaved_pocket_orchid', 'hibiscus', 'hippeastrum',
'japanese_anemone', 'king_protea', 'lenten_rose', 'lotus',
'love_in_the_mist', 'magnolia', 'mallow', 'marigold',
'mexican_aster', 'mexican_petunia', 'monkshood', 'moon_orchid',
'morning_glory', 'orange_dahlia', 'osteospermum', 'oxeye_daisy',
'passion_flower', 'pelargonium', 'peruvian_lily', 'petunia',
'pincushion_flower', 'pink-yellow_dahlia', 'pink_primrose',
'poinsettia', 'primula', 'prince_of_wales_feathers',
'purple_coneflower', 'red_ginger', 'rose', 'ruby-lipped_cattleya',
'siam_tulip', 'silverbush', 'snapdragon', 'spear_thistle', 'spring_crocus',
'stemless_gentian', 'sunflower', 'sweet_pea', 'sweet_william', 'sword_lily',
'thorn_apple', 'tiger_lily', 'toad_lily', 'tree_mallow', 'tree_poppy',
'trumpet_creeper', 'wallflower', 'water_lily', 'watercress', 'wild_pansy',
'windflower', 'yellow_iris']
![train_batch0]() ![train_batch1]()
上面的图片就是部分样本集训练中经过数据增强后的效果标注。
5.3 训练结果
混淆矩阵显示中识别精准度显示是一条对角线,方块颜色越深代表对应的类别识别的精准度越高ingFang SC", "Smart Quotes", -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif">。
F1指数(F1 Score)是统计学和机器学习中用于评估分类模型性能的核心指标,综合了模型的精确率(Precision)和召回率(Recall),通过调和平均数平衡两者的表现。
当置信度为0.560时,所有类别的综合F1值达到了0.89(蓝色曲线)。
mAP@0.5:是目标检测任务中常用的评估指标,表示在交并比(IoU)阈值为0.5时计算的平均精度均值(mAP)。其核心含义是:只有当预测框与真实框的重叠面积(IoU)≥50%时,才认为检测结果正确。
图中可以看到综合mAP@0.5达到了0.923(92.3%),准确率非常高。
6. 源码获取方式
源码获取方式:https://www.bilibili.com/video/BV1tAreBCEY1
来源:https://www.cnblogs.com/codingtea/p/19570394 |