初识目标检测
<p>一.目前我校主要研究方向就是目标检测,所以首先应对目标检测有初步了解。目标检测属于计算机视觉中的一个热门方向,主要应用于物体、人、动物识别、动作识别等。结合我校农业研究方向,通过目标检测,可以用来检测瓜果、蔬菜的成熟度、可以用来识别花卉、土壤营养分析、蔬菜采摘等。我国为农业大国,通过在农业工程中运用人工智能技术,可以有效降低人力投入、经济成本。<br>人工智能研究方向分类如下图:</p>
<p><img alt="图片1" loading="lazy" src="https://img2024.cnblogs.com/blog/3720192/202510/3720192-20251030160904230-1667414530.png" class="lazyload"><br>
传统目标检测项目一般包括以下几个流程:图例如下图<img alt="image" loading="lazy" src="https://img2024.cnblogs.com/blog/3720192/202510/3720192-20251030162031644-284621712.png" class="lazyload"><img alt="image" loading="lazy" src="https://img2024.cnblogs.com/blog/3720192/202510/3720192-20251030162045115-1460020956.png" class="lazyload"><br>
具体步骤如下:<br>
1.数据集收集:通常是采集图像样本获得初始数据<br>
2.数据预处理:通过数据标注来给数据进行打标签和分类。关于数据标注:<img alt="image" loading="lazy" src="https://img2024.cnblogs.com/blog/3720192/202510/3720192-20251030162111674-442598433.png" class="lazyload"><br>
3.特征工程:主要包括特征抽取、特征预处理、特征降维等操作。具体见下图:<img alt="image" loading="lazy" src="https://img2024.cnblogs.com/blog/3720192/202510/3720192-20251030162204451-1089149129.png" class="lazyload"><br>
其中特征抽取通常使用卷积神经网络来实现。卷积神经网络概念如下<br>
<img alt="image" loading="lazy" src="https://img2024.cnblogs.com/blog/3720192/202510/3720192-20251030162231362-1149268087.png" class="lazyload"><br>
模型选择:适用于实时检测的单阶段YOLO检测方法。其网络架构如下图所示:<img alt="image" loading="lazy" src="https://img2024.cnblogs.com/blog/3720192/202510/3720192-20251030162324603-920213402.png" class="lazyload"><br>
<img alt="image" loading="lazy" src="https://img2024.cnblogs.com/blog/3720192/202510/3720192-20251030162333734-612026281.png" class="lazyload"><br>
5.模型训练:概括来讲,是在已知输入、已知结果的条件下,通过不断修改模型的参数,使得模型输出不断逼近结果的过程,当输出与实际结果的差值足够小时,我们就说该模型达到的预期。<br>
6.模型评估:主要衡量指标包括准确率、精确率、召回率等详细含义和计算方式如下<br>
tp:真正,将正例预测为正例的数量。<br>
fp:假正,将负例预测为正例的数量。<br>
tn:真负,将负例预测为负例的数量。<br>
fn:假负,将正例预测为负例的数量。---<br>
准确率:正确预测的数量占总样本数量的比例--(tp+tn)/(tp+tn+fp+fn)-----<br>
精确率:将正例预测为正例的数量tp/预测为正例的数量(tp+fp)----------------<br>
召回率:将正例预测为正例的数量tp/实际正例的数量(tp+fn)<br>
例如:<img alt="image" loading="lazy" src="https://img2024.cnblogs.com/blog/3720192/202510/3720192-20251030162405685-1581221958.png" class="lazyload"></p><br><br>
来源:https://www.cnblogs.com/zgm1/p/19177385
頁:
[1]