非戈 發表於 2025-11-27 09:52:00

吴恩达深度学习课程三: 结构化机器学习项目 第一周:机器学习策略(三)模型性能与“人类性能”

<p>此分类用于记录吴恩达深度学习课程的学习笔记,目前已完结,点击进入全集目录<br>
课程相关信息链接如下:</p>
<ol>
<li>原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai</li>
<li>github课程资料,含课件与笔记:吴恩达深度学习教学资料</li>
<li>课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案</li>
</ol>
<p>本篇为第三课的第一周内容,1.8到1.12的内容,也是本周的最后一篇内容,另外,因为内容并不涉及新技术,理论习题也只是对本周所提经验的应用,所以<strong>本周没有课后部分</strong>。</p>
<hr>
<p>本周为第三课的第一周内容,本周的内容关于在实际项目进行中的一些基本策略,并不涉及技术性的知识。<br>
经过整个第一课和第二课后, 我们已经了解了足够支持我们构建一个完整的基础神经网络项目的知识和技术,本周便是在这些基础上的一个指导策略,可以帮助实现更好确定项目方向,优化和评估模型性能。<br>
只要对前面两课涉及的技术原理足够了解,<strong>可以说,本周的内容不存在理解上的难度。</strong><br>
本篇的内容关于模型性能与“人类性能”,通过比较模型性能和人的表现讨论模型优化的方向和空间。</p>
<h1 id="1-人类表现和贝叶斯最优错误率">1. 人类表现和贝叶斯最优错误率</h1>
<p>我们之前一直在提猫分类器,实际上,我们人眼很容易就能做到这一点,无论是高清还是模糊,除非是一些确实模糊到近乎马赛克的图像,不然我们都能成功的分辨。<br>
换句话说,<strong>以任何一个指标来说,人类都是一个极其优秀的猫分类器。</strong><br>
但很显然,我们的“人类性能”用来做猫分类器实在是有点<strong>大材小用</strong>了。<br>
所以,我们创造人工智能,就是想要以精密的工作流实现这部分功能,让我们的“性能”发挥在更有用的地方。<br>
而实际上,现在人工智能在很多领域的性能甚至已经超越了“人类性能”,<strong>人工智能如何至此?我们又是如何以“人类性能”指导人工智能的优化的?这就是这本篇的内容。</strong></p>
<p>首先,我们对一个项目的开发往往有这样一个过程:<br>
<img src="https://img2024.cnblogs.com/blog/3708248/202511/3708248-20251126183859744-1452162853.png" alt="image.png" loading="lazy"><br>
而对于为什么模型性能超过“人类性能”后很难再提升,我们再展开一下:<br>
<img src="https://img2024.cnblogs.com/blog/3708248/202511/3708248-20251126183859917-897707236.png" alt="image.png" loading="lazy"><br>
了解了这部分内容后,你就会发现,<strong>对于某项任务,了解我们人的水平,对模型性能的提升也会有所指导。</strong><br>
由此,我们进入下一部分。</p>
<h1 id="2可避免偏差下的优化策略">2.可避免偏差下的优化策略</h1>
<p>又双是猫分类器,我们再以此先引出一个说法:在计算机视觉领域,我们的识别分辨能力几乎很难出现差错,因此,<strong>在这种人的水平极高的领域里,我们可以直接把”人类错误率“作为贝叶斯最优错误率</strong>。<br>
知道了这个前提后,现在来看这样一个例子,这里引入了一个新概念:<strong>可避免偏差</strong>。<br>
<img src="https://img2024.cnblogs.com/blog/3708248/202511/3708248-20251126183859683-1543559870.png" alt="image.png" loading="lazy"></p>
<p>就像图中所示,引入可避免偏差后,我们就可以以此判断更适合的优化策略。<br>
<strong>此外,对于偏差和方差问题,如果你有些遗忘,可以在这里回顾:偏差与方差</strong><br>
现在,我们知道在某些领域可以人类错误率作为贝叶斯最优错误率来估计优化空间,<strong>但人与人间是不同的,我们要如何界定人类错误率?</strong><br>
我们继续下一部分。</p>
<h1 id="3-如何界定人类性能">3. 如何界定“人类性能”?</h1>
<p>来看课程里这样一个例子:<br>
<img src="https://img2024.cnblogs.com/blog/3708248/202511/3708248-20251126184101179-641463068.png" alt="image.png" loading="lazy"><br>
相信你应该有答案了,我们继续:<br>
<img src="https://img2024.cnblogs.com/blog/3708248/202511/3708248-20251126184055859-867097164.png" alt="image.png" loading="lazy"><br>
在此之前,我们评估偏差问题,<strong>实际上都是以0%的错误率为目标</strong>的,经过这一部分后,我们更细化了优化空间,这也能帮助我们做出更准确的优化决策。<br>
这种指导作用会一直存在,<strong>直到模型性能超过人类性能</strong>。<br>
那这时我们该怎么办呢?这就是下一部分的内容。</p>
<h1 id="4--超越人类后">4.超越人类后</h1>
<p>继续这个医生的例子,现在来看这种情况:<br>
<img src="https://img2024.cnblogs.com/blog/3708248/202511/3708248-20251126184053319-1340989528.png" alt="image.png" loading="lazy"><br>
实际上,这类机器超过人类的领域有很多,最常见的就是<strong>推荐算法</strong>,你的抖音推送,你的购物APP首页,可能比你自己还要了解你。</p>
<p>八年前的课程里并没有提及在模型超过人类表现后的进一步调优的具体方法论,但我想就算是现在也没有这种东西。<strong>可以说,在调优里,唯一不变的就是不断地尝试。</strong></p>
<h1 id="5总结">5.总结</h1>
<p>我们完善前面一幅图来总结一下本周的理论内容:<br>
<img src="https://img2024.cnblogs.com/blog/3708248/202511/3708248-20251126183859541-539480759.png" alt="image.png" loading="lazy"></p><br><br>
来源:https://www.cnblogs.com/Goblinscholar/p/19274215
頁: [1]
查看完整版本: 吴恩达深度学习课程三: 结构化机器学习项目 第一周:机器学习策略(三)模型性能与“人类性能”