宇妈 發表於 2025-1-14 08:40:00

AI Agents(智能体)是什么能做什么

<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Agents从去年大模型火后就开始爆发,特别是今年2025又被称为<strong>Agents元年</strong>,像是要无处不存在Agents似的。Agent是什么,直译过来就是代理,但在国内人工智能领域通常被译为智能体。从智能体这个名字可以大概想象出这个Agents可能与智能相关,此概念出现已经有相当长时间了。随着大模型的爆发现在Agents的驱动核心为大模型,似乎智能体(Agents)时代真要来临了。<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<strong>大模型大大降低了智能体实现的门槛</strong>,但如何用好智能体似乎各方都还在摸索中。目前智能体的应用中使用最广泛最多的应该还是在编程领域代码助手比较火爆,如<strong>Cursor</strong>等都是AI智能体。</p>
<h3 id="智能体概念">智能体概念</h3>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;现在大模型主要有本文大模型、多模态大模型,可生成文字、逻辑推理、编写代码、生成图片视频等等能力。光有这些模型基础能力还不能够被称为智能体,智能体:顾名思义是一系列能力的集合体。在不同环境中其智能体的能力也不一样,<strong>智能体=大模型+工具集</strong>。</p>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;在除了大模型的生成能力、逻辑推理能力、再加上其函数(工具)调用的能力呢,似乎已经看到了智能体的雏形。</p>
<center><img src="https://img2024.cnblogs.com/blog/84976/202501/84976-20250113215113722-1442752265.png"></center>
<center> **智能体 = 推理 + 生成 + 工具调用** </center>
<h3 id="智能体模式">智能体模式</h3>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;这里只简单介绍两种相对简单的模式:串行Workflow模式、动态Agents模式。<br>
<img src="https://img2024.cnblogs.com/blog/84976/202501/84976-20250113215113713-51302085.png" alt="2.png" loading="lazy"><br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<strong>Workflow模式:</strong> 初级智能体,此模式下智能体只能执行某些经过编排好的能力实现固定功能。</p>
<p><img src="https://img2024.cnblogs.com/blog/84976/202501/84976-20250113215113796-1494386501.png" alt="3.png" loading="lazy"></p>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<strong>智能规划模式:</strong> 高级智能体,完全由智能体规划任务,决定任务如何执行,是调用两个服务还是调用三个服务取决于任务还有规划的制定。</p>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;已经有了高级智能体为什么还要去实现初级智能体,因为目前模型的意图识别、推理、规划能力还达不到指哪打哪100%可靠的程度,这时候智能度越高越复杂的智能体可能也意味着出错的概率越大。所以使用简单又能够满足业务需求的初级智能体或许是更好的选择。</p>
<h3 id="智能体示例">智能体示例</h3>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;智能体能做什么,可以随意发挥想象,可以说你能想到什么他就能做什么。以前你要统计某些数据、写个报告通常都要查这张表、那张表,现在有了智能体你只需要一句话就可以实现,智能体自己进行意图分析调用对应的工具实现该逻辑。</p>
<p><img src="https://img2024.cnblogs.com/blog/84976/202501/84976-20250113215113817-1170966800.png" alt="4.png" loading="lazy"></p>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;上面智能体包含了工具一个用于查询历史一个用于查询新闻,程序会根据具体的提问决定使用哪些工具调用去实现该任务。</p>
<p><img src="https://img2024.cnblogs.com/blog/84976/202501/84976-20250113215113825-363433977.png" alt="5.png" loading="lazy"></p>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;上面智能体包含了<strong>设备、产品、告警、Web Search四个服务工具</strong>,上面示例中模型根据提问者的意图使用了分别使用了四个任务去实现该任务。</p>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<strong>智能家居智能体:</strong> 当你在电脑桌前敲代码,对着手机喊一声小爱同学过来这边拖地,这时候触发了扫地机器人智能体,智能体对“过来这边拖地”这句话进行意图识别分析,识别到“过来”、“拖地”,于是通过人在传感器发现你的具体位置,并对扫地机器人发出拖地指令以及位置信息。目前还没有实现该场景凭空想象出来的。</p>
<h3 id="可行性与成本">可行性与成本</h3>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;目前大模型理解、生成数据的可靠性并不能达到100%所以很多畅想并不能实现,在现在的水平智能体(Agents)业务越复杂出错的概率就越高。增删改查,智能体查错数据可能问题不大,但是增删改错数据就不是小问题。除非能避免或保证不出错或能够忽略不在乎该错误。<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;目前业内通常在智能体中加入了评估模块用于提高智能体的可靠性,评估分数小于某个阈值则重新迭代某个或整个流程。再怎样还是没法保证智能体执行的结果是一定正确的,类似与Cursor等编程助手智能体之所以比较流行一个重要的原因之一是这类应用的容错性、容忍性比较高,可以通过后续调试测试发现错误修正错误。<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;智能体(Agents)的可靠性,步骤越多可靠性越低。一个节点可靠性是90%,如智能体内部达到5个流程节点串联,整体可靠性就降到不到60%。</p>
<pre><code>智能体可靠性=0.90*0.90*0.90*0.90*0.90=59%
</code></pre>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;随着评估模块、安全模块的加入智能体的成本进一步增加,原来一个响应要十秒现在可能增加到30秒,原来消耗2万tokens现在可能就消耗了5万tokens。</p>
<h3 id="未来">未来</h3>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;由于可靠性问题,目前距离完全智能体可能还有一段距离,现在是智能体的基座大模型可靠性限制了智能体的想象空间。对智能体感兴趣的可去看看谷歌最近发布的《Agents》白皮书与Anthropic的新文章。</p>
<p>参考资料:<br>
谷歌《Agents》</p><br><br>
来源:https://www.cnblogs.com/softlin/p/18669191
頁: [1]
查看完整版本: AI Agents(智能体)是什么能做什么