AI智能体(Agent)总体框架及技术发展现状
<div class="show-monitor"><div class="expand-container">
<div>
<div>
<div class="article-content">
<div>
<h1 class="pgc-h-arrow-right" data-track="1">智能体(Agent)定义</h1>
<p data-track="2">AI智能体,又称AI代理或 Al Agent,是能够感知环境,基于目标进行决策并执行动作的智能化应用。它具备自主性、交互性、反应性和适应性等基本特征,能够在复杂多变的环境中独立完成任务。智能体的出现,标志着人工智能从简单的规则匹配和计算模拟向更高级别的自主智能迈进。</p>
<p class="pgc-p syl-page-br" data-track="3"> </p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-axegupay5k/e436f62ab3fb4800abdf0433ed351bc4~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=yyjnzWYjsrf%2B0Me4J1l3RcFlyV8%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<p data-track="4">Al Agent 具备三个核心能力:独立思考、自主执行、持续迭代。</p>
<ul>
<li data-track="5">独立思考: 能够根据给定任务目标和约束条件,进行任务规划和问题拆解,形成执行步骤(即工作流);</li>
<li data-track="6">自主执行: 能够调取各类组件和工具,按照执行步骤依次执行,实现任务目标;</li>
<li data-track="7">持续迭代: 能够自动记录任务目标、工作流和执行结果,基于结果反馈,沉淀专家知识和案例。</li>
</ul>
<h1 class="pgc-h-arrow-right">Agent 衔接模型层与应⽤层,是现阶段⼤模型应⽤落地的重要补充</h1>
<p data-track="9">智能体,在众多中间层中,处于中心位置,可以封装模型微调、提示工程、检索增强生成。随着底层模型技术的持续进步与演化,未来可能会出现模型层逐渐内化并泛化出原本由中间层提供的部分能力。</p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/d0c1047dea78444ab1c13c52e76961bc~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=fBeGl2X0wSL391qOObINzc7PkUc%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<h1 class="pgc-h-arrow-right" data-track="11">智能体落地框架</h1>
<p data-track="12">由大模型驱动的 Al Agent 架构是当前比较常见的 Al Agent 落地架构,包含规划(Planning)、记忆(Memory)、工具(Tools)、执行(Action)四大要素。</p>
<p class="pgc-p syl-page-br" data-track="14"> </p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/cde53ccba12145aca468fba4ee336034~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=SAhPXU3ypfMEzwWkCFZ2tadjsxI%3D" class="syl-page-img">
<p class="pgc-img-caption">大模型AI Agent= LLM *(规划+记忆+工具+执行)</p>
</div>
<ul>
<li data-track="15">工具:分成执行类工具、算法类工具和信息类工具,执行类主要是成熟应用程序,如计算器等;算法类包含规则引擎、机器学习、深度学习等算法;信息类主要是具备实效性工具;</li>
<li data-track="16">记忆:包含短期记忆和长期记忆,短期记忆反应的是 Agent 的当前情况,即在执行任务和与环境交互时产生的信息和数据,它存储了 Agent 最近的感知输入、目标以及中间内部推理的结果;长期记忆包括语义记忆、程序记忆和情景记忆。其中,语义记忆是可用自然语言描述的记忆;程序记忆是企业内部的业务流程与 SOP;情景记忆是过去业务情景的复现。</li>
<li data-track="17">规划:包含任务拆解、工作流、思维链、提示词工程等,主要是通过这些方式,充分激发大模型的能力,实现针对任务目标的问题拆解和任务规划。</li>
</ul>
<h1 class="pgc-h-arrow-right" data-track="19">智能体工作流程</h1>
<p data-track="20">AIAgent 在企业用户的运行流程分成问题澄清、分析拆解、智能决策、任务执行、观察结果、记忆存储等步骤。当前实际应用落地场景主要是问题澄清、分析拆解、智能决策、任务执行,少部分场景会涉及到观察结果和记忆存储。</p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/004e08f0f3e741c3aac347f9edeb309b~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=zTPNVq62jCGf0fcmhPIFJsgX8xc%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<ul>
<li data-track="21">问题澄清:主要是意图理解,借助大模型能力,通过反问机制等方式,对齐问题理解,准确理解用户的意图。</li>
<li data-track="22">分析拆解:主要是任务分解,将问题拆解成若干个子问题。</li>
<li data-track="23">智能决策:是确定问题的解决方案和解决问题的顺序,一方面是利用大模型本身的任务规划能力,另一方面是通过调取知识库等方式获取过往经验。</li>
<li data-track="24">任务执行:是调取各类工具组件进行执行。</li>
</ul>
<p data-track="25">观察结果和记忆存储是 AlAgent 未来能够发挥重要价值的关键。大模型泛化能力让 AIAgent 能够以极低成本持续迭代,通过持续积累案例,提升 AlAgent 的能力</p>
<h1 class="pgc-h-arrow-right">智能体现状</h1>
<p data-track="27">现阶段的智能体应用,仍未长出足够的自主思考能力以应对复杂场景。目前仍旧处于AI Agent的初期阶段,各种智能体产品距离真正的自主智能还有很远的路要走。</p>
<p class="pgc-p syl-page-br" data-track="28"> </p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/dc9857d0d8a7453b9495873e51ccaf27~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=USUUPuUCyrT4p6h8eJjQicmki8o%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<h1 class="pgc-h-arrow-right">产品发展早期阶段,四大类厂商各显神通</h1>
<p data-track="30">InfoQ研究中心在对市面上对外服务的 Al Agent 产品进行研究后,发现其背景主要分为大模型创业厂商、互联网科技厂商、RPA/流程自动化厂商和数字化企业服务商。</p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/0b0e61fec6ec4e68a8251c9fb15953ba~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=XK8MOuJaYJc72qEwDeCmQyocsRo%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<h1 class="pgc-h-arrow-right">多种Agent构建方式满足不同技术水平、不同场景的用户需求</h1>
<p data-track="32">在构建和使用方式上,AI Agent 产品均支持根据内置模版构建、复杂智能体构建和代码构建三种基础构建方式以满足不同技术水平的用户需求。此外,虽然大多数产品支持自然语言一键构建方式,但受限于现有大脑的任务拆解和规划能力,仍可以视为一种“面向未来”的构建方式。</p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/65ff1df0e1d44b6f8102154c775d3b9f~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=0AgS7wpTtYwO1GHfZa%2FgoR8%2F4h4%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<h1 class="pgc-h-arrow-right">平台类Agent:工具数量和类型不足,工具生态正在构建初期</h1>
<p data-track="34">技术框架中的工具在平台类Agent产品存在多种叫法:插件、组件等,但其本质都是将大模型「大脑」的思考转化为具体行动和执行的重要桥梁。目前支持的工具类型包含信息检索、文件读取等,数量和类型覆盖范围不够广,仍处在工具生态建设初期。</p>
<p class="pgc-p syl-page-br" data-track="35"> </p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/638dcde9e7d94d799214d56c474a7672~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=qaAgecFChK4b7esEG58vZoxt0FI%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<h1 class="pgc-h-arrow-right" data-track="37">场景示例:智谱GLM智能体应用布局</h1>
<p data-track="38">智谱智能体开发平台,借助领先的智谱大模型技术,用灵活编排 AI 工作流、自主调用企业定义的数据知识和工具,快速构建专业级智能体。同时,智谱AutoGLM正式发布Agent家族,包括AutoGLM、AutoGLM-Web、GLM-PC三个版本 ,对应手机、浏览器、电脑三种终端应用场景。</p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/baf34b9f20974a87be7ffb366b601435~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=Ap%2FzW7ffaaAaYPgqMyrpKrniqpU%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<p data-track="39">智能体开发平台示例如下:</p>
<p class="pgc-p syl-page-br" data-track="40"> </p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/094e7a40f46e4bae8ac818a5ee1aa520~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=7BiOErk6Kzpi81wYCovSF1Kox4w%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<p data-track="41">AutoGLM示例如下:</p>
<p class="pgc-p syl-page-br" data-track="52"> </p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/e94dd2b03495474cab12ad7e05b38e04~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=MZvFSkCzc0aQLBjglKiNFN7UN8k%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<p data-track="51">AutoGLM-Web示例如下:</p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/4c6755a62cae470983cc10b5b71376ba~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=6UOBulVi1Dhg9Vz6NOe6j3l0G4E%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<p class="pgc-p syl-page-br"> </p>
<p data-track="43">GLM- PC示例如下:</p>
<p class="pgc-p syl-page-br" data-track="44"> </p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/ab166af07bb84af4816d1bbab79149ab~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=WnNxAz59d6AeeuyUz6FzeFuYaDw%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<p data-track="45">实在智能体示例如下:</p>
<p class="pgc-p syl-page-br" data-track="46"> </p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/68fd0376ae0d454f83b735c4c56d8cc4~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=LqPvqXrpVpLK%2BP14yp2mBayzewk%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
<p data-track="48">泛微智能大脑智能体示例如下:</p>
<p class="pgc-p syl-page-br" data-track="49"> </p>
<div class="pgc-img"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/cdcf041a464b4ba3a009b189cd287205~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1738372330&x-signature=iY7a65ob8Dtp0Kj0kqa4moKkUYM%3D" class="syl-page-img">
<p class="pgc-img-caption"> </p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
<div class="action"> </div><br><br>
来源:https://www.cnblogs.com/IT-Evan/p/18690687
頁:
[1]