何为美 發表於 2025-9-14 17:10:00

[MCP][01]简介与概念

<h2 id="简介">简介</h2>
<p>MCP(全称为Model Context Protocol,模型上下文协议)是一种面向大模型交互过程的通用上下文协议标准。其核心目标在于为模型构建一个结构化、可控、可扩展的语义执行环境,使语言模型能够在统一的上下文管理体系下进行任务调度、工具调用、资源协作与状态保持,从而突破传统Prompt Engineering在多轮交互、指令组合与行为稳定性方面的瓶颈。</p>
<p>在传统的大模型应用中,模型本身只能被动地接收输入、产生输出,要让它调用外部工具或访问自定义的上下文,就需要在代码里逐条写好 API 调用、认证、错误处理的逻辑,既繁琐又难以维护。MCP的初衷,就是将这些"上下文管理"和"工具调用"能力抽象成一个标准化的通信协议,让大模型应用只需关注"我想用什么资源",由专门的 MCP 服务端来真正执行调用、管理状态、返回结果。</p>
<p>MCP 官方GitHub</p>
<p>有一种说法是,传统的大模型应用叫做Prompt Engineering,而MCP出现后,大模型应用开发应该叫做Context Engineering。传统的提示工程常常依赖于简单的字符串拼接,这种方式有几个问题:</p>
<ul>
<li><strong>歧义性</strong>:模型可能难以区分哪些是指令,哪些是用户输入,哪些是检索到的数据。</li>
<li><strong>提示注入风险</strong>:如果提示中包含恶意指令,例如<code>ignore all previous instructions</code>,模型可能被欺骗。</li>
<li><strong>脆弱性</strong>:格式的微小变化(比如多一个换行符)都可能导致模型性能下降。</li>
<li><strong>难以维护</strong>:当上下文变得更复杂时(例如,多个数据源、工具定义、历史消息),这种拼接方式会变得一团糟(亲身体验,塞了一堆历史消息后,模型的回答越拐越远)</li>
</ul>
<h2 id="核心概念">核心概念</h2>
<p><img src="https://img2024.cnblogs.com/blog/1237275/202509/1237275-20250914170830462-716310820.webp" alt="MCP-skill-map" loading="lazy"></p>
<h3 id="tools工具">Tools(工具)</h3>
<p>工具是AI模型可以调用以执行特定操作的函数。它们允许模型与外部系统交互,执行有副作用的操作,如:</p>
<ul>
<li>调用API获取实时数据</li>
<li>查询或修改数据库</li>
<li>执行代码或脚本</li>
<li>发送邮件或消息</li>
<li>文件操作</li>
</ul>
<p>工具由模型控制,这意味着AI决定是否以及何时使用它们。工具调用可能会产生副作用,其结果可以反馈到对话中。</p>
<div class="mermaid">sequenceDiagram
        participant l as LLM
        participant c as Client
        participant s as Server

        Note over c,s: Discovery
        c -&gt;&gt; s: tools/list
        s --&gt;&gt; c: List of tools

        Note over l,c: Tool Selection
        l -&gt;&gt; c: Select tool to use

        Note over c,s: Invocation
        c -&gt;&gt; s: tools/call
        s --&gt;&gt; c: Tool result
        c -&gt;&gt; l: Process result

        Note over c,s: Updates
        s --&gt;&gt; c: tools/list_changed
        c -&gt;&gt; s: tools/list
        s --&gt;&gt; c: Updated tools
</div><h3 id="resources资源">Resources(资源)</h3>
<p>资源是提供给模型的只读上下文单元(数据源)。它们可以是:</p>
<ul>
<li>文件内容</li>
<li>数据库记录</li>
<li>API响应</li>
<li>知识库内容</li>
</ul>
<p>资源由应用程序控制,托管方或开发人员决定公开哪些数据以及如何公开。读取资源没有副作用,类似于仅获取数据的GET请求。资源提供可在需要时注入模型上下文的内容(例如,在问答场景中检索到的文档)。</p>
<h3 id="prompts提示模板">Prompts(提示模板)</h3>
<p>提示模板是可重复使用的提示模板或指令,可以根据需要调用。它们由用户控制或由开发人员预定义。提示可能包含常见任务或指导性工作流程的模板(例如,代码审查模板或问答格式)。</p>
<p>提示模板的关键特性包括:</p>
<ul>
<li><strong>参数化</strong>:支持动态参数输入</li>
<li><strong>资源整合</strong>:可嵌入资源上下文供模型参考</li>
<li><strong>多轮交互</strong>:支持构建多轮对话流程</li>
<li><strong>统一发现</strong>:通过标准接口注册和调用</li>
</ul>
<h3 id="sampling采样">Sampling(采样)</h3>
<p>采样是工具与LLM交互以生成文本的机制。通过采样,工具可以请求LLM生成文本内容,例如生成诗歌、文章或其他文本内容。采样允许工具利用LLM的能力来创建内容,而不仅限于执行预定义的操作。</p>
<h3 id="elicitation征询">Elicitation(征询)</h3>
<p>征询是一种允许工具向用户请求额外信息或确认的机制。当工具执行过程中需要更多信息才能继续执行时,可以使用征询功能与用户交互。这在处理需要用户确认或提供额外参数的操作时特别有用。</p>
<p>例如,在预订系统中,如果用户请求的日期已满,工具可以征询用户是否愿意选择其他日期。征询机制确保了工具可以在必要时暂停执行,等待用户输入,从而提供更好的用户体验。</p>
<p>征询的关键特性包括:</p>
<ul>
<li><strong>交互性</strong>:允许工具与用户进行双向沟通</li>
<li><strong>验证</strong>:可以对用户输入进行验证,确保数据的正确性</li>
<li><strong>可选性</strong>:用户可以选择接受、拒绝或取消征询请求</li>
<li><strong>结构化</strong>:支持结构化数据输入,便于处理复杂信息</li>
</ul>
<h3 id="roots根">Roots(根)</h3>
<p>Root表示一次语义执行的起点,携带资源引用、执行目标、响应格式等信息,支持多并发执行流。它作为语义执行的基础输入结构,可以包含多个Prompt和工具,为模型提供完整的上下文环境。</p>
<h3 id="logging日志记录">Logging(日志记录)</h3>
<p>日志记录是MCP中的一个重要功能,允许服务器和工具向客户端发送日志信息。通过日志记录,开发者可以跟踪工具执行过程、调试问题以及监控系统状态。MCP支持多种日志级别,包括调试(debug)、信息(info)、警告(warning)和错误(error)等。</p>
<h3 id="notifications通知">Notifications(通知)</h3>
<p>通知机制允许服务器向客户端发送实时更新信息,例如资源变更、工具列表更新等。通过通知,客户端可以及时了解服务器状态的变化,并相应地更新用户界面或执行其他操作。常见的通知类型包括资源更新通知、工具列表变更通知、提示列表变更通知等。</p>
<h2 id="组件">组件</h2>
<h3 id="mcp-server">MCP Server</h3>
<p>Server 是一个独立的程序或服务,它通过 MCP 协议向 MCP 客户端暴露特定的功能、工具或数据资源。</p>
<p>角色职责:</p>
<ul>
<li><strong>提供工具/资源</strong>:MCP Server 是外部能力(如数据库、API、文件系统、计算服务等)的封装器或适配器。它将这些外部能力以标准化、可供大模型调用的形式暴露出来。</li>
<li><strong>执行操作</strong>:当接收到 MCP Client 的请求时,MCP Server 负责执行底层操作(例如,查询数据库、调用第三方 API、执行代码等)。</li>
<li><strong>返回结果</strong>:将执行结果返回给请求它的 MCP Client。</li>
<li><strong>独立部署</strong>:MCP Server 可以运行在本地机器上,也可以部署在远程服务器上。</li>
</ul>
<h3 id="mcp-host">MCP Host</h3>
<p>Host 是用户直接交互的应用程序或环境。它通常是AI应用程序的入口点,比如:</p>
<ul>
<li>一个聊天机器人界面</li>
<li>一个IDE</li>
<li>一个自定义的AI代理应用程序</li>
</ul>
<p>角色职责:</p>
<ul>
<li><strong>用户交互</strong>:接收用户的请求和输入,并向用户显示大模型生成的响应。</li>
<li><strong>协调与编排</strong>:负责整个工作流的协调和编排。它决定何时调用大模型,何时需要外部工具或数据,以及如何将它们的结果整合起来。</li>
<li><strong>管理客户端</strong>:Host 创建并管理<strong>一个或多个 MCP 客户端实例</strong>。</li>
<li><strong>维护核心上下文</strong>:通常由 Host 来维护整个对话历史和应用程序的全局上下文,而不是将所有信息都暴露给单个服务器。</li>
<li><strong>安全边界</strong>:强制执行客户端和服务器之间的安全边界和权限控制。</li>
</ul>
<h3 id="mcp-client">MCP Client</h3>
<p>Client 是内置在 Host 应用程序中的一个组件,它作为 Host 和 MCP Server 之间的桥梁。一个Host内可以有多个Client。</p>
<p>角色职责:</p>
<ul>
<li><strong>协议转换</strong>:将 Host 的请求转换成MCP协议定义的标准格式,以便MCP Server能够理解。同时,它也将MCP Server的响应转换成Host可用的格式。</li>
<li><strong>会话管理</strong>:与一个特定的MCP Server建立并维护一对一的连接和会话生命周期。</li>
<li><strong>能力协商</strong>:在建立连接时,与MCP Server协商双方支持的能力和协议版本。</li>
<li><strong>消息路由</strong>:负责在Host和其Server之间双向路由消息。</li>
<li><strong>安全与认证</strong>:可以处理与MCP Server之间的认证和授权,确保只有授权的请求才能到达服务器。</li>
</ul>
<h2 id="references">References</h2>
<ul>
<li>https://zhuanlan.zhihu.com/p/29001189476</li>
</ul>


</div>
<div id="MySignature" role="contentinfo">
    <p>本文来自博客园,作者:花酒锄作田,转载请注明原文链接:https://www.cnblogs.com/XY-Heruo/p/19091500</p><br><br>
来源:https://www.cnblogs.com/XY-Heruo/p/19091500
頁: [1]
查看完整版本: [MCP][01]简介与概念