模型上下文协议 (MCP) 遵循客户端-主机-服务器架构,其中每个主机可以运行多个客户端实例。这种架构使用户能够在应用程序之间集成 AI 功能,同时保持清晰的安全边界和关注点分离。MCP 基于 JSON-RPC 构建,提供了一个有状态的会话协议,专注于客户端和服务器之间的上下文交换和采样协调。
核心组件
主机进程充当容器和协调器
- 创建并管理多个客户端实例
- 控制客户端连接权限和生命周期
- 执行安全策略和同意要求
- 处理用户授权决策
- 协调 AI/LLM 集成和采样
- 管理跨客户端的上下文聚合
客户端
每个客户端由主机创建,并维护一个隔离的服务器连接
- 每个服务器建立一个有状态的会话
- 处理协议协商和能力交换
- 双向路由协议消息
- 管理订阅和通知
- 维护服务器之间的安全边界
一个主机应用程序创建和管理多个客户端,每个客户端与特定服务器之间存在 1:1 的关系。
服务器
服务器提供专门的上下文和能力
- 通过 MCP 原语公开资源、工具和提示
- 独立运行,职责明确
- 通过客户端接口请求采样
- 必须遵守安全约束
- 可以是本地进程或远程服务
设计原则
MCP 基于几个关键的设计原则构建,这些原则为其架构和实现提供了指导
-
服务器应该非常容易构建
- 主机应用程序处理复杂的编排职责
- 服务器专注于特定的、定义明确的能力
- 简单的接口最大限度地减少了实现开销
- 清晰的分离使代码易于维护
-
服务器应具有高度的可组合性
- 每个服务器独立提供专注的功能
- 多个服务器可以无缝组合
- 共享协议实现互操作性
- 模块化设计支持可扩展性
-
服务器不应能够读取整个对话,也不能“窥探”其他服务器
- 服务器仅接收必要的上下文信息
- 完整的对话历史记录保留在主机端
- 每个服务器连接都保持隔离
- 跨服务器交互由主机控制
- 主机进程强制执行安全边界
-
功能可以逐步添加到服务器和客户端
- 核心协议提供最基本所需的功能
- 可以根据需要协商附加能力
- 服务器和客户端独立演进
- 协议设计考虑了未来的可扩展性
- 保持向后兼容性
能力协商
模型上下文协议使用基于能力的协商系统,其中客户端和服务器在初始化期间明确声明其支持的功能。能力决定了在会话期间哪些协议特性和原语可用。
- 服务器声明诸如资源订阅、工具支持和提示模板等能力
- 客户端声明诸如采样支持和通知处理等能力
- 双方必须在整个会话中遵守声明的能力
- 可以通过协议扩展来协商附加能力
每种能力都解锁了特定的协议功能以在会话期间使用。例如:
- 已实现的服务器功能必须在服务器的能力中声明
- 发出资源订阅通知要求服务器声明支持订阅
- 工具调用要求服务器声明工具能力
- 采样要求客户端在其能力中声明支持
这种能力协商确保客户端和服务器对支持的功能有清晰的了解,同时保持协议的可扩展性。