跳到主要内容
MCP 客户端由宿主应用程序实例化,用于与特定的 MCP 服务器通信。宿主应用程序(如 Claude.ai 或 IDE)管理整体用户体验并协调多个客户端。每个客户端负责与一台服务器进行一次直接通信。 理解这一点非常重要:宿主是用户交互的应用程序,而客户端是实现服务器连接的协议级组件。

客户端核心功能

除了使用服务器提供的上下文外,客户端还可以向服务器提供多项功能。这些客户端功能允许服务器作者构建更丰富的交互。
功能说明示例
引出信息征询 (Elicitation) 使服务器能够在交互过程中向用户请求特定信息,为服务器按需收集信息提供了一种结构化的方式。预订旅行的服务器可能会询问用户的飞机座位偏好、房型或联系电话,以完成预订。
根目录 (Roots) 允许客户端指定服务器应关注哪些目录,通过协调机制传达预期的范围。预订旅行的服务器可能会被授予访问特定目录的权限,并从中读取用户的日历。
采样采样 (Sampling) 允许服务器通过客户端请求 LLM 补全,从而实现 Agent 工作流。这种方法使客户端能够完全控制用户权限和安全措施。预订旅行的服务器可能会向 LLM 发送航班列表,并请求 LLM 为用户选择最佳航班。

引出

信息征询使服务器能够在交互过程中向用户请求特定信息,从而创建更动态和响应迅速的工作流。

概述

信息征询为服务器提供了一种按需收集必要信息的结构化方式。服务器无需预先要求所有信息,也不会在缺少数据时直接失败,而是可以暂停操作以向用户请求特定输入。这创造了更灵活的交互,使服务器能够适应用户需求,而不是遵循僵化的模式。 信息征询流程: 该流程实现了动态信息收集。服务器可以在需要时请求特定数据,用户通过适当的 UI 提供信息,服务器则利用新获取的上下文继续处理。 信息征询组件示例:
{
  method: "elicitation/requestInput",
  params: {
    message: "Please confirm your Barcelona vacation booking details:",
    schema: {
      type: "object",
      properties: {
        confirmBooking: {
          type: "boolean",
          description: "Confirm the booking (Flights + Hotel = $3,000)"
        },
        seatPreference: {
          type: "string",
          enum: ["window", "aisle", "no preference"],
          description: "Preferred seat type for flights"
        },
        roomType: {
          type: "string",
          enum: ["sea view", "city view", "garden view"],
          description: "Preferred room type at hotel"
        },
        travelInsurance: {
          type: "boolean",
          default: false,
          description: "Add travel insurance ($150)"
        }
      },
      required: ["confirmBooking"]
    }
  }
}

示例:度假预订审批

旅行预订服务器通过最终预订确认过程展示了信息征询的强大功能。当用户选择了理想的巴塞罗那度假套餐时,服务器在继续操作前需要收集最终确认和任何缺失的细节。 服务器通过结构化请求发起预订确认征询,其中包括行程摘要(6月15-22日飞往巴塞罗那的航班、海滨酒店、总价 3,000 美元)以及任何额外偏好的字段——如座位选择、房型或旅行保险选项。 随着预订的进行,服务器会征询完成预订所需的联系信息。它可能会询问航班预订的旅客详情、酒店的特殊要求或紧急联系信息。

用户交互模型

信息征询交互旨在清晰、具有上下文,并尊重用户自主权: 请求呈现:客户端在显示征询请求时,会提供明确的背景信息,说明哪个服务器在请求、为什么需要该信息以及将如何使用该信息。请求消息解释了目的,而 Schema(模式)提供了结构和验证。 响应选项:用户可以通过适当的 UI 控件(文本框、下拉菜单、复选框)提供请求的信息,也可以拒绝提供信息(可附带解释),或取消整个操作。客户端在将响应返回给服务器之前,会根据提供的 Schema 对其进行验证。 隐私考虑:信息征询绝不会请求密码或 API 密钥。客户端会针对可疑请求发出警告,并允许用户在发送前检查数据。

根目录定义了服务器操作的文件系统边界,允许客户端指定服务器应关注的目录。

概述

根目录是客户端向服务器传达文件系统访问边界的一种机制。它们由指示服务器可以操作的目录的文件 URI 组成,帮助服务器了解可用文件和文件夹的范围。虽然根目录传达了预期的边界,但它们并不强制执行安全限制。实际的安全性必须在操作系统级别通过文件权限和/或沙箱来强制执行。 根目录结构:
{
  "uri": "file:///Users/agent/travel-planning",
  "name": "Travel Planning Workspace"
}
根目录仅限文件系统路径,并且始终使用 file:// URI 方案。它们帮助服务器了解项目边界、工作区组织和可访问目录。当用户处理不同的项目或文件夹时,根目录列表可以动态更新,服务器会通过 roots/list_changed 接收边界更改通知。

示例:旅行规划工作区

处理多个客户行程的旅行代理可以受益于通过根目录来组织文件系统访问。假设一个工作区中有针对旅行规划不同方面的不同目录。 客户端向旅行规划服务器提供文件系统根目录:
  • file:///Users/agent/travel-planning - 包含所有旅行文件的主工作区
  • file:///Users/agent/travel-templates - 可重复使用的行程模板和资源
  • file:///Users/agent/client-documents - 客户护照和旅行证件
当代理创建巴塞罗那行程时,表现良好的服务器会尊重这些边界——访问模板、保存新行程并在指定的根目录内引用客户文档。服务器通常通过使用根目录的相对路径或利用尊重根目录边界的文件搜索工具来访问根目录内的文件。 如果代理打开了一个存档文件夹,如 file:///Users/agent/archive/2023-trips,客户端会通过 roots/list_changed 更新根目录列表。 有关尊重根目录的服务器完整实现,请参阅官方服务器仓库中的 文件系统服务器

设计理念

根目录充当客户端和服务器之间的协调机制,而不是安全边界。规范要求服务器“应当 (SHOULD) 尊重根目录边界”,而不是“必须 (MUST) 强制执行”它们,因为服务器运行的代码是客户端无法控制的。 当服务器值得信赖或经过审查、用户了解其建议性质,且目标是防止意外而非阻止恶意行为时,根目录的效果最好。它们在上下文范围界定(告诉服务器关注哪里)、意外预防(帮助表现良好的服务器不越界)和工作流组织(如自动管理项目边界)方面表现出色。

用户交互模型

根目录通常由宿主应用程序根据用户操作自动管理,不过某些应用程序可能会开放手动根目录管理: 自动根目录检测:当用户打开文件夹时,客户端会自动将其公开为根目录。打开旅行工作区允许客户端将该目录公开为根目录,帮助服务器了解哪些行程和文档属于当前工作的范围。 手动根目录配置:高级用户可以通过配置指定根目录。例如,添加 /travel-templates 用于可重复使用的资源,同时排除包含财务记录的目录。

采样

采样允许服务器通过客户端请求语言模型补全,在保持安全和用户控制的同时实现 Agent 行为。

概述

采样使服务器能够在不直接集成 AI 模型或为其付费的情况下执行依赖 AI 的任务。相反,服务器可以请求已经拥有 AI 模型访问权限的客户端代其处理这些任务。这种方法使客户端能够完全控制用户权限和安全措施。由于采样请求发生在其他操作(如工具分析数据)的上下文中,并作为单独的模型调用进行处理,因此它们在不同上下文之间保持了清晰的边界,从而能够更有效地利用上下文窗口。 采样流程: 该流程通过多个“人工干预”检查点确保安全。用户可以查看并在生成响应返回给服务器之前对其及初始请求进行修改。 请求参数示例:
{
  messages: [
    {
      role: "user",
      content: "Analyze these flight options and recommend the best choice:\n" +
               "[47 flights with prices, times, airlines, and layovers]\n" +
               "User preferences: morning departure, max 1 layover"
    }
  ],
  modelPreferences: {
    hints: [{
      name: "claude-sonnet-4-20250514"  // Suggested model
    }],
    costPriority: 0.3,      // Less concerned about API cost
    speedPriority: 0.2,     // Can wait for thorough analysis
    intelligencePriority: 0.9  // Need complex trade-off evaluation
  },
  systemPrompt: "You are a travel expert helping users find the best flights based on their preferences",
  maxTokens: 1500
}

示例:航班分析工具

考虑一个旅行预订服务器,它有一个名为 findBestFlight 的工具,该工具使用采样来分析可用航班并推荐最佳选择。当用户询问“帮我订下个月去巴塞罗那最好的航班”时,该工具需要 AI 协助来评估复杂的权衡。 该工具查询航空公司 API 并收集了 47 个航班选项。然后它请求 AI 协助分析这些选项:“分析这些航班选项并推荐最佳选择:[包含价格、时间、航空公司和经停地的 47 个航班] 用户偏好:上午出发,最多 1 次经停。” 客户端发起采样请求,允许 AI 评估权衡——例如较便宜的红眼航班与更方便的上午出发航班之间的权衡。该工具利用分析结果呈现前三个推荐方案。

用户交互模型

虽然不是强制要求,但采样旨在允许人工干预控制。用户可以通过以下几种机制保持监督: 审批控制:采样请求可能需要明确的用户同意。客户端可以显示服务器想要分析的内容及其原因。用户可以批准、拒绝或修改请求。 透明度功能:客户端可以显示确切的提示词、模型选择和 Token 限制,允许用户在 AI 响应返回给服务器之前进行审查。 配置选项:用户可以设置模型偏好,为受信任的操作配置自动审批,或要求对所有内容进行审批。客户端可能提供脱敏敏感信息的选项。 安全考虑:客户端和服务器在采样期间都必须妥善处理敏感数据。客户端应实施速率限制并验证所有消息内容。人工干预设计确保服务器发起的 AI 交互在未经用户明确同意的情况下,无法危害安全或访问敏感数据。