协议修订: 2025-06-18
模型上下文协议(MCP)为服务器向客户端暴露提示模板提供了一种标准化的方式。提示允许服务器提供结构化消息和指令,用于与语言模型进行交互。客户端可以发现可用的提示,检索其内容,并提供参数来自定义它们。

用户交互模型

提示被设计为由用户控制,这意味着它们从服务器暴露给客户端,意图是让用户能够明确选择它们来使用。 通常,提示会通过用户在用户界面中发起的命令来触发,这使得用户可以自然地发现和调用可用的提示。 例如,作为斜杠命令: 作为斜杠命令暴露的提示示例 然而,实现者可以自由地通过任何适合其需求的界面模式来暴露提示——协议本身并不强制要求任何特定的用户交互模型。

功能

支持提示的服务器在初始化期间必须声明 prompts 功能。
{
  "capabilities": {
    "prompts": {
      "listChanged": true
    }
  }
}
listChanged 指示当可用提示列表发生变化时,服务器是否会发出通知。

协议消息

列出提示

要检索可用的提示,客户端发送一个 prompts/list 请求。此操作支持分页 请求:
{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "prompts/list",
  "params": {
    "cursor": "optional-cursor-value"
  }
}
响应
{
  "jsonrpc": "2.0",
  "id": 1,
  "result": {
    "prompts": [
      {
        "name": "code_review",
        "title": "Request Code Review",
        "description": "Asks the LLM to analyze code quality and suggest improvements",
        "arguments": [
          {
            "name": "code",
            "description": "The code to review",
            "required": true
          }
        ]
      }
    ],
    "nextCursor": "next-page-cursor"
  }
}

获取提示

要检索特定的提示,客户端发送一个 prompts/get 请求。参数可以通过自动补全 API 进行自动补全。 请求:
{
  "jsonrpc": "2.0",
  "id": 2,
  "method": "prompts/get",
  "params": {
    "name": "code_review",
    "arguments": {
      "code": "def hello():\n    print('world')"
    }
  }
}
响应
{
  "jsonrpc": "2.0",
  "id": 2,
  "result": {
    "description": "Code review prompt",
    "messages": [
      {
        "role": "user",
        "content": {
          "type": "text",
          "text": "Please review this Python code:\ndef hello():\n    print('world')"
        }
      }
    ]
  }
}

列表变更通知

当可用提示列表发生变化时,声明了 listChanged 功能的服务器应该发送通知。
{
  "jsonrpc": "2.0",
  "method": "notifications/prompts/list_changed"
}

消息流

数据类型

提示

提示定义包括:
  • name:提示的唯一标识符
  • title:可选的、供显示用的人类可读的提示名称。
  • description:可选的人类可读的描述
  • arguments:可选的用于自定义的参数列表

提示消息

提示中的消息可以包含:
  • role:”user” 或 “assistant”,用于指明说话者
  • content:以下内容类型之一
提示消息中的所有内容类型都支持可选的注解,用于提供关于受众、优先级和修改时间的元数据。

文本内容

文本内容表示纯文本消息
{
  "type": "text",
  "text": "The text content of the message"
}
这是用于自然语言交互的最常见的内容类型。

图像内容

图像内容允许在消息中包含视觉信息
{
  "type": "image",
  "data": "base64-encoded-image-data",
  "mimeType": "image/png"
}
图像数据必须是 base64 编码的,并包含有效的 MIME 类型。这使得在视觉上下文很重要的多模态交互成为可能。

音频内容

音频内容允许在消息中包含音频信息
{
  "type": "audio",
  "data": "base64-encoded-audio-data",
  "mimeType": "audio/wav"
}
音频数据必须是 base64 编码的,并包含有效的 MIME 类型。这使得在音频上下文很重要的多模态交互成为可能。

嵌入式资源

嵌入式资源允许在消息中直接引用服务器端的资源
{
  "type": "resource",
  "resource": {
    "uri": "resource://example",
    "name": "example",
    "title": "My Example Resource",
    "mimeType": "text/plain",
    "text": "Resource content"
  }
}
资源可以包含文本或二进制(blob)数据,并且必须包含:
  • 一个有效的资源 URI
  • 相应的 MIME 类型
  • 文本内容或 base64 编码的 blob 数据
嵌入式资源使提示能够将服务器管理的内容(如文档、代码示例或其他参考资料)无缝地直接整合到对话流中。

错误处理

服务器应该为常见的失败情况返回标准的 JSON-RPC 错误
  • 无效的提示名称:-32602(无效参数)
  • 缺少必需的参数:-32602(无效参数)
  • 内部错误:-32603(内部错误)

实现注意事项

  1. 服务器应该在处理前验证提示参数
  2. 客户端应该处理大型提示列表的分页
  3. 双方都应该尊重功能协商

安全性

实现必须仔细验证所有提示的输入和输出,以防止注入攻击或未经授权的资源访问。