跳到主要内容

基于给定提示词从大语言模型生成响应。

授权

发起 REST API 请求时,必须在请求头中包含 AccessToken 以及 Content-Type 头。您可以使用以下格式进行授权:

--header 'Authorization: Bearer <your_token_here>'
--header 'Content-Type: application/json'

注意:请将 your_token_here 替换为您的实际 AccessToken。它包含允许服务器验证您的身份和权限的信息。 您可以在此处创建 API 密钥。

请求体

字段类型必填描述
modelstring用于生成响应的模型名称
promptstring, string[]用于生成响应的提示词,可以是单个字符串或字符串数组
streamboolean, null是否在生成时以流式方式返回响应(默认:false)
max_tokensinteger, null响应中生成的最大 Token 数
temperaturenumber, null生成响应时使用的采样温度
top_kinteger, null生成响应时保留的最高概率 Token 数量,用于 top-k 采样,有助于控制输出的随机性。
top_pnumber, null生成响应时使用的核采样概率,有助于在生成的响应中平衡随机性和连贯性。
stopstring, string[]一个或多个序列,API 遇到这些序列时将停止生成更多 Token。返回的文本不包含停止序列。
presence_penaltynumber, null根据 Token 是否出现在对话历史中施加的惩罚,有助于减少重复。
frequency_penaltynumber, null根据 Token 在对话历史中的频率施加的惩罚,有助于减少常见 Token。
response_formatobject要生成的响应格式。
ninteger为每个输入消息生成的响应选择数量。
seedinteger, null用于生成响应的随机种子,确保可重复性。

响应格式配置

字段类型必填描述
typestring响应格式类型,json_objectjson_schemagrammartext
schemastring, objectschema 字段定义了模型输出的预期结构。它引导模型生成遵循指定 JSON 格式的响应。
grammarstring, nullgrammar 字段定义了一组约束模型输出格式的规则。它确保生成的文本遵循指定的语法或结构化模式。
json_schemastring, objectjson_schema 字段定义了模型输出必须遵循的严格 JSON Schema。它确保生成的响应匹配指定的结构和数据类型。

请求示例

{
"model": "minimax/minimax-m2.5",
"prompt": "Hello, how are you?"
"stream": false,
"max_tokens": 100,
"temperature": 0.7,
"top_k": 50,
"top_p": 0.9,
"n": 1,
"stop": null,
"frequency_penalty": 0,
"presence_penalty": 0,
"response_format": {
"type": "json_schema",
"json_schema": {
"name": "response_schema",
"schema": {
"type": "object",
"properties": {
"response": {
"type": "string",
"description": "The assistant response to the user message."
}
},
"required": ["response"],
"additionalProperties": false
}
}
},
"seed": 42
}

响应

成功响应

字段类型描述
idstring聊天补全响应的唯一标识符
createdinteger聊天补全创建时的时间戳(自 Unix 纪元以来的秒数)
modelstring用于生成响应的模型名称
choicesarray模型生成的响应选择数组。每个选择包括生成的消息、完成原因和选择的索引。
objectstring返回的对象类型,此端点为 "completion"
usageobject包含请求和响应 Token 使用信息的对象,包括提示词中的 Token 数、补全中的 Token 数和使用的总 Token 数。
metadataobject包含有关响应的附加元数据的对象,例如模型使用的权重版本。