检测结果

模型:gpt-5-mini · 模式 standard · 中转站 https://345b1432.r17.cpolar.top/v1

行为/协议级验证: 本检测无法可靠区分高配模型真品与低配模型伪装。我们检测的是中转站接口是否符合 OpenAI Chat Completions 协议规范、能力是否完整、usage 字段是否符合官方响应形状。
10%
未达标

由 https://veridrop.org 生成

  • 基础请求 未通过
  • 模型一致性 未通过
  • 函数调用 异常
  • 结构化输出 未通过
  • 协议规范性 未通过
  • 流式一致性 未通过
  • Token 计费 未通过
  • 长上下文真实性 未启用

这份结果怎么理解?

结构化输出没有真正生效

返回的不是 JSON 也没有代码块包装。请求已发送 response_format=json_schema strict=true,但中转站很可能根本没把这个参数透传给后端。

响应里有适配层痕迹

返回的 usage 同时含有 OpenAI 的 prompt_tokens/completion_tokens 和 Anthropic/Responses 风格的 input_tokens/output_tokens。通常说明中间有转换层,但还不足以确认换了后端。

Token 计费存在风险

Token 数明显异常: usage 字段、token 增量或流式/非流式统计存在明显问题,有虚报或统计错误风险。

首 TOKEN
总耗时
15,809ms
吞吐 (T/S)
输入 TOKENS
0
输出 TOKENS
0
OpenAI 检测项各自检查什么?
基础请求 (Basic Request)
发送最小 Chat Completions 请求,确认接口可用且能提取 assistant 文本。
模型一致性 (Model Consistency)
验证 response.model 与请求模型匹配,并检查低温多次调用的输出 token 稳定性。
函数调用 (Function Calling)
强制 tool_choice,验证 call_ ID、type=function、函数名和 arguments JSON。
结构化输出 (Structured Output)
使用 response_format=json_schema,检查返回内容能否按 schema 解析。
协议规范性 (Protocol)
被动检查 chatcmpl- ID、chat.completion、choices、finish_reason、usage 等官方字段。
流式一致性 (Integrity)
比较同一 prompt 的 stream 与 non-stream 文本、finish_reason 和 usage 是否一致。
Token 计费
检查中转站返回的输入/输出 Token 数是否自洽,并和同一次检测里的流式/非流式结果、本地可预期的变化进行对比。
长上下文真实性 (Long Context)
需在提交时勾选启用 — 用 needle-in-haystack 在 32k → 100k → 200k tokens 三档探针,验证中转站是否真兑现宣传的 context window(识别截断 / 路由到小窗口模型)。极限档可按模型完整上限自适应探到 950k+。