检测结果
模型:gpt-4o · 模式 full ·
中转站 https://api.sunyears.com/v1
85%
协议表现良好
由 https://veridrop.org 生成
- 基础请求 通过
- 模型一致性 通过
- 函数调用 通过
- 结构化输出 未通过
- 协议规范性 通过
- 流式一致性 通过
- Token 计费 无法判断
- 长上下文真实性 未启用
这份结果怎么理解?
结构化输出没有真正生效
返回的不是 JSON 也没有代码块包装。请求已发送 response_format=json_schema strict=true,但中转站很可能根本没把这个参数透传给后端。 实际返回片段: Certainly! Here is a JSON object that matches the specified schema: ```json { "ok": true, "nonce": "openai-detector" } ```
首 TOKEN
631ms
总耗时
4,958ms
吞吐 (T/S)
42.4
输入 TOKENS
192
输出 TOKENS
210
OpenAI 检测项各自检查什么?
- 基础请求 (Basic Request)
- 发送最小 Chat Completions 请求,确认接口可用且能提取 assistant 文本。
- 模型一致性 (Model Consistency)
- 验证
response.model与请求模型匹配,并检查低温多次调用的输出 token 稳定性。 - 函数调用 (Function Calling)
- 强制 tool_choice,验证
call_ID、type=function、函数名和 arguments JSON。 - 结构化输出 (Structured Output)
- 使用
response_format=json_schema,检查返回内容能否按 schema 解析。 - 协议规范性 (Protocol)
- 被动检查
chatcmpl-ID、chat.completion、choices、finish_reason、usage 等官方字段。 - 流式一致性 (Integrity)
- 比较同一 prompt 的 stream 与 non-stream 文本、finish_reason 和 usage 是否一致。
- Token 计费
- 检查中转站返回的输入/输出 Token 数是否自洽,并和同一次检测里的流式/非流式结果、本地可预期的变化进行对比。
- 长上下文真实性 (Long Context)
- 需在提交时勾选启用 — 用 needle-in-haystack 在 32k → 100k → 200k tokens 三档探针,验证中转站是否真兑现宣传的 context window(识别截断 / 路由到小窗口模型)。极限档可按模型完整上限自适应探到 950k+。