客观对比 · 基于 llmtest.cn 公开页面信息
Veridrop vs 大模型照妖镜(llmtest):中转站检测工具怎么选?
字段级 · 真伪核验
Veridrop
三协议字段级检测 + 红黑榜。每份报告逐字段可复核、thinking signature 加密验证、Claude/OpenAI/Gemini 分协议分榜。
真实率榜单
大模型照妖镜
检测 + 真实率排行榜。威尔逊置信区间算法,日/周/月/年/总榜,显示检测次数、通过率、存活天数,每小时更新。
一句话结论:想横向看「哪些中转站真实率高、存活久」,照妖镜的置信榜很直观; 想深挖某一家「哪个字段出问题、各协议分别如何」,用 Veridrop 的逐字段报告——两者可交叉验证。
30 秒结论
逐维度对比
| 维度 | 大模型照妖镜 | Veridrop |
|---|---|---|
| 核心定位 | 中转站检测 + 真实率排行榜 | 三协议字段级真伪检测 + 红黑榜 |
| 协议覆盖 | Claude / GPT / Gemini(可选) | Claude / OpenAI / Gemini(各有独立分榜) |
| 排行榜算法 | 威尔逊置信区间,真实率 % + 检测次数 + 通过率 + 存活天数,日/周/月/年/总榜,每小时更新 | 贝叶斯加权中位分 + critical 严重问题率 + 协议分榜,排除检测无效报告 |
| 检测维度 | 多轮探测:返回协议、知识表现、身份一致性、思维链痕迹、签名指纹(交叉评分) | 12 项字段级检测,含 thinking signature 加密签名验证、token 用量虚报、长上下文截断、function calling、structured output 等 |
| 原始证据 | 给出真实率分数与可信度分级 | 每份报告公开 URL + JPG,逐字段列出扣分项与原始响应证据,可复核可分享 |
| 单域名历史 | 榜单显示存活天数、检测/通过次数 | 每域名详情页:历史每次检测报告、协议覆盖、最常失败的 detector、趋势 |
| 开源 / 隐私 | 声明纯前端处理、不上传 Key、基于 GitHub 开源项目 | 完全开源(AGPL-3.0)可审计、可自托管,key 不落盘可 grep 验证 |
| 商业推荐 | 榜单按真实率排序,不收录价格 | 联盟透明 + Pro 认证收录,评分与商业严格隔离、可审计 |
以上照妖镜信息来自其官网公开页面(llmtest.cn),如有更新以其官网为准。本页由 Veridrop 编写,已尽量客观陈述双方公开事实。
大模型照妖镜做得好的地方(客观说)
📊威尔逊置信榜
用威尔逊置信区间算真实率排行,检测次数少的站不会因为偶然高分冒头,统计上更稳健。这是它榜单的亮点。
📅多时间维度
日榜 / 周榜 / 月榜 / 年榜 / 总榜都有,还显示存活天数,方便看一个站是「最近才好」还是「长期靠谱」。
⏱️每小时更新
榜单数据每小时刷新,时效性好,适合快速扫一眼当下哪些中转站真实率高。
🔓开源 + 纯前端
声明基于 GitHub 开源项目、纯前端处理、不上传 Key——这点和 Veridrop 一样重视透明与隐私。
Veridrop 的不可替代之处
🔬逐字段可复核证据
不只给一个真实率分数。每份报告公开列出:usage 有没有异源残留、长上下文有没有被截断、token 用量是否虚报、structured output 是否真生效——都能逐条核对。
🔐加密级真伪验证
Claude thinking signature 是 Anthropic 服务端加密签名(500–2000 字符),中转站理论上无法伪造,是真伪判断的强信号。
📈单域名历史详情
每个域名有独立详情页,列出历史每次检测、最常失败的 detector 和趋势,看的是「这家长期怎么样」,不只是榜单上一个名次。
常见问题
大模型照妖镜(llmtest.cn)是做什么的?
llmtest.cn 是中转站检测工具 + 真实率排行榜,用威尔逊置信区间算真实率,支持日/周/月/年/总榜,显示检测次数、通过率、存活天数,每小时更新。声明纯前端处理、不上传 Key、基于 GitHub 开源项目。可选 Claude / GPT / Gemini。
Veridrop 和照妖镜的核心区别?
照妖镜强在真实率榜单(威尔逊置信 + 多时间维度 + 存活天数),适合横向看哪些站长期靠谱;Veridrop 强在单家深挖——逐字段可复核报告、thinking signature 加密验证、协议分榜、单域名历史详情。两者都开源。
该用哪个?
看真实率榜单、找长期靠谱候选 → 照妖镜。深挖某一家哪个字段出问题、各协议分别如何 → Veridrop。两者可交叉验证:榜单初筛,报告核验。
为什么字段级可复核报告重要?
「真实率 85%」只告诉你结论、不告诉你为什么。Veridrop 公开每项扣分字段可逐条复核(usage 残留、签名缺失、长上下文截断等),让你知道「问题在哪、严不严重」,还能分享报告 URL。
下一步:跑一次真伪核验
从照妖镜榜单看中了某家?到 Veridrop 跑一次字段级检测,确认细节是不是真透传。