客观对比 · 基于 llmtest.cn 公开页面信息

Veridrop vs 大模型照妖镜(llmtest):中转站检测工具怎么选?

字段级 · 真伪核验

Veridrop

三协议字段级检测 + 红黑榜。每份报告逐字段可复核、thinking signature 加密验证、Claude/OpenAI/Gemini 分协议分榜。

真实率榜单

大模型照妖镜

检测 + 真实率排行榜。威尔逊置信区间算法,日/周/月/年/总榜,显示检测次数、通过率、存活天数,每小时更新。

一句话结论:想横向看「哪些中转站真实率高、存活久」,照妖镜的置信榜很直观; 想深挖某一家「哪个字段出问题、各协议分别如何」,用 Veridrop 的逐字段报告——两者可交叉验证。

对比对象:llmtest.cn(大模型照妖镜) 信息来源:llmtest 官网公开页面 更新:2026-05-31

30 秒结论

选照妖镜,如果你要…

横向浏览真实率排行榜:用威尔逊置信区间排出得分最高的站,看检测次数、通过率、存活天数,还能切日/周/月/年/总榜,适合发现长期靠谱的候选站。

选 Veridrop,如果你要…

深挖某一家:拿到逐字段可复核的报告(thinking signature、usage 残留、长上下文截断等),按 Claude / OpenAI / Gemini 分协议看分榜,查每个域名的历史详情

最佳做法:交叉验证

先用 照妖镜榜单圈出真实率高的候选,再用 Veridrop 跑一次字段级检测、查 红黑榜详情,确认细节后再充值。

逐维度对比

维度大模型照妖镜Veridrop
核心定位 中转站检测 + 真实率排行榜 三协议字段级真伪检测 + 红黑榜
协议覆盖 Claude / GPT / Gemini(可选) Claude / OpenAI / Gemini(各有独立分榜)
排行榜算法 威尔逊置信区间,真实率 % + 检测次数 + 通过率 + 存活天数,日/周/月/年/总榜,每小时更新 贝叶斯加权中位分 + critical 严重问题率 + 协议分榜,排除检测无效报告
检测维度 多轮探测:返回协议、知识表现、身份一致性、思维链痕迹、签名指纹(交叉评分) 12 项字段级检测,含 thinking signature 加密签名验证、token 用量虚报、长上下文截断、function calling、structured output 等
原始证据 给出真实率分数与可信度分级 每份报告公开 URL + JPG,逐字段列出扣分项与原始响应证据,可复核可分享
单域名历史 榜单显示存活天数、检测/通过次数 每域名详情页:历史每次检测报告、协议覆盖、最常失败的 detector、趋势
开源 / 隐私 声明纯前端处理、不上传 Key、基于 GitHub 开源项目 完全开源(AGPL-3.0)可审计、可自托管,key 不落盘可 grep 验证
商业推荐 榜单按真实率排序,不收录价格 联盟透明 + Pro 认证收录,评分与商业严格隔离、可审计

以上照妖镜信息来自其官网公开页面(llmtest.cn),如有更新以其官网为准。本页由 Veridrop 编写,已尽量客观陈述双方公开事实。

大模型照妖镜做得好的地方(客观说)

📊威尔逊置信榜

用威尔逊置信区间算真实率排行,检测次数少的站不会因为偶然高分冒头,统计上更稳健。这是它榜单的亮点。

📅多时间维度

日榜 / 周榜 / 月榜 / 年榜 / 总榜都有,还显示存活天数,方便看一个站是「最近才好」还是「长期靠谱」。

⏱️每小时更新

榜单数据每小时刷新,时效性好,适合快速扫一眼当下哪些中转站真实率高。

🔓开源 + 纯前端

声明基于 GitHub 开源项目、纯前端处理、不上传 Key——这点和 Veridrop 一样重视透明与隐私。

Veridrop 的不可替代之处

🔬逐字段可复核证据

不只给一个真实率分数。每份报告公开列出:usage 有没有异源残留、长上下文有没有被截断、token 用量是否虚报、structured output 是否真生效——都能逐条核对。

🔐加密级真伪验证

Claude thinking signature 是 Anthropic 服务端加密签名(500–2000 字符),中转站理论上无法伪造,是真伪判断的强信号。

🗂️协议分榜

ClaudeOpenAIGemini 分开看,避免一个站被不擅长的协议拉低或被单协议高分误导。

📈单域名历史详情

每个域名有独立详情页,列出历史每次检测、最常失败的 detector 和趋势,看的是「这家长期怎么样」,不只是榜单上一个名次。

常见问题

大模型照妖镜(llmtest.cn)是做什么的?

llmtest.cn 是中转站检测工具 + 真实率排行榜,用威尔逊置信区间算真实率,支持日/周/月/年/总榜,显示检测次数、通过率、存活天数,每小时更新。声明纯前端处理、不上传 Key、基于 GitHub 开源项目。可选 Claude / GPT / Gemini。

Veridrop 和照妖镜的核心区别?

照妖镜强在真实率榜单(威尔逊置信 + 多时间维度 + 存活天数),适合横向看哪些站长期靠谱;Veridrop 强在单家深挖——逐字段可复核报告、thinking signature 加密验证、协议分榜、单域名历史详情。两者都开源。

该用哪个?

看真实率榜单、找长期靠谱候选 → 照妖镜。深挖某一家哪个字段出问题、各协议分别如何 → Veridrop。两者可交叉验证:榜单初筛,报告核验。

为什么字段级可复核报告重要?

「真实率 85%」只告诉你结论、不告诉你为什么。Veridrop 公开每项扣分字段可逐条复核(usage 残留、签名缺失、长上下文截断等),让你知道「问题在哪、严不严重」,还能分享报告 URL。

下一步:跑一次真伪核验

从照妖镜榜单看中了某家?到 Veridrop 跑一次字段级检测,确认细节是不是真透传。