← 返回总览

主实验 2 · Proof(定理证明)结果 — 初步

给定形式化陈述,模型生成 Lean 4 证明,以 lake 编译通过判对

两点重要说明

设置

结果(proved / 30)

模型One-shot
(wo/lib)
#iter=5
(wo/lib)
One-shot
(w/lib)
#iter=5
(w/lib)
gpt-5.4-mini1/302/302/304/30
claude-code (sonnet 4.6)4/307/306/309/30
codex (GPT-5.5)3/304/30N/AN/A

观察

口径:prove 流程(--max-iter 0 = one-shot,5 = 编译反馈精修)。70 题完整版下周更新。