主实验 2 · Proof(定理证明)结果 — 初步

One-shot: 单次生成。 #iter=5 :把编译报错喂回,最多精修 5 轮。
wo/lib: 不给 MLMath 库; w/lib :给库(可 import MLMath.* 复用)。

给定形式化陈述,模型生成 Lean 4 证明,以 lake 编译通过判对

两点重要说明

设置

模型	One-shot (wo/lib)	#iter=5 (wo/lib)	One-shot (w/lib)	#iter=5 (w/lib)
gpt-5.4-mini	1/30	2/30	2/30	4/30
claude-code (sonnet 4.6)	4/30	7/30	6/30	9/30
codex (GPT-5.5)	3/30	4/30	N/A	N/A

口径:prove 流程(--max-iter 0 = one-shot,5 = 编译反馈精修)。70 题完整版下周更新。