册 F|实验与度量标准(总则与模板)
体例:给出度量定义、合格阈值、统计检验、记录模板。所有实验遵循“同窗同秤复验“(册 C-1、C-3)与“NPE 误差日志“(C-8)。
F-1|频率阈值手册(Nyquist 化)
度量:有效带宽 、会频 、折叠能量 。 合格阈值:,(理想重建)或 。 检验:窗口期内做功率谱估计,计算能量覆盖比;置换检验变化显著性。 模板: 四联表,附“降频评估“页。
F-2|谱隙量表(圣度/权威)
度量: 或 ;环境扰动 ;圣度 。 合格阈值:,混合时间 。 检验:Davis–Kahan 偏移测;季频观测波动带内稳定。 模板: 记录卡。
F-3|KL 改错流程(仁慈小步)
度量:每步信息开销 、累积遗憾 、复发率。 合格阈值:、复发率显著低于“硬重置“。 检验:A/B 试验 6–12 周;非参数置信区间与置换检验。 模板:指数小步+I-投影日志(含 与约束 变更)。
F-4|NPE 误差日志(结构误差闭合)
度量: 三项上界与实测误差;目标 。 合格阈值:各项 ,连续两期。 检验:功率谱、EM 余项估计、尾项指数界;交叉窗复验。 模板:三项曲线+参数选型页 。
F-5|复现与预注册清单
度量:预注册遵从度、复现实验成功率、FDR 控制水平。 合格阈值:复现成功率 预设阈;FDR 。 检验:Brier/校准、漏斗图/选择偏倚检验。 模板:预注册表(窗/秤/分析式),复现报告(同窗同秤对照),多重校正记录。