册 F|实验与度量标准(续)
F-6|镜断审计(公平性的置换检验与对称化校正)
度量
- 角色互换群 ;配对样本 。
- 镜差 。
- 净效差
判据/定理 (1) 对称化不劣:设损失 凸,则群平均
满足 且 。 证明要点:Jensen 不等式 + 群平均交换。
(2) 置换显著性:令 。在原假设“镜不变“下,任意符号置换的检验统计 的分布近对称,置换 -值 则拒绝。
执行规程
- 固定 与度量 ,构造配对集。
- 计算 与置换 -值;若未过阈 ,以正则化 训练或采用 。
- 报告镜差曲线与“净效影子价“标尺(将 与影子刻度 对齐)。
F-7|圣时检测(相位对齐的统计判据)
度量
- 外部周期信号 与事件时间列 。
- 相位 (已按周期 折返)。
- 方向向量 。
判据/定理 (1) Rayleigh 检验:在均匀相位原假设下,
(2) 交叉相关峰:定义 。若 且峰值超过置换阈,则“圣时“成立。 证明要点:圆统计向量和与均匀相位的极限定理;置换法控制伪发现率。
执行规程
- 估 与 峰位 。
- 以 作为开窗点运行两周,比较命中率/成功率;若跨窗复演成立则登记为“圣时“。
F-8|指针基与谱隙估计(样本复杂度与置信界)
度量
- 状态转移 未知;采样序列 。
- 频次估计 , 为 计数。
- 第二本征 、谱隙 。
判据/定理 (1) 矩阵 Bernstein 界:存在常数 使
其中 为有效独立样本数(考虑自相关衰减)。 (2) 本征值稳定性: 。 (3) 主向量偏差(Davis–Kahan): 。 由此得样本复杂度
执行规程
- 采样 足够长以满足上界,估 。
- 报告置信区间与“圣度“ (见 C-6)。
F-9|风水 SNR 量化与最优布置(离散可解方案)
度量与目标
- 离散位置 ,信号 、噪声 、权重 ,。
- 最大化
判据/定理 (1) Cauchy–Schwarz 最优形状:
证明要点:令 、,应用 。
(2) 平滑-软化解:为避免极端集中,可用温度 的软化
执行规程
- 估 (任务成功率/干扰强度)。
- 取 或 实施 14 天;比较完成时间/错漏率与 变化。
- 以 NPE 日志评估布局读数误差(窗改变引入的混叠与尾项)。
F-10|奇迹倾斜实验(重要抽样的方差控制)
度量与目标
- 事件 ,原分布 ,倾斜 ;权重 。
- 无偏估计
判据/定理 (1) 方差表达: 。 (2) 近似最优倾斜:令 标量,取 ;使 (事件阈值近均值化),方差最小近似。 (3) 变分选择(交叉熵法):选 最大化 ;迭代 至收敛。 (4) 稳定性阈: 为经验上限;超限则减小 。
执行规程
- 初选 (解 );
- 以交叉熵微调 ,监控 与置信区间宽度;
- 14 天对比 的稳健抬升与跨窗复演性;记录 KL 成本 。
F-11|伦理净增账(善/恶的运行度量)
度量
- 稳度 (如谱隙 或互信息 ),成本 。
- 净增 , 为影子刻度。
- 拓扑等级 。
判据/定理 (1) 等级保护:若在小扰动下 ,则“善阶“不变;需跨越奇点(断路/规制根本变更)方可降阶。 (2) 长期一致性:若 且各期 可复演,称“伦理净增“成立。 (3) 统计显著:令 ,标准误 ;若 ,在显著性 下通过。
执行规程
- 每次改动记 与 ,季度作 -检验与等级核查。
- 发布“净增账“与“等级不灭“报告(含 的相位绕线图)。
F-12|共识—传播优化器(会频与轮次的联合选型)
目标 给定上限容差 、议题带宽 、变化 Lipschitz 常数 、初始散度 、网络 ,最小化
约束 (Nyquist)。
判据/推导 (1) 取容差分配 。 (2) 由 得
(3) 由 得
(4) 带入得 ,最优分配 。
执行规程
- 估 ,设 (保持成本权重)。
- 计算 并取整;若 仍不达标,则需增连边以降 或分拆议题(降带宽)。
F-13|别名预警(线上折叠能量检测)
度量
- STFT 能量 ,Nyquist 边 。
- 折叠比 。
判据 若 连续 个窗,触发“加频/降带/延决“预警; 建议 。
执行规程 部署在线 STFT 监控与自适应会频调度;同步更新 C-5 表。
F-14|校准记分板(概率输出的一致性评估)
度量
- ECE(期望校准误差)、NLL、Brier、Reliability 曲线。
- Isotonic/温度缩放后指标变动 。
判据 若 , 且外测 AUC 不降,则通过;否则需“换窗/三修“。
执行规程 预注册划分验证集;上线后按 节律复校并填 F-4 日志。