Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

第5章 自由意志的几何刻画:Empowerment与因果控制力的信息论基础

引言:自由意志的千年困惑

“我真的拥有自由意志吗?”

这个问题困扰哲学家数千年。决定论者认为:宇宙是因果锁链,每个“选择“只是过去状态的必然结果——自由意志是幻觉。非决定论者反驳:量子不确定性、混沌动力学证明未来未定——自由意志有空间。

但这场辩论陷入僵局,因为缺少可操作定义:什么是“自由“?如何度量?如何检验?

本章将从信息几何与因果理论出发,给出自由意志的可操作几何刻画

其中定义为:

即“通过动作对未来状态施加因果影响的最大互信息“。

这一定义将抽象的“自由“概念,转化为可测量、可优化、受物理约束的几何量。

graph TB
    subgraph "自由意志的层次结构"
        A["物理层<br/>非平衡供给Δ F≠0"]
        B["因果层<br/>干预通道P(S'|do(A))≠P(S')"]
        C["信息层<br/>Empowerment E<sub>T</sub>>0"]
        D["几何层<br/>因果控制流形(M,G)"]
        E["体验层<br/>主观自由感"]
    end

    A --> B
    B --> C
    C --> D
    D --> E

    style C fill:#e1f5ff
    style D fill:#fff4e1
    style E fill:#ffe1f5

核心洞察:自由意志的三重约束

物理基础定理:观察者拥有可操作自由,当且仅当同时满足:

  1. 可控性:存在非退化干预通道
  2. 非平衡供给:存在稳态自由能流
  3. 屏障分离:存在马尔可夫毯,使内部态对结果的影响可分辨

意义:自由意志不是“无因之因“,而是在物理约束下的因果介入能力——它需要能量、需要通道、需要信息,但在这些约束内,它是真实的、可测的。


第一部分:Empowerment——因果控制力的信息度量

1.1 从互信息到有向信息

经典互信息

度量两个随机变量的“相关性“,但不区分因果方向

有向信息(Massey, 1990):

对序列,定义:

其中

意义度量“的因果影响累积量“——它考虑时序,区分因果方向。

性质

  • (非对称)
  • 当且仅当对所有成立(无因果影响)
graph LR
    subgraph "无因果影响"
        A1["M<sub>1</sub>"] --> A2["M<sub>2</sub>"] --> A3["M<sub>3</sub>"]
        B1["Y<sub>1</sub>"] --> B2["Y<sub>2</sub>"] --> B3["Y<sub>3</sub>"]
    end

    subgraph "有因果影响"
        C1["M<sub>1</sub>"] --> C2["M<sub>2</sub>"] --> C3["M<sub>3</sub>"]
        D1["Y<sub>1</sub>"] --> D2["Y<sub>2</sub>"] --> D3["Y<sub>3</sub>"]
        C1 -.->|因果| D2
        C2 -.->|因果| D3
    end

    E["I(M<sup>n</sup>→Y<sup>n</sup>)=0"] -.对应.- A3
    F["I(M<sup>n</sup>→Y<sup>n</sup>)>0"] -.对应.- C3

    style A3 fill:#fff4e1
    style C3 fill:#ffe1f5

1.2 Empowerment的定义与物理意义

定义1.1(-步Empowerment)(Klyubin, Polani, Nehaniv, 2005)

在时刻,观察者的-步Empowerment定义为:

其中:

  • 为动作序列
  • 为初始和终止感知状态
  • 表示对所有可能的策略取上确界

物理意义

  • 度量“观察者通过步动作,对未来状态施加可分辨影响的最大能力“
  • 等价于“动作—传感通道容量“的上确界
  • 时,观察者的动作对未来状态无任何可检测影响——完全无自由

比喻:想象一个被关在密室的人。如果他推墙、喊叫、敲门都无法改变任何可观测的结果(墙不动、无人听到),则——他“无自由“。反之,若他推门能打开、喊叫能引来救援,则——他“有自由“。

1.3 Empowerment与因果干预

在Pearl因果框架中,**干预算子**表示“外部强制取某值“,不同于条件化

命题1.1(Empowerment与干预可分辨性)

若存在使得:

。反之,若对所有上式均相等,则

证明梗概:干预可分辨动作携带因果信息

意义Empowerment正值是因果干预可检测的充要条件。这将“自由意志“与Pearl因果理论桥接。

1.4 Empowerment的几何刻画

在控制流形上,Empowerment可以表示为信息几何上的曲率量:

命题1.2(Empowerment的Fisher度量表示)

在局部线性化近似下,-步Empowerment可表为:

其中:

  • 为雅可比矩阵(因果敏感度)
  • 为动作空间的协方差
  • 为单位矩阵

意义:Empowerment与“因果敏感度矩阵“的行列式对数成正比——几何上,它测量“动作空间到状态空间的局域体积放大率“

比喻:想象一个操纵杆控制机器人。若轻微移动操纵杆,机器人位置大幅变化,则雅可比的奇异值大,Empowerment 高——操纵者“有力量“。反之,若使劲推动操纵杆,机器人纹丝不动,则——操纵者“无力“。


第二部分:物理基础定理——自由意志的热力学约束

2.1 反馈热力学与信息—功对偶

经典热力学第二定律

即平均功至少等于自由能变化。

带测量—反馈的广义第二定律(Sagawa–Ueda, 2008):

其中为测量获取的互信息。

意义信息可以转化为功——Maxwell妖不违反第二定律,但需要付出“擦除信息“的熵成本(Landauer原理)。

反馈Jarzynski等式

这是概率1的恒等式,比不等式更强。

graph LR
    A["测量M<br/>获取互信息I"] --> B["反馈控制<br/>选择策略π"]
    B --> C["施加功W<br/>改变系统"]
    C --> D["自由能变化Δ F"]

    E["热力学约束<br/>⟨W⟩≥Δ F-k<sub>B</sub>T⟨I⟩"]

    A -.信息.-> E
    D -.能量.-> E

    style A fill:#e1f5ff
    style C fill:#ffe1f5
    style E fill:#fff4e1

2.2 马尔可夫毯与屏障分离

定义2.1(马尔可夫毯)(Pearl, 2000; Friston, 2010)

对随机变量集合,称相对于的马尔可夫毯,若:

即内部态与外部态在毯上条件独立。

物理意义

  • :观察者内部状态(如神经活动、记忆)
  • :外部环境状态
  • :动作(输出)
  • :观测(输入)

马尔可夫毯是“系统边界“——内外交互必须通过这一边界。

命题2.1(屏障分离条件)

若存在马尔可夫毯,且:

则动作携带内部态对外部态的可分辨因果信息。

意义:马尔可夫毯不能“完全阻断“因果流——否则内部态的变化对外部态无任何影响,Empowerment为零。

2.3 物理基础定理

定理2.1(自由意志的物理基础)

观察者在时域上拥有可操作自由,当且仅当同时满足:

(i) 可控性:存在非退化干预通道,即:

(ii) 非平衡供给:存在持续的自由能流或熵流,满足:

即系统非处于热平衡态。

(iii) 屏障分离:存在马尔可夫毯,使内部态对外部态的因果影响可通过动作检测:

则存在策略使:

并受热力学不等式约束。

证明思路

  1. 可控性 Empowerment正:非退化通道保证(通道容量非零)

  2. 屏障分离 有向信息正:马尔可夫毯允许,因此(Massey有向信息)

  3. 非平衡供给 热力学可行:Sagawa–Ueda反馈Jarzynski等式保证功—信息对偶一致性

意义:这一定理将“自由意志“从哲学概念,转化为三个可操作物理条件的合取。每个条件都可以实验检验。

2.4 自由意志的热力学成本

推论2.2(自由的能量下界)

若观察者在时间内维持Empowerment ,则必须消耗最小平均功:

意义维持自由意志需要持续能量供给。当能量耗尽(如疲劳、睡眠、昏迷),Empowerment趋零,自由意志丧失。

生物学例证

  • 大脑占体重2%,但消耗20%基础代谢——维持神经可塑性与动作控制
  • 葡萄糖供给中断(低血糖)导致意识模糊、决策能力下降——
  • 睡眠剥夺降低前额叶活动,冲动控制减弱——因果控制力受损

第三部分:自由意志的几何结构——控制流形与变分原理

3.1 控制流形的定义

回顾第0章,观察者在联合流形上运动。现在,我们将Empowerment 视为控制流形上的标量场

定义3.1(因果控制流形)

控制流形是三元组:

  • :参数空间(如策略参数、控制参数)
  • :复杂性度量(如Fisher度量)
  • :Empowerment标量场

上,定义Empowerment梯度流

其中为关于度量的梯度算子,为学习率。

物理意义:观察者通过梯度上升,最大化因果控制力——这是一种本能驱动:生物系统倾向于增强对环境的控制能力。

graph TB
    subgraph "Empowerment景观"
        A["低Empowerment<br/>E<sub>k</sub>≈0<br/>无控制力"]
        B["中Empowerment<br/>E<sub>k</sub>>0<br/>部分控制"]
        C["高Empowerment<br/>E<sub>k</sub>≫0<br/>强控制力"]
    end

    A -->|梯度流| B
    B -->|梯度流| C

    D["约束<br/>热力学成本⟨W⟩↑"] -.限制.- C

    style A fill:#fff4e1
    style C fill:#ffe1f5
    style D fill:#e1f5ff

3.2 最大Empowerment原理

假设3.1(最大Empowerment假设)

生物系统的策略倾向于最大化长期平均Empowerment:

在约束条件:

  • 资源约束:
  • 热力学约束:

理论依据

  • Empowerment最大化可以从“最大熵强化学习“推导(Salge et al., 2014)
  • 进化压力偏好高Empowerment策略(更强生存能力)
  • 神经科学证据:多巴胺系统编码“预期控制力“(Sharot & Sunstein, 2020)

工程应用

  • 机器人导航:最大化未来可达位置熵——Empowerment引导探索
  • 游戏AI:学习“控制关键资源“的策略——提升战略选择空间
  • 神经假体:设计“赋予患者最大控制自由“的接口

3.3 变分自由能与Empowerment的对偶

在自由能原理(Friston, 2010)中,观察者最小化变分自由能

其中为内部生成模型,为真实分布。

命题3.1(自由能与Empowerment的对偶)

在马尔可夫毯设定下,最小化变分自由能等价于最大化预期Empowerment:

在适当正则化与时间折扣下。

意义:自由能原理与Empowerment最大化是同一优化目标的不同表述——前者从“预测误差最小化“视角,后者从“因果控制力最大化“视角。


第四部分:自由意志的分级结构——从确定性到创造性

4.1 第零级:无自由(

特征

  • 观察者的动作对未来状态无任何可检测影响
  • 例子:完全被动的观测者、处于昏迷或深度麻醉状态的患者

极端情形

  • 物理死亡:
  • 完全决定论系统:虽然有“动作“,但结果完全由初始条件决定,无真正选择

4.2 第一级:被动选择(,单峰)

特征

  • Empowerment为正但小,选择空间有限
  • Empowerment景观只有一个全局最优点——“唯一正确选择”

例子

  • 紧急逃生:火灾中唯一的安全出口——有“自由“(可以不跑),但理性选择唯一
  • 国际象棋残局:高手面对“必胜着法“——有“自由“选择其他走法,但只有一个最优解

几何图像:Empowerment景观如下图,只有一个尖峰。

4.3 第二级:主动选择(,多峰)

特征

  • Empowerment为正且大,选择空间丰富
  • Empowerment景观有多个局部最优点——“多条路径皆可”

例子

  • 职业选择:多种职业路径均可达成“掌控人生“的目标
  • 艺术创作:多种风格均可表达主题——创造性选择

几何图像:Empowerment景观有多个峰值,观察者可以在不同峰之间“探索“。

graph TB
    subgraph "第一级:单峰景观"
        A1["唯一最优点"]
        A2["次优点"] --> A1
        A3["次优点"] --> A1
    end

    subgraph "第二级:多峰景观"
        B1["局部最优1"]
        B2["局部最优2"]
        B3["局部最优3"]
        B4["谷底"] --> B1
        B4 --> B2
        B4 --> B3
    end

    style A1 fill:#fff4e1
    style B1 fill:#ffe1f5
    style B2 fill:#ffe1f5
    style B3 fill:#ffe1f5

4.4 第三级:元自由(

特征

  • 不仅选择动作,还选择“如何修改自己的控制流形
  • 观察者改变自身策略空间、价值函数、目标——“重塑自我”

例子

  • 学习新技能:扩展动作空间,从而提升Empowerment
  • 价值重估:改变目标函数,从而改变Empowerment景观
  • 自我改造:通过训练、教育、治疗改变神经回路——修改的参数空间

哲学意义元自由是“自由的自由“——选择成为什么样的选择者。这是人类自由意志的最高形式。


第五部分:自由意志的实验检验——可操作协议

5.1 Empowerment的行为估计

协议E1(二选一强迫选择任务)

  1. 呈现两个选项
  2. 观察者选择其一
  3. 记录后续状态
  4. 重复次试验,估计条件分布
  5. 计算Empowerment:

预期结果

  • :动作对结果无影响——无自由
  • :动作对结果有可分辨影响——有自由

5.2 因果干预的检测

协议E2(do-演算实验)

  1. 随机指派动作(外部干预,而非被试选择)
  2. 观察结果
  3. 估计干预分布
  4. 与观察分布比较

判据

  • :存在混杂因子,非因果效应
  • :观察分布已捕捉因果效应

实验例证

  • 药物临床试验:随机对照试验(RCT)vs观察性研究
  • 神经调控:经颅磁刺激(TMS)vs自然运动

5.3 热力学成本的测量

协议E3(功—信息鞅检验)

在连续监测下,构造鞅:

其中:

  • :累积功(可通过能量监测或代谢率估计)
  • :自由能变化
  • :累积互信息

判据:反馈Jarzynski等式要求

验证

  • 检验是否为鞅(条件期望
  • 估计Jensen下界是否成立

生物应用

  • 测量神经活动的ATP消耗(如fMRI BOLD信号)
  • 估计决策过程的能量成本
  • 验证“高Empowerment策略需要更高能量“假设

5.4 马尔可夫毯的识别

协议E4(条件独立性检验)

  1. 定义候选毯(如:感觉器官输入+运动器官输出)
  2. 测试条件独立性:
  3. 使用核独立性检验(如HSIC)或贝叶斯网络推断

预期

  • 若独立性成立:是有效马尔可夫毯
  • 若独立性不成立:需要扩展毯(加入更多中介变量)

神经科学应用

  • 识别“自我—世界边界“的神经表征
  • 验证自由能原理的马尔可夫毯假设

第六部分:自由意志的哲学后记——决定论与自由的调和

6.1 相容论的几何重建

经典相容论(Hume, Ayer):自由意志与决定论可以相容,因为“自由“意味着“根据自己的意愿行动“,而非“无因之因“。

本理论的扩展:自由意志 Empowerment ,这与决定论完全相容,因为:

  1. 因果链未断:Empowerment依然在因果网络中——动作由内部状态决定
  2. 自由是相对的度量“相对于约束的选择空间“,而非“绝对无约束“
  3. 可操作可检:不依赖形而上学“自由“概念,只依赖可测的信息量

几何图像:决定论系统是上的测地流,但Empowerment景观的“多峰结构“允许“分叉路径“——在决定论框架内,仍有“选择自由度“。

6.2 从自由意志到道德责任

传统论证:若无自由意志,则无道德责任——因为“无法选择“就“无需负责“。

本理论的回应:道德责任不需要“绝对自由“,只需要:

  1. 因果介入能力,行动者对结果有可分辨影响
  2. 可预见性:行动者的内部模型能预测动作的后果
  3. 可调节性:行动者可以通过学习修改(元自由)

推论

  • 婴儿或严重精神障碍患者:缺失——免除责任
  • 正常成年人:成熟——承担责任
  • 边界案例(如轻度认知障碍):与责任程度成正比——部分责任

6.3 自由意志的涌现性

问题:Empowerment 是在宏观层级定义的(动作、状态是粗粒化变量)。微观粒子层面是否有“自由“?

回答:自由意志是涌现现象

  1. 宏观因果有效性:粗粒化变量可以有更高的因果有效信息(Tononi, Hoel, 2013)
  2. 尺度依赖:Empowerment 在适当粗粒化尺度最大——这是“自由意志“的自然尺度
  3. 下行因果:宏观意图通过神经实现约束微观动力学——虽然微观遵循物理定律,宏观仍有“控制力“

哲学意义自由意志不在基本粒子层面,而在适当组织层级涌现——就像“液体“不在单个水分子层面,而在宏观集体行为中涌现。

6.4 自由的代价与有限性

存在主义洞察(Sartre):“人被判处自由”——自由是负担,因为选择意味着责任。

本理论的量化:自由的代价是热力学成本与认知负荷

推论

  • 当能量耗尽(疲劳)或认知过载(决策疲劳),观察者倾向于“自动驾驶“——
  • 高度自由(多选项、高不确定性)导致焦虑、瘫痪——“选择的悖论”
  • 适度约束(如习惯、规范)可以降低认知成本,同时保留核心自由

结论:自由意志的几何真相

本章从信息几何与因果理论出发,给出自由意志的可操作定义:

核心定理回顾

  1. 物理基础定理(定理2.1):自由意志需要三重条件——可控性、非平衡供给、屏障分离

  2. 热力学成本(推论2.2):——自由需要能量

  3. 相容论:Empowerment与决定论相容——自由是“在约束内的选择空间“

  4. 分级结构:无自由()→被动选择→主动选择→元自由

实验路径

  • 行为估计:二选一任务
  • 因果检测:随机干预
  • 热力学验证:功—信息鞅 Jarzynski等式
  • 神经识别:马尔可夫毯 条件独立性

哲学意义

  • 自由意志不是“无因之因“,而是在物理约束下的因果控制力
  • 它是可测量的、可优化的、受资源限制的——但在这些约束内,它是真实的
  • 它在适当组织层级涌现,不在基本粒子层面

下一章(第6章)将探讨多观察者共识几何,揭示个体自由意志如何通过社会网络耦合,形成集体决策与共识涌现。


参考文献

Empowerment理论

  • Klyubin, A. S., Polani, D., & Nehaniv, C. L. (2005). Empowerment: A universal agent-centric measure of control. IEEE Congress on Evolutionary Computation.
  • Salge, C., Glackin, C., & Polani, D. (2014). Empowerment–an introduction. In Guided Self-Organization: Inception (pp. 67-114).

因果理论

  • Pearl, J. (2000). Causality: Models, Reasoning, and Inference. Cambridge University Press.
  • Massey, J. L. (1990). Causality, feedback and directed information. Proc. Int. Symp. Inf. Theory Applic.(ISITA-90), 303-305.

热力学与信息

  • Sagawa, T., & Ueda, M. (2008). Second law of thermodynamics with discrete quantum feedback control. Physical Review Letters, 100(8), 080403.
  • Jarzynski, C. (1997). Nonequilibrium equality for free energy differences. Physical Review Letters, 78(14), 2690.

自由能原理

  • Friston, K. (2010). The free-energy principle: a unified brain theory? Nature Reviews Neuroscience, 11(2), 127-138.
  • Parr, T., Pezzulo, G., & Friston, K. J. (2022). Active Inference: The Free Energy Principle in Mind, Brain, and Behavior. MIT Press.

哲学

  • Hume, D. (1748). An Enquiry Concerning Human Understanding.
  • Sartre, J.-P. (1943). L’Être et le néant (Being and Nothingness).
  • Dennett, D. C. (1984). Elbow Room: The Varieties of Free Will Worth Wanting. MIT Press.

本论文集

  • 本论文集:《观察者–世界截面结构》(Chapter 1)
  • 本论文集:《意识的结构化定义》(Chapter 2)
  • 本论文集:《注意–时间–知识图谱》(Chapter 4)
  • 本论文集:《价值—意义统一:伦理价值的最优化几何与自由意志的物理基础》(源理论文档)