1. 射程と前提
フリストン研究は、脳画像解析、生成モデル、自由エネルギー原理、能動的推論、計算精神医学、意識研究へと広がっている。しかし、これらは同じ強度の科学的確実性を持っていない。SPM や DCM のように方法論として広く定着したものもあれば、自由エネルギー原理のように理論的影響力は非常に大きいが、自然科学の意味での反証可能性が議論され続けているものもある[1][2][3][4]。そのため、議論の出発点を混同しないことが必要である。
本稿では、まず神経画像解析と推論理論の基礎を確認し、その後に 2026 年時点での到達点を「確立した知見 / 有力仮説 / 未解決問題」の 3 区分で切り分ける。最後に、その区分を保存したまま、最小の数理モデルを定義し、今後どこを拡張すべきかを示す[5][6][7]。
2. 学術的に最も堅い土台
2.1. 神経画像解析の方法論
もっとも堅い成果は、脳画像解析における統計的方法論の確立である。統計的パラメトリックマッピングは、一般線形モデルと空間統計を脳画像へ適用し、ボクセル単位の推定と推論を標準化した[1]。ボクセルベース形態計測は、構造画像に対する群間比較を高解像度で行う手法として定着し[2]、動的因果モデリングは、脳領域間の有効結合を生成モデルとして推定する枠組みを与えた[3]。この三者は、現代認知神経科学の解析基盤として歴史的にも実務的にも定着している[8]。
2.2. 生成モデルとしての脳
次の土台は、脳を受動的な入力処理器ではなく、外界の潜在状態に対する生成モデルを持つ系として捉える見方である。自由エネルギー原理は、知覚、行動、学習を変分自由エネルギー最小化の観点から統一的に捉えようとする理論であり[4]、その後の active inference の諸論文は、行動選択と学習を expected free energy の最小化として定式化してきた[5][6][7]。ただし、この層は方法論の層とは違い、理論の一般性と検証可能性をめぐって現在も議論が残る[9][10][11]。
2.3. 計算精神医学への応用
計算精神医学では、統合失調症を局所損傷ではなく、結合異常、精度重み付け異常、階層的推論の失調として記述する研究が蓄積してきた。とくに dysconnection hypothesis は、NMDA 受容体依存の可塑性や高次事前と感覚誤差のバランス異常を中核に据えることで、幻覚と妄想を同一の推論機構の異常として読む枠組みを与えた[12][13]。この方向は有力であるが、個々の患者に対する診断や治療を決定的に改善する臨床標準へ到達したとはまだ言い難い。
| 領域 | 中核手法 / 理論 | 数理的枠組み | 現在の位置づけ |
|---|---|---|---|
| 神経画像解析 | SPM | 一般線形モデル(GLM)+確率場理論 | 標準的解析基盤として確立 |
| 神経画像解析 | VBM | ボクセル単位の形態統計比較 | 構造解析手法として定着 |
| 神経画像解析 | DCM | 生成モデルに基づく有効結合推定 | 因果的接続解析の枠組みとして確立 |
| 理論神経科学 | ベイズ脳仮説 | 確率的生成モデルと事後推論 | 広く受容された基本枠組み |
| 理論神経科学 | 予測符号化 | 予測誤差最小化(階層モデル) | 実験的支持が蓄積 |
| 統合理論 | 自由エネルギー原理 | 変分自由エネルギー最小化 | 有力理論だが議論継続中 |
| 意思決定理論 | Active Inference | 期待自由エネルギー最小化 | 統一モデルとして発展中 |
| 計算精神医学 | ディスコネクション仮説 | 精度重み付け・結合異常モデル | 有力だが臨床標準には未到達 |
3. 2026 年時点での 3 区分表
以下の表では、2026 年時点で確認できる査読論文とレビューに基づき、到達点を 3 区分で整理する。
| 区分 | 内容 | 具体項目 | 判断理由 |
|---|---|---|---|
| 確立した知見 | 神経画像解析の統計基盤は現代認知神経科学の標準である。 | SPM、VBM、DCM。 | 長期にわたり広く使われ、再現可能な解析枠組みとして定着している[1][2][3][8]。 |
| 確立した知見 | 脳を潜在状態推定を行う確率的システムとして記述することは広く受容されている。 | 生成モデル、階層ベイズ、予測誤差に基づく説明。 | 神経科学と計算論の両側で共通語彙として定着しているが、個別理論の優劣とは区別すべきである[4][10][11]。 |
| 有力仮説 | 知覚、行動、学習を自由エネルギー最小化で単一原理として統一できる。 | FEP と active inference。 | 理論的整合性と影響力は高いが、唯一の正しい基礎理論として確定したわけではない[4][5][6]。 |
| 有力仮説 | 探索と利用は expected free energy の分解で統一的に書ける。 | 外発的価値と認識的価値の 2 項分解。 | 理論としては精緻化されているが、他の意思決定理論に対する一般的優位は未確定である[6][7]。 |
| 有力仮説 | 統合失調症などの病理は、階層的推論と精度重み付けの異常として記述できる。 | dysconnection hypothesis、precision weighting の異常。 | 画像研究と理論研究の支持があるが、臨床現場の標準モデルへ移行したとは言えない[12][13]。 |
| 有力仮説 | active inference は高次認知やより複雑な計画問題へ拡張可能である。 | 拡張 active inference、scale-free active inference。 | 近年の査読論文で形式的拡張が進んでいるが、一般知能レベルでの決定的優位はまだ言えない[11][14]。 |
| 未解決問題 | 自由エネルギー原理そのものがどの意味で反証可能かは明確でない。 | 原理の一般性と検証境界。 | 理論が広く多くの系を包摂できるため、反証条件と経験的制約の置き方が議論対象である[9][10]。 |
| 未解決問題 | 意識を active inference だけで十分に定式化できるかは未決着である。 | AI-C、A beautiful loop、INTREPID 系の研究。 | 2025 年時点で理論的提案と検証計画は進んでいるが、決定的な実証結論はまだない[15][16]。 |
| 未解決問題 | active inference が強化学習や大規模生成モデルより一般的に優れるかは未確立である。 | 性能比較、スケーラビリティ、汎化能力。 | 査読論文には有望な技術的拡張があるが、広範なベンチマークでの一般結論には至っていない[7][14]。 |
この 3 区分から導かれる最重要点は単純である。神経画像解析の方法論は確立しているが、FEP と active inference は大きな統一理論候補であって、なお理論競争と実証の途中にある。つまり、方法論の確立と存在論的主張の確立を同一視してはならない。
4. 数理モデルの展開
ここから先は、前半で切り分けた 3 区分を壊さない形で、数理モデルを段階的に構成する。重要なのは、最初から生命、意識、一般知能を一つの完成理論へ押し込まないことである。まずは確立した知見に対応する最小核を定義し、その上に有力仮説としての自由エネルギー原理と active inference を載せ、未解決問題は未定義のまま予約変数として保持する。この順序でないと、方法論として確立した部分と、理論的に魅力的だが未決着な部分が混同される。
本稿では、後半の数理モデルを四段階で明示する。第 1 段階は状態・観測・行動の最小状態空間モデル、第 2 段階は変分自由エネルギーによる知覚更新、第 3 段階は expected free energy による政策選択、第 4 段階は階層化・病理拡張・未解決変数の予約である。この四段階を切り分けることで、どこまでが比較的堅い基底で、どこから先が拡張理論なのかを明示できる[4][5][6][7]。
4.1. 第 1 段階 ―― 状態・観測・行動の最小状態空間モデル
出発点は部分観測状態空間モデルである。外界の潜在状態を \(x_t\)、観測を \(o_t\)、行動を \(a_t\) とする。外界は行動の影響を受けながら時間発展し、観測は潜在状態から生成される。
x_t \in \mathcal{X}, \qquad o_t \in \mathcal{O}, \qquad a_t \in \mathcal{A}
\]
\[
x_{t+1} \sim p(x_{t+1} \mid x_t, a_t)
\]
\[
o_t \sim p(o_t \mid x_t)
\]
ここで置いているものは、あくまで現代の計算論的認知科学で広く使われる最小形である。この段階は、自由エネルギー原理を採用しなくても成立する。したがって第 1 段階は、前半でいう「確立した知見」に対応する基底層である。脳や認知を議論する前に、観測と潜在状態の分離、時間発展、部分観測性を定義しているだけだからである。
この形式は、強化学習、制御理論、ベイズ推論など複数の理論と互換性を持つ最小共通基盤である。
内部状態は、外界そのものではなく外界に関する内部信念である。したがって、内部状態を近似事後分布 \(q_t(x_t)\) として置く。
s_t \equiv q_t(x_t)
\]
\[
q_t(x_t) \approx p(x_t \mid o_{1:t}, a_{1:t-1})
\]
この書き方により、内部状態は「世界の複製」ではなく「世界の推定」として扱われる。ここまでは、ベイズ的脳観や生成モデル的認知の一般的枠組みに整合する。
4.2. 第 2 段階 ―― 変分自由エネルギーによる知覚更新
第 2 段階では、自由エネルギー原理に特有の量を導入する。観測 \(o_t\) と潜在状態 \(x_t\) に対する生成モデル \(p(o_t, x_t)\) を持つとき、変分自由エネルギーは次で定義される。
F_t[q] = \mathbb{E}_{q(x_t)}\bigl[\ln q(x_t) – \ln p(o_t, x_t)\bigr]
\]
\[
F_t[q] = D_{\mathrm{KL}}\bigl(q(x_t)\,\|\,p(x_t\mid o_t)\bigr) – \ln p(o_t)
\]
右辺第 2 式は、変分自由エネルギーが真の事後分布との距離と観測の驚きに分解できることを示している。したがって、近似事後 \(q\) に関して \(F_t[q]\) を最小化することは、内部信念を真の事後に近づけることに対応する。知覚更新は次のように書ける。
q_t^* = \arg\min_q F_t[q]
\]
連続時間風に書けば、内部状態は自由エネルギーの勾配流として更新される。
\dot{s}_t = -\eta \, \nabla_s F_t
\]
離散時間では、次の更新則として近似できる。
s_{t+1} = s_t – \eta \, \nabla_s F_t
\]
predictive coding に寄せた形に書くなら、観測予測 \(\hat{o}_t\) と予測誤差 \(\varepsilon_t\) を用いて、
\hat{o}_t = g(s_t)
\]
\[
\varepsilon_t = o_t – \hat{o}_t
\]
\[
s_{t+1} = s_t + \eta K_t \varepsilon_t
\]
と書ける。ここで \(K_t\) は誤差の精度重み付けであり、どの誤差成分をどれだけ信頼するかを表す。第 2 段階は、理論的には非常に整っているが、前半で整理したとおり、「知覚を変分自由エネルギー最小化として記述すること」がそのまま自然科学の唯一の基礎法則であるとまでは言えない。したがってこの層は、有力仮説の中心に位置づく[4][9][10]。
重要なのは、この最小化が「記述として等価」であることと、「脳が実際にこの量を計算している」という主張とは別である点である。
4.3. 第 3 段階 ―― expected free energy による政策選択
第 3 段階では、知覚だけでなく行動まで同一枠組みで扱う。政策 \(\pi\) を将来の行動系列とし、その評価量を期待自由エネルギー \(G_t(\pi)\) とする。一般形は次のように書ける。
G_t(\pi) =
\mathbb{E}_{q(o_{t:T},x_{t:T}\mid \pi)}
\bigl[
\ln q(x_{t:T}\mid \pi) – \ln p(o_{t:T},x_{t:T}\mid \pi)
\bigr]
\]
\[
\pi_t^* = \arg\min_{\pi} G_t(\pi)
\]
この量は、機能的には目標達成に関わる項と情報獲得に関わる項へ分解できる。
G_t(\pi) = G_t^{\mathrm{pragmatic}}(\pi) + G_t^{\mathrm{epistemic}}(\pi)
\]
また、符号を変えて価値として書けば、
G_t(\pi) \approx – V_{\mathrm{extrinsic}}(\pi) – V_{\mathrm{epistemic}}(\pi)
\]
と理解できる。\(V_{\mathrm{extrinsic}}\) は目標状態や選好状態への接近、\(V_{\mathrm{epistemic}}\) は不確実性低減、すなわち情報利得に対応する。これにより探索と利用は、別々の原理ではなく、一つの評価量の中で統一的に扱われる[5][6][7]。
このとき、観測・推論・行動の閉ループは次の 5 ステップで記述できる。
| 段階 | 更新内容 | 式 |
|---|---|---|
| 1 | 外界が進む。 | \(x_{t+1} \sim p(x_{t+1}\mid x_t, a_t)\) |
| 2 | 新しい観測が得られる。 | \(o_{t+1} \sim p(o_{t+1}\mid x_{t+1})\) |
| 3 | 内部信念を更新する。 | \(q_{t+1} = \arg\min_q F_{t+1}[q]\) |
| 4 | 政策を選択する。 | \(\pi_{t+1} = \arg\min_{\pi} G_{t+1}(\pi)\) |
| 5 | 政策に基づき行動する。 | \(a_{t+1} \sim p(a_{t+1}\mid \pi_{t+1})\) |
第 3 段階までで、観測、知覚、行動を一つの数理系に収められる。ただし前半で整理したように、ここから直ちに「この枠組みが他の意思決定理論より一般的に優れている」とは言えない。その点はなお未決着である。
したがって、この定式化は有力な統一記述であるが、強化学習など既存理論に対する一般的優位を保証するものではない。
4.4. 第 4 段階 ―― 階層化、病理拡張、予約変数
第 4 段階では、単一状態の最小系を拡張する。ただし、この拡張は三つに分けて扱うべきである。第一に、比較的自然な数学的拡張としての階層化。第二に、計算精神医学に対応する病理パラメーターの導入。第三に、意識や自己のような未解決変数の予約である。
4.4.1. 階層生成モデル
単一状態 \(x_t\) では、高次文脈や概念レベルの拘束を表しにくい。そこで、低次感覚状態 \(x_t^{(1)}\) と高次文脈状態 \(x_t^{(2)}\) を分ける。
o_t \sim p(o_t \mid x_t^{(1)})
\]
\[
x_t^{(1)} \sim p(x_t^{(1)} \mid x_t^{(2)})
\]
\[
x_{t+1}^{(2)} \sim p(x_{t+1}^{(2)} \mid x_t^{(2)}, a_t)
\]
この書き方により、高次文脈が低次知覚を拘束する構造、すなわち predictive coding 的階層性を明示できる。さらに高次の層を増やせば、文脈、概念、課題設定、自己モデルなどを順に追加できる。
4.4.2. 病理はパラメーター異常として入れる
統合失調症などの病理を理論へ入れるときに、新しい力学系を別に作る必要はない。通常系の更新則のパラメーター異常として書く方が一貫している。もっとも単純には、精度重み付け \(K_t\) の異常と、内部遷移モデルのパラメーター \(\Theta\) の異常を導入すればよい。
K_t \rightarrow K_t’
\]
\[
p(x_{t+1} \mid x_t, a_t; \Theta) \rightarrow p(x_{t+1} \mid x_t, a_t; \Theta’)
\]
感覚誤差の重みが過大化すれば、偶然的ゆらぎが過度に意味づけられやすくなる。逆に高次事前が過大に固定されれば、反証入力に対しても信念が硬直しやすくなる。この方向が dysconnection hypothesis や precision weighting 異常モデルに接続する[12][13]。これは構造振動の利得と結合のパラメーター空間上の遷移として理解できる。
4.4.3. 意識・自己・社会性は予約変数として保持する
2026 年時点では、active inference に基づく意識理論や自己モデル理論は、査読論文が現れ始めているが、決定的な実証結論には至っていない。したがって、これらを既知の量として主方程式へ織り込むのではなく、予約変数として保持する。
C_t = \Psi(q_t, \Theta_t, \text{global integration})
\]
\[
\Sigma_t = \Xi(q_t, a_{1:t}, o_{1:t})
\]
\[
\Gamma_t = \Omega(\Sigma_t, \text{models of others})
\]
ここで \(C_t\) は意識状態、\(\Sigma_t\) は自己モデル、\(\Gamma_t\) は他者や社会的状況に関するモデルを表す予約変数である。この段階では「そのような変数を置ける」ことだけを明示し、実証的内容を先取りしない。これにより、理論の拡張可能性と、現時点での未解決性とを同時に保存できる[15][16]。
4.5. 最小記号表
| 記号 | 意味 | 位置づけ |
|---|---|---|
| \(x_t\) | 時刻 \(t\) の外界の潜在状態。 | 確立した知見に整合する基底変数。 |
| \(o_t\) | 時刻 \(t\) の感覚観測。 | 確立した知見に整合する基底変数。 |
| \(a_t\) | 時刻 \(t\) の行動。 | 確立した知見に整合する基底変数。 |
| \(q_t(x_t)\) | 潜在状態に関する内部信念。 | 生成モデルに基づく推論表現。 |
| \(F_t[q]\) | 変分自由エネルギー。 | 有力仮説の中心量。 |
| \(G_t(\pi)\) | 期待自由エネルギー。 | 有力仮説の中心量。 |
| \(K_t\) | 予測誤差の精度重み付け。 | 病理拡張で重要になるパラメーター。 |
| \(\Theta\) | 内部遷移や結合のパラメーター。 | 通常系と病理系の接点。 |
| \(C_t\) | 意識状態。 | 未解決問題として予約する変数。 |
| \(\Sigma_t\) | 自己モデル。 | 未解決問題として予約する変数。 |
| \(\Gamma_t\) | 社会的・他者モデル。 | 未解決問題として予約する変数。 |
5. 構造振動モデルとの数式的統合
ここまでの四段階モデルは、状態、観測、行動、内部信念を核とし、その上に変分自由エネルギー最小化と expected free energy による政策選択を重ねたものであった。この構造は、そのままでも閉じた理論として読めるが、より一般的には「構造振動モデル」の特殊形として再解釈できる。
構造振動モデルでは、系は固定的な実体ではなく、状態、環境、観測、介入の相互作用によって更新され続ける構造である。この最小構成を、本稿では次の 5 要素で表す。
S_t \in \mathcal{S}, \qquad C_t \in \mathcal{C}, \qquad O_t \in \mathcal{O}, \qquad U_t \in \mathcal{U}
\]
\[
S_{t+1} = M(S_t, C_t, O_t, U_t)
\]
ここで \(S_t\) は時刻 \(t\) における構造状態、\(C_t\) は環境または制約条件、\(O_t\) は観測、\(U_t\) は介入、\(M\) は更新写像である。この式は、状態空間モデルより一段一般的であり、知覚系にも生体系にも社会系にも適用できる。
FEP / active inference の枠組みは、この一般式の中で、状態を「外界状態と内部信念の結合状態」として具体化した場合に得られる。すなわち、
S_t = (x_t, q_t)
\]
\[
C_t = p(x_{t+1}\mid x_t, a_t)
\]
\[
O_t = o_t
\]
\[
U_t = a_t
\]
と対応づけることができる。ここで \(x_t\) は外界の潜在状態、\(q_t\) はその近似事後、\(a_t\) は介入としての行動、\(o_t\) は観測である。したがって、FEP 系の最小核は、構造振動モデルの特定の実装にすぎない。
このとき、構造の時間発展は「単なる更新」ではなく、「ある評価量のもとで拘束された更新」として書ける。もっとも一般には、構造振動モデルの更新を次の変分問題として置ける。
S_{t+1} = \arg\min_{S’} \mathcal{J}(S’; S_t, C_t, O_t, U_t)
\]
ここで \(\mathcal{J}\) は更新を拘束する汎関数である。この \(\mathcal{J}\) をどう選ぶかによって、振動構造の具体的な力学が決まる。FEP の場合には、この \(\mathcal{J}\) が変分自由エネルギーに対応する。
\mathcal{J}_{\mathrm{FEP}} \equiv F_t[q]
= \mathbb{E}_{q(x_t)}\bigl[\ln q(x_t) – \ln p(o_t, x_t)\bigr]
\]
したがって、知覚更新は、構造振動モデルの一般更新式の中で、内部信念 \(q_t\) に関する部分最適化として書き直せる。
q_t^* = \arg\min_q \mathcal{J}_{\mathrm{FEP}}(q; S_t, C_t, O_t, U_t)
\]
\[
q_t^* = \arg\min_q F_t[q]
\]
さらに、この更新を勾配流として近似すれば、構造振動はポテンシャル面上の拘束運動になる。
\dot{S}_t = – \nabla_S \mathcal{J}(S_t; C_t, O_t, U_t)
\]
FEP の知覚更新はその特殊形として、
\dot{q}_t = – \eta \nabla_q F_t[q]
\]
\[
q_{t+1} = q_t – \eta \nabla_q F_t[q]
\]
と書ける。つまり、自由エネルギー最小化は「構造振動を安定化させるポテンシャル勾配流」であると解釈できる。
predictive coding の誤差更新も、同じ枠内で読める。観測予測 \(\hat{o}_t\) と予測誤差 \(\varepsilon_t\) を用いれば、
\hat{o}_t = g(q_t)
\]
\[
\varepsilon_t = o_t – \hat{o}_t
\]
\[
q_{t+1} = q_t + \eta K_t \varepsilon_t
\]
となるが、これは構造振動モデルでは「観測誤差によって駆動される局所振動」の形になっている。ここで \(K_t\) は誤差の精度重み付けであり、振動の増幅率または減衰率に相当する。したがって、通常状態と病理状態の差は、別の法則ではなく、振動の利得構造の差として扱える。
行動の側も同様である。構造振動モデルでは、介入 \(U_t\) は構造そのものを変える操作であり、active inference ではそれが政策 \(\pi\) の選択として書かれる。一般形では、
U_t^* = \arg\min_{U} \mathcal{K}(U; S_t, C_t)
\]
という介入選択問題になる。active inference では、この \(\mathcal{K}\) が期待自由エネルギー \(G_t(\pi)\) に対応する。
G_t(\pi) =
\mathbb{E}_{q(o_{t:T},x_{t:T}\mid \pi)}
\bigl[
\ln q(x_{t:T}\mid \pi) – \ln p(o_{t:T},x_{t:T}\mid \pi)
\bigr]
\]
\[
\pi_t^* = \arg\min_{\pi} G_t(\pi)
\]
したがって、政策選択もまた、構造振動モデルの中では「将来の振動軌道を拘束する介入の最適化」として読める。とくに、
G_t(\pi) = G_t^{\mathrm{pragmatic}}(\pi) + G_t^{\mathrm{epistemic}}(\pi)
\]
\[
G_t(\pi) \approx -V_{\mathrm{extrinsic}}(\pi) – V_{\mathrm{epistemic}}(\pi)
\]
という分解は、振動構造のうち、第一項が「どのアトラクタへ向かうか」、第二項が「どれだけ不確実性を解消するか」を表している。前者は到達目標、後者は構造同定である。これにより探索と利用は、振動構造の二つの調整様式として統一される。
この統合をさらに明示するために、構造振動モデルの全体更新を、状態更新項、観測駆動項、介入項、拘束項の和として分解して書ける。
S_{t+1} = S_t + \Phi_{\mathrm{dyn}}(S_t, C_t) + \Phi_{\mathrm{obs}}(O_t, S_t) + \Phi_{\mathrm{ctl}}(U_t, S_t) – \Phi_{\mathrm{cons}}(S_t)
\]
ここで \(\Phi_{\mathrm{dyn}}\) は系そのものの自然発展、\(\Phi_{\mathrm{obs}}\) は観測誤差による更新、\(\Phi_{\mathrm{ctl}}\) は介入による制御、\(\Phi_{\mathrm{cons}}\) は安定化や正則化を表す。FEP 系では、\(\Phi_{\mathrm{obs}}\) と \(\Phi_{\mathrm{cons}}\) が自由エネルギー勾配に吸収され、\(\Phi_{\mathrm{ctl}}\) が expected free energy 最小化として実装される。
したがって、自由エネルギー原理は「構造振動モデルの中で、拘束項を変分自由エネルギーとして選び、介入項を期待自由エネルギー最小化として選んだ場合の特殊形」である。言い換えれば、構造振動モデルが上位、FEP / active inference はその一実装である。
この包含関係は数理的構造に関するものであり、FEP の自然法則としての成立を意味するものではない。
| 構造振動モデル | FEP / Active Inference | 数式表現 | 力学的意味 |
|---|---|---|---|
| 状態 \(S_t\) | \(x_t, q_t\) | \(S_t = (x_t, q_t)\) | 外界と内部信念の結合状態 |
| 環境 \(C_t\) | 遷移モデル | \(p(x_{t+1}\mid x_t,a_t)\) | 外部制約・ダイナミクス |
| 観測 \(O_t\) | 感覚入力 | \(o_t \sim p(o_t \mid x_t)\) | 部分観測による駆動 |
| 介入 \(U_t\) | 行動 | \(a_t\) | 状態遷移への能動的影響 |
| 更新写像 \(M\) | FEP / EFE | \(S_{t+1} = \arg\min \mathcal{J}\) | 振動の拘束(安定化) |
この観点から病理を見れば、統合失調症などの異常は、別の世界に属する特殊事象ではなく、振動の利得、結合、減衰の異常として表現できる。たとえば、
K_t \rightarrow K_t’
\]
\[
p(x_{t+1}\mid x_t, a_t; \Theta) \rightarrow p(x_{t+1}\mid x_t, a_t; \Theta’)
\]
という変化は、構造振動モデルではそれぞれ「観測誤差の増幅率の変化」と「結合構造の変化」に対応する。これにより、病理は更新則の外部ではなく、同一更新則のパラメーター領域として理解される。
さらに、意識、自己、社会性は、構造振動モデルにおいては予約変数として次のように位置づけられる。
C_t = \Psi(S_t, \text{integration over scales})
\]
\[
\Sigma_t = \Xi(S_{1:t})
\]
\[
\Gamma_t = \Omega(\Sigma_t, \text{coupling with other agents})
\]
ここで \(C_t\) は多層振動の統合様式、\(\Sigma_t\) は持続的な自己構造、\(\Gamma_t\) は主体間結合としての社会的構造を表す予約変数である。現時点では、これらを主方程式の既知量として確定することはできないが、構造振動モデルの上では自然な拡張先として位置づけられる。
6. 今後の展開 ―― 振動構造としての拡張
この統合から見えてくる今後の課題は明確である。第一に必要なのは、階層振動の明示である。すなわち、低次感覚層、高次文脈層、自己層、社会層において、どの変数がどの時間スケールで振動し、どの層間結合が安定化または不安定化をもたらすのかを定義しなければならない。
第二に必要なのは、振動パラメーターの観測可能量への対応づけである。精度重み付け \(K_t\)、結合パラメーター \(\Theta\)、振動の振幅、位相ずれ、同期性、減衰率などを、行動課題、神経画像、電気生理、モデル反転によって推定可能な量へ落とし込む必要がある。ここが進まない限り、構造振動モデルは説明図式に留まる。
第三に必要なのは、予約変数の操作的定義である。意識 \(C_t\) は統合度と持続性、自己 \(\Sigma_t\) は再帰的自己参照の安定性、社会的推論 \(\Gamma_t\) は主体間予測誤差の結合として定義し直す必要がある[14][15][16]。
第四に必要なのは、FEP の位置づけの再評価である。今後問うべきなのは、「FEP が真か偽か」だけではない。むしろ、「構造振動の一般理論の中で、FEP はどの条件で有効な特殊形になるのか」を明示することである。これにより、自由エネルギー原理の有効範囲と限界とを、より明確に切り分けられる。
したがって、今後の展開は、FEP を唯一原理として完成させる方向ではなく、構造振動モデルの中での位置を固定し、その上で病理、意識、自己、社会性へ段階的に拡張する方向で進めるべきである。
| 方向 | 対象 | 数理的課題 | 観測・実装への落とし込み | 現在の状態 |
|---|---|---|---|---|
| 階層振動の明示 | 多層状態 \(S^{(i)}_t\) | 層間結合 \(p(x^{(i)} \mid x^{(i+1)})\) の定式化 | 脳画像(階層結合)、計算モデル(多層生成モデル) | 部分的に確立(DCM・階層ベイズ) |
| パラメーターの観測可能化 | \(K_t, \Theta\) | 精度・結合を推定可能量へ写像 | 行動課題、fMRI、EEG、モデル反転 | 有力仮説(計算精神医学で進展) |
| 予約変数の定義 | \(C_t, \Sigma_t, \Gamma_t\) | 関数 \(\Psi, \Xi, \Omega\) の具体化 | 統合度指標、自己参照課題、社会的推論課題 | 未解決問題 |
| FEP の位置づけ再評価 | \(\mathcal{J}\) の選択 | 自由エネルギー以外の拘束関数の可能性 | 他理論(RL・生成モデル)との比較実験 | 未解決問題 |
| 統合理論の構築 | 全体モデル | \(S_{t+1} = M(\cdot)\) の一般形の確定 | シミュレーション、理論比較、数値検証 | 未解決問題 |
7. 結論
2026 年時点で最も妥当な整理は次のようになる。神経画像解析の方法論は確立した知見であり、状態空間モデルは安全な基底である。自由エネルギー原理と active inference は、知覚と行動を統一的に記述する有力な理論であるが、唯一の基礎原理として確定したわけではない。数式レベルで見ると、これらは構造振動モデルにおいて、更新拘束を変分自由エネルギー、介入選択を期待自由エネルギーとして選んだ特殊形として理解できる。意識、自己、社会性は、その振動構造の上位層に属する未解決問題であり、現時点では予約変数として扱うのが妥当である。
以上を踏まえると、本稿の立場は次の一点に集約される。すなわち、FEP は有力な統一記述であるが、それ自体を唯一原理とみなすのではなく、より一般的な構造振動モデルの特殊形として位置づけることが、現時点で最も妥当な理解である。
参考文献
- Friston, K. J., Holmes, A. P., Worsley, K. J., Poline, J.-P., Frith, C. D., and Frackowiak, R. S. J. Statistical parametric maps in functional imaging: A general linear approach. https://www.fil.ion.ucl.ac.uk/~karl/Statistical%20parametric%20maps%20in%20functional%20imaging.pdf
- Ashburner, J., and Friston, K. J. Voxel-based morphometry—The methods. https://www.sciencedirect.com/science/article/pii/S1053811900905822
- Friston, K. J., Harrison, L., and Penny, W. Dynamic causal modelling. https://pubmed.ncbi.nlm.nih.gov/12948688/
- Friston, K. The free-energy principle: A unified brain theory? https://pubmed.ncbi.nlm.nih.gov/20068583/
- Friston, K., FitzGerald, T., Rigoli, F., Schwartenbeck, P., O’Doherty, J., and Pezzulo, G. Active inference and learning. https://pubmed.ncbi.nlm.nih.gov/27375276/
- Friston, K., Rigoli, F., Ognibene, D., Mathys, C., FitzGerald, T., and Pezzulo, G. Active inference and epistemic value. https://www.tandfonline.com/doi/abs/10.1080/17588928.2015.1020053
- Millidge, B., Tschantz, A., and Buckley, C. L. Whence the expected free energy? https://direct.mit.edu/neco/article/33/2/447/95645/Whence-the-Expected-Free-Energy
- Zeidman, P., Caballero-Gaudes, C., and Friston, K. et al. SPM—30 years and beyond. https://pmc.ncbi.nlm.nih.gov/articles/PMC12421888/
- Bruineberg, J., Kiverstein, J., and Rietveld, E. The anticipating brain is not a scientist: The free-energy principle from an ecological-enactive perspective. https://pubmed.ncbi.nlm.nih.gov/30996493/
- Mazzaglia, P., Pezzulo, G., and D’Ausilio, A. The free energy principle for perception and action: A deep learning framework for active inference. https://pmc.ncbi.nlm.nih.gov/articles/PMC8871280/
- Constant, A., Clark, A., Friston, K., and Ramstead, M. J. D. Extended active inference: Constructing predictive cognition beyond skulls. https://pmc.ncbi.nlm.nih.gov/articles/PMC9292365/
- Friston, K. J., Brown, H. R., Siemerkus, J., and Stephan, K. E. The dysconnection hypothesis (2016). https://pmc.ncbi.nlm.nih.gov/articles/PMC5147460/
- Stephan, K. E., Friston, K. J., and Frith, C. D. Dysconnection in schizophrenia: From abnormal synaptic plasticity to failures of self-monitoring. https://pubmed.ncbi.nlm.nih.gov/19162277/
- Friston, K., Heins, C., Verbelen, T., Da Costa, L., Salvatori, T., Markovic, D., Tschantz, A., Koudahl, M., Buckley, C., and Parr, T. From pixels to planning: Scale-free active inference. https://www.frontiersin.org/journals/network-physiology/articles/10.3389/fnetp.2025.1521963/full
- Laukkonen, R. E., Friston, K., and Chandaria, S. A beautiful loop: An active inference theory of consciousness. https://pubmed.ncbi.nlm.nih.gov/40750007/
- Robinson, J. E., Corcoran, A. W., Whyte, C. J., Sarkozy, A., Seth, A., Kovács, G., Friston, K. J., Pennartz, C. M. A., Tononi, G., Hohwy, J., and INTREPID Consortium. The role of active inference in conscious awareness. https://pubmed.ncbi.nlm.nih.gov/41343515/