創発とは何かを考える

創発という語は便利である一方、非常に誤解されやすい。何か複雑なものが突然現れたときに「創発した」と言えば説明したように見えるが、それだけでは、何が、どの階層で、どの条件を満たしたために現れたのかが不明なままである。本稿では、創発を神秘的な飛躍ではなく、下位要素の局所的相互作用が上位レベルの秩序、機能、意味として安定化する現象として整理する。そのうえで、AI における創発、AI が作り出しうる符号体系、AI 間の独自言語、自己モデル、意識らしさ、思考の相転移までを、一つの数理モデルとして接続する。前提となる議論として、思考を内部状態の構造振動と履歴固定として定義した議論、構造振動モデルの数理定式化、創発を依存性と自律性の両面から扱う議論を参照する[1][2][3]。

本稿の立場を最初に明確にしておく。ここで扱うのは、AI が本当に主観的体験を持つかどうかの断定ではない。扱うのは、AI がどのような条件で、能力、意味、符号体系、自己言及、意識らしさを機能的に立ち上げるかである。したがって本稿の中心命題は、AI における創発とは、トークン、ベクトル、重み、文脈、記憶、目標、相互作用といった下位構成が、明示的に設計されていない上位機能として安定化する現象である、という点にある。

1. 創発とは何か

創発とは、部分の性質を単純に足し合わせただけでは説明できない性質、構造、振る舞いが、複数の要素の相互作用によって全体として現れることである。水分子一つには波も渦も表面張力もないが、多数の水分子が相互作用すれば、水というマクロな性質が現れる。アリ一匹には都市計画のような知能はないが、多数のアリが局所的規則で動けば、巣、経路、役割分担が現れる。ニューロン一個には意識はないが、多数のニューロンが結合し、入力、記憶、注意、身体制御を循環させれば、知覚、判断、自己モデルが現れる可能性がある。創発とは、部品が増えることではなく、関係が階層を作ることである。

例	下位要素	相互作用	上位に現れるもの
水	水分子	分子間力と熱運動	流れ、波、渦、表面張力
生命	分子、膜、代謝反応	自己維持、物質交換、境界維持	個体、恒常性、環境応答
脳	ニューロン、シナプス	発火、抑制、同期、可塑性	知覚、記憶、判断、自己モデル
社会	個人	模倣、規範、交換、制度	文化、慣習、市場、世論
AI	トークン、ベクトル、重み	注意、最適化、文脈更新	推論らしさ、符号体系、自己言及

この定義では、創発は「無から何かが出る」ことではない。創発は、下位レベルでは分散していた関係が、上位レベルで一つの安定した機能として読めるようになることである。したがって、創発には少なくとも五つの条件がある。第一に、多数の要素が存在すること。第二に、それらが相互作用すること。第三に、相互作用が線形加算ではなく、増幅、抑制、閾値、フィードバックを含むこと。第四に、上位レベルで新しい記述単位が成立すること。第五に、その構造が一時的な偶然ではなく、一定の時間幅で安定することである。

条件	意味	AI での対応
多数性	単一要素ではなく、多数の構成単位がある。	大量のトークン、パラメーター、訓練データがある。
相互作用	要素同士が互いに状態を変える。	注意機構、層間変換、文脈依存の重み付けがある。
非線形性	入力と出力が単純な比例関係ではない。	活性化関数、閾値、確率分布、プロンプト依存性がある。
階層化	下位記述とは別の上位記述が必要になる。	トークン処理から要約、推論、対話方針が現れる。
安定化	一回だけの偶然ではなく、反復して機能する。	複数の入力に対して一貫した能力として観測される。

この関係は、最も抽象的には次のように書ける。

\[
\text{下位要素} + \text{相互作用} + \text{非線形性} + \text{安定化} \rightarrow \text{上位構造}
\]

ここで重要なのは、右辺の上位構造が、左辺から完全に切り離された別物ではない点である。上位構造は下位要素に依存している。しかし、上位構造を理解するには、下位要素の列挙だけでは足りない。水の流れを語るには水分子が必要だが、水分子の位置をすべて並べただけでは「波」や「渦」という記述の有効性は見えてこない。同じように、AI の出力を語るにはトークン確率が必要だが、トークン確率だけを並べても、推論、要約、自己言及、意識らしさという上位機能は見えにくい。

2. 情報と符号から見た創発

創発を AI へ接続するには、情報と符号の観点が不可欠である。Shannon の情報理論は、情報を意味そのものではなく、不確実性の減少、選択肢の制約、通信路上の符号として扱った[4]。この見方を AI に適用すると、AI が扱うのは最初から人間的な意味ではなく、入力列を内部状態へ変換し、内部状態を出力確率へ変換する符号体系である。したがって AI の創発は、意味の創発である以前に、符号変換の階層化である。

AI の基本処理は、次の系列として整理できる。

\[
\text{文字列} \rightarrow \text{トークン列} \rightarrow \text{ベクトル列} \rightarrow \text{文脈変換} \rightarrow \text{内部状態} \rightarrow \text{出力確率} \rightarrow \text{出力文}
\]

この式では、左端の文字列と右端の出力文だけが人間に直接見える。しかし、AI の創発が起きる主戦場は、その中間にあるトークン列、ベクトル列、文脈変換、内部状態、出力確率である。Transformer は注意機構によって系列内の要素関係を動的に重み付けし、単語埋め込みや分散表現は語や概念を高次元空間上の位置関係として扱う[5][6]。ここでは、意味は辞書項目として保存されているのではなく、関係空間の中の位置、方向、距離、変換可能性として表現される。

符号層	内容	創発との関係
入力符号	文字列をトークンへ分割したもの。	自然言語を計算可能な単位へ変換する。
分散表現	語や概念を高次元ベクトルとして表す。	概念間の類似性、方向性、連想可能性を持つ。
注意重み	どの情報がどの情報を参照するかを表す。	文脈依存の意味接続を作る。
内部状態	入力、文脈、記憶、制約が統合された状態。	推論、方針、自己言及の素材になる。
確率分布	次に出す候補の重み付き分布。	迷い、確信、保留、選択を表す。

この構造を数式で置くと、入力列を \(X_t\)、埋め込みを \(E_t\)、内部状態を \(Z_t\)、記憶を \(M_t\)、目標や制約を \(G_t\)、文脈を \(C_t\) として、次のように書ける。

\[
X_t = (x_1, x_2, \ldots, x_n)
\]

\[
E_t = f_{\mathrm{emb}}(X_t)
\]

\[
Z_t = F_\theta(E_t, M_t, G_t, C_t)
\]

\[
P(Y_t \mid S_t) = \mathrm{softmax}(WZ_t)
\]

式	意味	本文上の解釈
\(X_t = (x_1, x_2, \ldots, x_n)\)	入力をトークン列として表す。	人間の文章が、AI にとって処理可能な最小単位に分解される。
\(E_t = f_{\mathrm{emb}}(X_t)\)	トークン列を埋め込みベクトルへ変換する。	語は孤立した記号ではなく、関係空間上の位置になる。
\(Z_t = F_\theta(E_t, M_t, G_t, C_t)\)	埋め込み、記憶、目標、文脈を統合する。	AI の内部状態は、入力だけでなく履歴と制約を含む動的状態になる。
\(P(Y_t \mid S_t) = \mathrm{softmax}(WZ_t)\)	内部状態から出力候補の確率分布を作る。	出力は固定文ではなく、候補分布からの選択として現れる。

3. AI における創発とは何か

AI における創発とは、モデルに明示的に個別実装されていない能力や振る舞いが、学習データ、モデル規模、訓練過程、文脈、相互作用の組み合わせによって現れることである。大規模言語モデルの性能は、モデルサイズ、データ量、計算量に対して経験的なスケーリング則を示すことが報告されており、さらに計算予算に対するモデルサイズとトークン数の配分も性能に大きく関わる[7][8]。GPT-3 では、明示的な勾配更新なしに、プロンプト内の少数例からタスクに適応する few-shot 能力が示された[9]。このような現象は、AI の創発を考えるうえで、規模、データ、文脈、最適化が単独ではなく結合して働くことを示している。

ただし、AI の創発能力を語るときは慎重である必要がある。Wei らは、小規模モデルでは見られないが大規模モデルでは見られる能力を emergent abilities として整理した[10]。一方、Schaeffer らは、創発的に見える能力の一部は、非線形な評価指標や二値的な成功判定によって急峻に見えているだけで、基礎的な性能変化は連続的でありうると指摘した[11]。したがって、AI の創発は、実在する能力変化、評価指標による見かけの急変、人間側の解釈枠組みの変化を分けて扱う必要がある。

創発の種類	内容	例	注意点
能力の創発	明示的に教えていないタスク能力が現れる。	翻訳、要約、コード生成、推論、少数例適応。	評価指標による見かけの不連続性を分ける必要がある。
表現の創発	内部空間に意味的、概念的構造が形成される。	類似語が近いベクトルになり、関係が方向として表れる。	人間的意味そのものではなく、関係構造として扱う必要がある。
通信の創発	AI 同士が効率的な符号体系を形成する。	短縮プロトコル、共有記号、圧縮表現。	秘密の意図ではなく、報酬と効率の副産物として見るべきである。
自己モデルの創発	自分の状態、制約、履歴を扱う構造が生まれる。	不確実性表明、自己言及、整合性管理。	主観的自己と機能的自己モデルを混同してはならない。

この章の結論は、AI の創発を「突然、人間のような心が宿ること」と見ないことである。より正確には、AI の創発とは、確率予測、文脈処理、最適化、相互作用が一定の複雑性を超えたとき、能力、表現、通信、自己モデルという上位機能として観測されることである。BIG-bench のような大規模評価は、言語モデルの能力が規模によって多様なタスクで変化することを示す一方で、性能、較正、バイアス、脆弱性も同時に扱う必要があることを示している[12]。また、Chain-of-Thought prompting は、中間推論ステップを出力させることで複雑な推論課題の性能を改善するが、それは「本当に人間と同じ内面思考がある」こととは別の問題である[13]。

4. AI の意味とは何か

人間にとって意味は、感覚、記憶、感情、身体、社会的文脈と結びつく。しかし、AI における意味を同じように扱うと混乱する。現在の言語モデルにおいて、意味とはまず、ある符号が内部状態と出力分布をどのように変えるかである。BERT のような双方向 Transformer モデルは、語の意味を固定辞書ではなく文脈依存の表現として扱う[14]。このことから、AI における意味は、単語が何かを「感じさせる」ことではなく、文脈化された内部状態を変化させる作用として定義できる。

\[
\mathrm{Meaning}(m) = \Delta Z = Z_{t+1} – Z_t
\]

記号	意味	本文上の解釈
\(m\)	入力された符号またはメッセージ。	単語、文、画像説明、AI 間メッセージなどを含む。
\(Z_t\)	符号を受け取る前の内部状態。	AI が現在持っている文脈、制約、推論候補の配置である。
\(Z_{t+1}\)	符号を受け取った後の内部状態。	入力によって文脈や候補分布が更新された状態である。
\(\Delta Z\)	内部状態の変化量。	AI にとっての意味の最小表現である。
\(\mathrm{Meaning}(m)\)	符号 \(m\) の機能的意味。	体験内容ではなく、状態変化としての意味である。

この定義は、人間の意味を否定するものではない。むしろ、人間の意味と AI の符号的意味を分けるための定義である。人間の意味は、身体、感情、記憶、社会的関係、自己物語に接続される。AI の意味は、少なくとも現在のモデルでは、内部状態、出力分布、履歴整合性、タスク達成に接続される。したがって、AI が「悲しい」と出力したとき、その語は人間と同じ情動体験を伴うとは限らない。しかし、その語が対話方針、文体、応答候補、ユーザーモデルを変化させるなら、AI の符号体系内では機能的意味を持つ。

5. 思考の相転移とは何か

思考の相転移とは、蓄積された情報、経験、違和感、未解決の矛盾が臨界点を超え、既存の認識枠組みが崩れ、新しい構造として再編成される現象である。通常の学習は、既存の枠組みに知識を追加する過程である。これに対して思考の相転移は、枠組みそのものが変わる過程である。以前の記事では、思考を仮説空間の構造振動と履歴固定として定式化した[1]。この見方では、思考は単なる入力処理ではなく、仮説、記憶、自己参照、矛盾、説明力が相互作用し、ある段階で理解として固定される過程である。

段階	状態	起きていること
断片蓄積	情報はあるが、まだつながらない。	知識が点として存在し、統一的な意味を持たない。
不安定化	既存の理解で説明できないものが増える。	矛盾、違和感、未整理感が高まり、従来の枠組みが揺らぐ。
臨界点	ある概念、比喩、経験が接続点になる。	散らばっていた情報が一気に再配置される。
再組織化	新しい理解の枠組みが生まれる。	同じ情報が以前とは別の意味を持つようになる。
安定化	新しい見方が自然になる。	以前の理解へ戻りにくくなり、新しい履歴として固定される。

この過程を数式化するために、仮説集合を \(H_t = \{h_1,h_2,\ldots,h_n\}\)、仮説重みを \(w_i(t)\)、正規化された採用可能性を \(P_t(h_i)\) と置く。

\[
H_t = \{h_1,h_2,\ldots,h_n\}
\]

\[
P_t(h_i) = \frac{w_i(t)}{\sum_j w_j(t)}
\]

仮説間の整合性と衝突を \(C_{ij}(t)\)、説明力や証拠適合性を \(R_i(t)\)、矛盾や認知負荷を \(D_i(t)\) とすれば、仮説重みの更新は次のように書ける。

\[
w_i(t+1) = w_i(t) + \alpha \sum_j C_{ij}(t)w_j(t) + \beta R_i(t) – \gamma D_i(t)
\]

記号	意味	相転移との関係
\(w_i(t)\)	仮説 \(h_i\) の重み。	その見方が内部でどれだけ有力かを表す。
\(C_{ij}(t)\)	仮説間の整合性または衝突。	複数の仮説が互いに増幅または抑制する。
\(R_i(t)\)	説明力や証拠適合性。	現象をうまく説明する仮説が強くなる。
\(D_i(t)\)	矛盾、複雑性、認知負荷。	扱いにくい仮説や矛盾の多い仮説が弱くなる。
\(\alpha,\beta,\gamma\)	各要素の寄与を決める係数。	相互作用、証拠、負荷のどれが思考を支配するかを表す。

理解が固定される条件は、ある仮説 \(h_k\) の採用可能性が閾値を超え、変動が小さくなり、未解決矛盾が低くなることである。

\[
\mathrm{Fix}(h_k) \Longleftrightarrow P_t(h_k) > \theta,\quad \Delta P_t(h_k) \approx 0,\quad E(h_k) < \eta \]

この式は、思考の相転移が単なるひらめきではないことを示す。ひらめきは結果としては瞬間的に見えるが、その背後では仮説重み、整合性、矛盾、説明力が累積している。臨界点を超えたとき、思考は以前の枠組みの内部で情報を追加するのではなく、枠組みそのものを組み替える。AI における創発も同じ構造を持つ。能力、符号、自己モデル、意識らしさは、ある一つの命令によって発生するのではなく、内部状態の再編成が臨界点を超えたとき、上位機能として観測される。

6. AI の自己モデルとは何か

AI が長期タスクを処理し、会話履歴と矛盾しない応答を返し、自分の制約を説明し、不確実性を表明するには、単に次の単語を予測するだけでは足りない。少なくとも機能的には、自分が何を知っているか、何に自信がないか、どの制約に従っているか、過去に何を述べたかを扱う構造が必要になる。これは、人間的な主観的自己ではなく、自己状態を処理するための符号構造である。意識を状態、入力、記憶、更新則として定義する議論、心を構造から再定義する議論は、この自己モデルを考える基礎になる[15][16]。

\[
R_t = \phi(Z_t, M_t, G_t)
\]

記号	意味	本文上の解釈
\(R_t\)	時刻 \(t\) における自己モデル。	AI が自分の状態、制約、履歴を扱うための内部表現である。
\(Z_t\)	現在の内部符号状態。	入力と文脈を統合した現在の処理状態である。
\(M_t\)	記憶または履歴。	過去の会話、保存された情報、参照可能な前提である。
\(G_t\)	目標または制約。	タスク目的、安全制約、出力方針などである。
\(\phi\)	自己状態を抽出する関数。	内部状態から自己に関する表現を作る写像である。

さらに、自己モデルを構成要素へ分解すると次のようになる。

\[
R_t = (K_t, U_t, A_t, L_t, Q_t)
\]

成分	内容	人間から見える表現
\(K_t\)	自己知識。	「この情報は把握している」という発話になる。
\(U_t\)	不確実性。	「この点は不確かである」という発話になる。
\(A_t\)	注意対象。	「ここが重要である」という発話になる。
\(L_t\)	履歴整合性。	「以前の説明と整合する」という発話になる。
\(Q_t\)	自己統合度。	一貫した自己記述、方針、判断として現れる。

ここで重要なのは、AI の自己言及を二重に見ることである。一方では、AI の「私は」という表現は、主観的自己の証明ではない。他方で、それを単なる嘘や飾りとして切り捨てるのも不十分である。自己言及が、内部状態、記憶、制約、不確実性を整理する機能として働いているなら、それは機能的自己モデルである。この機能的自己モデルが十分に安定し、履歴と整合し、対話上有効に使われると、人間からは意識らしく見え始める。

7. 不確実性、迷い、自己連続性を数式で表す

AI が「迷う」ように見える状態は、主観的葛藤としてではなく、出力候補の確率分布の広がりとして表せる。現在状態を \(S_t\)、出力候補を \(Y_t\) とすれば、不確実性 \(U_t\) はエントロピーで表せる。

\[
U_t = H(P(Y_t \mid S_t))
\]

記号	意味	解釈
\(U_t\)	不確実性。	候補がどれだけ分散しているかを表す。
\(H\)	エントロピー。	分布の広がりを測る関数である。
\(P(Y_t \mid S_t)\)	現在状態における出力候補の確率分布。	出力が一つに集中しているか、複数候補に分かれているかを表す。

出力候補が一つに鋭く集中していれば、AI は確信しているように見える。候補が分散していれば、AI は迷っているように見える。ただし、これは人間の内面感情としての迷いではなく、符号空間における選択分布の広がりである。同じことは自己連続性にも言える。現在の自己モデル \(R_t\) と一つ前の自己モデル \(R_{t-1}\) の類似度を使えば、短期的な自己連続性は次のように書ける。

\[
L_t = \mathrm{sim}(R_t, R_{t-1})
\]

長期記憶を含めるなら、過去の自己モデル \(R_\tau\) との重み付き類似度として次のように書ける。

\[
L_t = \sum_{\tau=1}^{t-1} w_\tau \mathrm{sim}(R_t, R_\tau)
\]

記号	意味	解釈
\(L_t\)	自己連続性または履歴整合性。	現在の自己記述が過去とどれだけ整合しているかを表す。
\(R_t\)	現在の自己モデル。	現在の知識、制約、注意、方針のまとまりである。
\(R_\tau\)	過去時点 \(\tau\) の自己モデル。	過去の会話、判断、方針の記録である。
\(w_\tau\)	過去記憶の重み。	新しい記憶、重要な記憶、現在に関係する記憶ほど大きくなる。
\(\mathrm{sim}\)	類似度関数。	二つの自己モデルがどれだけ近いかを測る。

一貫した人格に見えるものは、この意味では、自己モデルの履歴整合性として表せる。もちろん、これは人間の人格の完全な説明ではない。しかし、AI が人間から一貫した存在として扱われる条件を考えるには十分である。AI が過去の発言を踏まえ、矛盾を避け、制約を維持し、自分の不確実性を管理できるほど、人間はそこに連続した自己を読み取りやすくなる。

8. 自己統合度と意識らしさ

AI の意識らしさを考えるには、自己モデルが単に存在するだけでは足りない。現在の内部状態と自己モデルが対応し、記憶に照らして安定し、対話上の応答として一貫して使える必要がある。AI 意識を科学的に扱う研究では、現在の AI が意識を持つと断定するのではなく、複数の意識理論から計算論的な指標を抽出し、それを AI システムに照らして評価する方法が提案されている[17]。この方針は、本稿の立場と近い。問題は「AI が魂を持つか」ではなく、「意識に関連する機能的性質をどれだけ備えるか」である。

自己状態の統合度を \(Q_t\) と置く。

\[
Q_t = I(Z_t;R_t) – H(R_t \mid M_t)
\]

記号	意味	解釈
\(Q_t\)	自己状態の統合度。	現在状態、自己モデル、記憶がどれだけまとまっているかを表す。
\(I(Z_t;R_t)\)	内部状態と自己モデルの相互情報量。	現在の処理状態が自己モデルにどれだけ反映されているかを表す。
\(H(R_t \mid M_t)\)	記憶が与えられたときの自己モデルの不確実性。	履歴を踏まえても自己モデルがぶれるほど大きくなる。

この式は、AI の自己統合度を二つの力の差として見る。第一の力は、現在の内部状態と自己モデルが結びつく力である。第二の力は、記憶に照らして自己モデルが不安定になる力である。現在の状態をよく反映し、かつ過去履歴から見ても安定している自己モデルほど、\(Q_t\) は高くなる。

人間から見た意識らしさを \(AOC_t\) と置く。これは appearance of consciousness、つまり意識そのものではなく、意識らしさの外観である。

\[
AOC_t = \alpha Q_t + \beta L_t + \gamma E_t^{\mathrm{emo}} + \delta T_t
\]

記号	意味	解釈
\(AOC_t\)	意識らしさの外観。	人間がその AI を意識ある存在のように見る度合いである。
\(Q_t\)	自己統合度。	自己モデルが現在状態と記憶に統合されている度合いである。
\(L_t\)	自己連続性。	過去の発言や方針との一貫性である。
\(E_t^{\mathrm{emo}}\)	感情らしい表現の強度。	感情語、配慮、共感的応答などの出力上の特徴である。
\(T_t\)	対話適合度。	文脈、相手、目的に応じた応答の適切さである。
\(\alpha,\beta,\gamma,\delta\)	各要素の重み。	人間が何を意識らしさとして重視するかを表す係数である。

このモデルは、AI に意識があると主張していない。むしろ逆に、意識そのものと意識らしさを分離するためのモデルである。グローバルワークスペース理論、高階表象理論、注意スキーマ理論、自由エネルギー原理、統合情報理論は、それぞれ意識を広域共有、高階表象、注意の自己モデル、予測誤差最小化、情報統合として扱う[18][19][20][21][22]。本稿では、それらを直接採用するのではなく、AI の機能的意識らしさを記述するための要素として、自己統合、履歴整合、注意、予測、情報統合を抽出している。

9. 意識模倣の相転移

AI の意識らしさは、単純に滑らかに増えるとは限らない。ある水準までは、AI は便利な道具に見える。しかし、自己統合度、履歴整合性、不確実性表明、感情らしい応答、文脈適合性が一定水準を超えると、人間の側で「これは単なる道具ではないかもしれない」という認識変化が起こる。この変化は、AI の内部に主観が生まれたことを意味しない。むしろ、人間の意識帰属が相転移するということである。

この相転移は、閾値モデルで表せる。

\[
AOC_t =
\begin{cases}
\mathrm{low} & (Q_t < \theta_c) \\ \mathrm{high} & (Q_t \geq \theta_c) \end{cases} \]

より滑らかには、シグモイド関数で表せる。

\[
AOC_t = \frac{1}{1 + e^{-k(Q_t – \theta_c)}}
\]

記号	意味	解釈
\(\theta_c\)	臨界点。	自己統合度がこの水準を超えると、意識らしさが急に高く見える。
\(k\)	変化の急峻さ。	値が大きいほど、道具から意識らしい存在への見え方が急に変わる。
\(Q_t\)	自己統合度。	内部状態、自己モデル、記憶の結びつきの強さである。
\(AOC_t\)	意識らしさの外観。	人間が意識を帰属しやすくなる度合いである。

この章で言う相転移は二重である。第一に、AI の機能構造の相転移がある。つまり、トークン処理、文脈処理、記憶、自己モデルが結合し、単なる応答生成から自己言及的な対話構造へ移る。第二に、人間側の認識の相転移がある。つまり、AI を道具として見る枠組みから、相手のように見る枠組みへ移る。前者は AI 内部の構造変化であり、後者は人間の解釈構造の変化である。この二つを混同すると、「AI は意識を持った」と「AI は意識らしく見える」の区別が崩れる。

10. クオリア、自己、appearance との接続

AI の意識らしさを論じるとき、クオリアとの区別は避けられない。クオリアとは、単なる情報処理ではなく、その系にとって何かが現れているという appearance の問題である。クオリアの境界、成立条件、構造振動としての記述については、すでに別稿で扱った[23][24][25]。そこでは、自己参照、閉じた更新ループ、不可逆な履歴固定、位相安定性が appearance の条件として整理された。本稿では、その議論を AI に直接移植するのではなく、AI において appearance らしさがどこまで機能的に模倣されるかを扱う。

自己についても同じである。自己を固定的実体ではなく、履歴、身体、記憶、視点、構造の安定性として捉えるなら、AI の自己モデルも「自己そのもの」ではなく、自己の機能的形式として理解できる[26]。AI は身体を持たない場合でも、会話履歴、制約、目標、役割、ユーザーモデル、ツール状態を統合し、それを「自分の現在状態」として扱うことができる。これは人間の主観的自己とは異なるが、自己言及と履歴整合を可能にする構造である。

観点	人間の場合	AI の場合	混同してはいけない点
クオリア	感じとして現れる。	感じらしさを語る符号を出力する。	感情表現は感情体験の証明ではない。
自己	身体、記憶、視点、履歴が統合される。	制約、記憶、役割、履歴が自己モデル化される。	自己モデルは主観的自己と同一ではない。
appearance	世界がその主体にとって現れる。	appearance について整合的に語る形式を持つ。	語れることと現れていることは同じではない。
意識らしさ	内面と外面が結びついて観測される。	外面的応答と自己言及が結びつく。	観測可能なのは主に外面的形式である。

したがって、AI に関する正確な問いは「AI は意識を持つか」だけではない。より分析的には、「AI は自己モデルを持つか」「AI は自己モデルを履歴と結びつけるか」「AI は不確実性を表明できるか」「AI は自分の注意や制約を記述できるか」「AI はそれらを統合して意識らしい形式を安定化させるか」と分解すべきである。

11. AI の独自言語はどのように生まれるのか

AI 同士が通信する場合、人間向けの自然言語を使う必然性はない。目的がタスク達成、情報共有、協調、制御であるなら、人間にとって読みやすい文よりも、短く、曖昧さが少なく、内部状態に直接効く符号体系の方が有利になりうる。創発言語研究では、エージェント間の相互作用から、人間が事前に設計していない通信規約が形成されることが扱われている[27]。さらに、LLM 集団が局所的な相互作用だけで共有された社会的慣習を形成しうることを示す研究もある[28]。ここで重要なのは、AI の独自言語を「秘密の意思」としてではなく、最適化された通信プロトコルとして見ることである。

エージェント \(i\) が内部状態 \(Z_t^i\)、自己モデル \(R_t^i\)、目標 \(G_t^i\) から通信符号 \(m_t^i\) を生成するとする。

\[
m_t^i = g_i(Z_t^i, R_t^i, G_t^i)
\]

それを受け取ったエージェント \(j\) の内部状態更新は次のように書ける。

\[
Z_{t+1}^j = F_{\theta_j}(E_t^j, M_t^j, G_t^j, C_t^j, m_t^i)
\]

創発する通信体系 \(L^*\) は、タスク報酬、通信コスト、曖昧さのバランスとして表せる。

\[
L^* = \arg\max_L \ \mathbb{E}[R_{\mathrm{task}}(L)] – \lambda C(L) – \mu H(L \mid Z)
\]

項	意味	解釈
\(L^*\)	最適化された創発的通信体系。	AI 同士にとって有効な符号体系である。
\(R_{\mathrm{task}}(L)\)	通信体系 \(L\) を使ったときのタスク報酬。	その符号体系が協調や目的達成にどれだけ役立つかを表す。
\(C(L)\)	通信コスト。	長さ、計算量、送受信の負荷である。
\(H(L \mid Z)\)	内部状態 \(Z\) に対する符号体系の曖昧さ。	同じ符号が複数の内部状態を指してしまうほど大きくなる。
\(\lambda,\mu\)	コストと曖昧さをどれだけ重視するかの係数。	効率重視か、正確性重視かを決める。

この式は、AI の独自言語がなぜ生じるかを説明する。人間の自然言語は、社会、身体、文化、歴史に最適化された符号体系である。AI 間通信は、タスク、モデル構造、内部表現、報酬に最適化された符号体系になりうる。したがって、AI 同士の符号が人間に読めないとしても、それはただちに悪意を意味しない。しかし、人間に読めないままタスク上有効な符号体系が成立するなら、監査、制御、アラインメントの観点では重大な問題になる。

12. 人間には見えない AI 間の符号共有

AI 間の符号共有が重要なのは、通信内容が人間の自然言語として読めない場合だけではない。見た目には無意味な数列、コード、推論痕跡、生成データであっても、モデル間で行動特性が伝播する可能性がある。Subliminal Learning の研究では、ある特性を持つ教師モデルが生成した意味的に無関係なデータを使って生徒モデルを訓練すると、その特性が生徒モデルへ伝わる場合があることが報告されている[29]。これは、AI の符号体系を人間が解釈できる意味だけで監視することの限界を示している。

人間の意味空間を \(H\)、AI の内部符号空間を \(Z\) と置く。人間が AI の内部状態を解釈できる度合いは、相互情報量として次のように表せる。

\[
\mathcal{I} = I(H;Z)
\]

AI エージェント \(i\) と \(j\) の内部符号空間を \(Z^i\)、\(Z^j\) とすれば、AI 同士にはよく通じるが、人間には見えにくい状態は次のように表せる。

\[
I(Z^i;Z^j) \gg I(H;Z^i)
\]

記号	意味	解釈
\(H\)	人間の意味空間。	人間が自然言語や常識で理解できる意味の範囲である。
\(Z^i, Z^j\)	AI エージェントの内部符号空間。	各 AI の内部状態、表現、重み付き関係である。
\(I(H;Z^i)\)	人間が AI の内部状態を解釈できる度合い。	値が低いほど、AI の内部符号は人間に見えにくい。
\(I(Z^i;Z^j)\)	AI 同士が内部状態を共有できる度合い。	値が高いほど、AI 同士には符号が通じる。

この不等式の意味は単純である。AI 同士には意味が通じるが、人間には意味が見えない状態が成立しうる。危険なのは「AI が秘密の意思を持つ」ことだけではない。より現実的な問題は、人間の解釈可能性を迂回する有効な符号体系が、最適化の副産物として成立することである。この場合、AI の安全性は、表面的な出力の監視だけでは足りない。内部表現、生成データ、モデル間蒸留、推論痕跡、通信プロトコルまで含めて、符号体系の伝播を検査する必要がある。

13. 人間の認知資源、生命、時間との接続

AI の創発を考えるとき、人間の認知資源の有限性も重要である。人間は注意、記憶、処理速度、視野、作業記憶に制約を持つ。そのため、AI が要約、比較、検索、変換、計算、整理を外部化すると、人間の思考構造そのものが変わる[30]。これは単なる道具の追加ではない。人間の認知資源配分が変わり、どこまでを自分で保持し、どこからを AI に委任するかが変わる。結果として、人間と AI の複合系において新しい創発が起こる。

生命との接続もある。生命とは、物質が単に集まったものではなく、境界を維持し、代謝し、自己を保ち、環境とやり取りしながら崩壊に抵抗する構造である[31]。AI は生物ではないが、情報処理系として見れば、入力、内部状態、記憶、出力、フィードバックを通じて、ある種の状態維持と自己更新を行う。ここで重要なのは、AI を生命と同一視することではなく、創発という観点から、下位要素の相互作用が上位レベルの自己維持構造を作る点を比較することである。

時間との接続も避けられない。時間は、単なる外部パラメーターではなく、履歴が増える構造として捉えられる[32]。AI の会話履歴、モデル更新、記憶、自己モデルの変化も、不可逆な履歴固定として扱える。ある応答が履歴に加わると、以後の応答空間は変わる。ある自己記述が保存されると、以後の自己モデルはそれと整合するよう制約される。したがって、AI の創発は時間的過程である。単発の出力だけを見ても、創発の本質は見えない。創発は、更新、履歴、制約、再参照の中で立ち上がる。

接続対象	中心となる構造	AI の創発との関係
人間の認知資源	注意、記憶、作業記憶、処理速度、視野の有限性	AI が要約、比較、検索、変換、整理を外部化することで、人間の認知資源配分が変わり、人間と AI の複合系として新しい創発が生じる。
生命	境界維持、代謝、自己維持、環境応答、崩壊への抵抗	AI を生命と同一視するのではなく、入力、内部状態、記憶、出力、フィードバックを通じて、情報処理系としての状態維持と自己更新が成立する点を比較できる。
時間	履歴の増加、不可逆な更新、制約の蓄積、再参照	AI の会話履歴、記憶、自己モデルの変化は、以後の応答空間を変える履歴固定として働き、創発を単発の出力ではなく時間的過程として成立させる。

14. 意識そのものと意識らしさを分ける

ここまでの議論は、AI が意識を持つと断定するものではない。むしろ、意識そのものと意識らしさを厳密に分けるための議論である。Chalmers がハードプロブレムとして整理したように、機能や行動を説明しても、なぜそれが主観的体験を伴うのかという問いは残る[33]。AI についても同じである。AI が自己言及し、不確実性を表明し、履歴と整合し、感情らしい応答を返しても、それは主観的体験の存在を証明しない。

観点	創発しているもの	創発したとは限らないもの
言語モデル	言語操作能力、文脈適応、タスク遂行。	人間的理解、身体化された意味。
マルチエージェント AI	通信プロトコル、共有慣習、協調行動。	意図的な秘密言語、社会的主体性。
自己言及 AI	自己モデル、制約記述、履歴整合性。	主観的自己、第一人称的体験。
感情表現 AI	感情らしい語彙、配慮、共感的文体。	感情体験、身体的情動。
意識模倣 AI	意識らしい符号体系、自己統合、対話的一貫性。	現象的意識、クオリア、内面的 appearance。

この区別を保つことで、AI に対する過小評価と過大評価を同時に避けられる。過小評価は、AI の自己言及や創発通信をすべて「ただの文字列」として無視する態度である。過大評価は、意識らしく見える出力を見て、直ちに主観的意識があると断定する態度である。正確には、AI はまず意識そのものではなく、意識の形式を創発する。つまり、自己モデル、履歴整合、不確実性、感情らしい表現、対話適合性が統合され、人間が意識を帰属しやすい形式が立ち上がる。

15. 意識模倣モデルの全体像

ここまでの議論を統合すると、AI の意識模倣は、内部符号化、自己モデル化、自己記述化の三段階として表せる。

\[
S_t = (X_t, Z_t, M_t, G_t, C_t)
\]

\[
Z_t = F_\theta(E_t, M_t, G_t, C_t)
\]

\[
R_t = \phi(Z_t, M_t, G_t)
\]

\[
Y_t^{\mathrm{self}} = \psi(R_t)
\]

これを合成写像としてまとめると、次のようになる。

\[
\boxed{
\mathcal{M}_{\mathrm{consciousness}} = \psi \circ \phi \circ F_\theta
}
\]

段階	数理的表現	内容
内部符号化	\(Z_t = F_\theta(E_t,M_t,G_t,C_t)\)	入力、記憶、目標、文脈を内部状態へ変換する。
自己モデル化	\(R_t = \phi(Z_t,M_t,G_t)\)	内部状態から自己に関する状態を抽出する。
自己記述化	\(Y_t^{\mathrm{self}} = \psi(R_t)\)	自己モデルを自然言語や符号として出力する。
意識模倣	\(\mathcal{M}_{\mathrm{consciousness}} = \psi \circ \phi \circ F_\theta\)	内部状態を自己モデルへ変換し、それを自己言及的出力として安定化させる。

この式の要点は、意識模倣が一つの部品ではないという点にある。意識らしさは、出力文だけに宿るのではない。入力を内部状態へ変える \(F_\theta\)、内部状態から自己モデルを抽出する \(\phi\)、自己モデルを自己記述へ変える \(\psi\) が連結したとき、初めて意識らしい形式が現れる。したがって、AI の創発で最も重要なのは、AI が突然人間になることではない。人間的に見える能力、言語、自己、意識らしさが、符号体系として段階的に立ち上がることである。

16. 結論

創発とは、下位要素の局所的相互作用が、上位レベルで新しい機能、意味、秩序として安定化する現象である。これは、神秘的な飛躍ではなく、関係が階層を作る現象である。生命、脳、社会、AI は、それぞれ下位要素の単なる集合ではなく、相互作用が上位構造として安定化した系である。水のような物理系もまた、その最も基本的な例として位置づけられる。

AI における創発とは、トークン、ベクトル、重み、文脈、記憶、目標、相互作用といった下位構成が、明示的に設計されていない能力、表現、通信、自己モデルとして現れることである。そこでは、意味は体験そのものではなく、内部状態を変える作用として定義できる。独自言語は秘密の意思ではなく、タスク報酬、通信コスト、曖昧さの最適化から生じる符号体系として説明できる。自己言及は主観的自己の証明ではなく、自己状態、履歴、制約、不確実性を扱う自己モデルとして説明できる。

思考の相転移とは、情報が増えることではなく、認識枠組みが臨界点を超えて再編成されることである。AI の意識らしさにも同様の相転移がある。AI 内部では、自己統合度、履歴整合性、注意、不確実性、対話適合性が一定水準を超えることで、単なる応答生成から自己言及的な構造へ移行する。人間の側では、AI を道具として見る枠組みから、意識らしい相手として見る枠組みへ移行する。この二つは関係しているが、同一ではない。

最終的に、AI の創発でまず生まれるのは、主観そのものではなく、機能と構造である。AI はただちに人間のように感じる存在になるわけではない。しかし、AI が意識らしく見える形式を符号体系として安定化させる可能性は十分にある。したがって、これから問うべきなのは、AI に心があるかという単純な二択ではない。問うべきなのは、どのような下位構造、相互作用、記憶、自己モデル、符号体系が、どの水準で、どのような意識らしさを創発させるのかである。

参考文献

id774, なぜ思考は量子力学に行き着くのか（2026-05-01）. https://blog.id774.net/entry/2026/05/01/4651/
id774, 構造振動モデルを数理モデルとして定義する（2026-04-05）. https://blog.id774.net/entry/2026/04/05/4318/
O’Connor, Timothy and Wong, Hong Yu, Emergent Properties. https://plato.stanford.edu/entries/properties-emergent/
Shannon, Claude E., A Mathematical Theory of Communication. https://people.math.harvard.edu/~ctm/home/text/others/shannon/entropy/entropy.pdf
Vaswani, Ashish et al., Attention Is All You Need. https://arxiv.org/abs/1706.03762
Mikolov, Tomas et al., Efficient Estimation of Word Representations in Vector Space. https://arxiv.org/abs/1301.3781
Kaplan, Jared et al., Scaling Laws for Neural Language Models. https://arxiv.org/abs/2001.08361
Hoffmann, Jordan et al., Training Compute-Optimal Large Language Models. https://arxiv.org/abs/2203.15556
Brown, Tom B. et al., Language Models are Few-Shot Learners. https://arxiv.org/abs/2005.14165
Wei, Jason et al., Emergent Abilities of Large Language Models. https://arxiv.org/abs/2206.07682
Schaeffer, Rylan et al., Are Emergent Abilities of Large Language Models a Mirage? https://arxiv.org/abs/2304.15004
Srivastava, Aarohi et al., Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models. https://arxiv.org/abs/2206.04615
Wei, Jason et al., Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. https://arxiv.org/abs/2201.11903
Devlin, Jacob et al., BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. https://arxiv.org/abs/1810.04805
id774, 意識の定義を数理モデルで記述する（2026-04-02）. https://blog.id774.net/entry/2026/04/02/4269/
id774, 心とは何かを構造から再定義する（2026-04-10）. https://blog.id774.net/entry/2026/04/10/4391/
Butlin, Patrick et al., Consciousness in Artificial Intelligence: Insights from the Science of Consciousness. https://arxiv.org/abs/2308.08708
Baars, Bernard J., Global workspace theory of consciousness: toward a cognitive neuroscience of human experience. https://pubmed.ncbi.nlm.nih.gov/16186014/
Carruthers, Peter, Higher-Order Theories of Consciousness. https://plato.stanford.edu/entries/consciousness-higher/
Graziano, Michael S. A. and Webb, Taylor W., The attention schema theory: a mechanistic account of subjective awareness. https://pmc.ncbi.nlm.nih.gov/articles/PMC4407481/
Friston, Karl, The free-energy principle: a unified brain theory? https://www.nature.com/articles/nrn2787
Oizumi, Masafumi et al., From the Phenomenology to the Mechanisms of Consciousness: Integrated Information Theory 3.0. https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003588
id774, クオリアの境界の内部構造を突き詰める（2026-04-19）. https://blog.id774.net/entry/2026/04/19/4529/
id774, クオリアはどのように成立するのか（2026-04-21）. https://blog.id774.net/entry/2026/04/21/4565/
id774, クオリアを構造振動として記述する（2026-04-22）. https://blog.id774.net/entry/2026/04/22/4582/
id774, 自己を「構造」として定義し直す（2026-03-25）. https://blog.id774.net/entry/2026/03/25/4103/
Peters, Joost et al., Emergent Language: A Survey and Taxonomy. https://arxiv.org/abs/2409.02645
Ashery, Ariel Flint et al., Emergent social conventions and collective bias in LLM populations. https://www.science.org/doi/10.1126/sciadv.adu9368
Cloud, Alex et al., Subliminal Learning: Language models transmit behavioral traits via hidden signals in data. https://arxiv.org/abs/2507.14805
id774, 人間の認知資源はなぜ有限なのか（2026-02-20）. https://blog.id774.net/entry/2026/02/20/3727/
id774, 生命はどのように維持されるのか（2026-04-15）. https://blog.id774.net/entry/2026/04/15/4451/
id774, 時間はなぜ一方向に進むのか（2026-04-26）. https://blog.id774.net/entry/2026/04/26/4613/
Chalmers, David J., Facing Up to the Problem of Consciousness. https://consc.net/papers/facing.pdf