Experimental

Metacognition in Agentic Companies

AIシステムはなぜ「自分が知らないこと」を知る必要があるのか。組織の自己認識としてのガバナンス密度、安定性固有値条件、企業メタ認知の数学的基盤。

G_t = (A_t, E_t, S_t, Π_t, R_t, D_t). 安定性法則: λ_max(A) < 1 − D.

研究論文の全文を読む
数学モデル

生きたグラフとしてのエージェンティック企業。

6つの構成要素、1つのシステム。

エージェンティック企業タプル

Gt = (At, Et, St, Πt, Rt, Dt)

エージェント、エッジ、状態、ポリシー、報酬、ガバナンス密度 — あらゆる瞬間のエージェンティック企業を定義する6つの構成要素。

状態ベクトル

St = [Ft, Kt, Ht, Lt, Ct]

財務、知識、健全性、正当性、協調性 — 企業の健全性を測る5つの次元。

ロール選択

ri(t+1) = argmaxr Ui(r | Ctask, Bcomm, Dt)

各エージェントがガバナンス制約下で効用関数を最大化するロールを選択する。

A

Agents

E

Edges

S

State

Π

Policies

R

Rewards

D

Governance

状態ベクトルの構成要素

FtFinancial
KtKnowledge
HtHealth
LtLegitimacy
CtCoordination
ガバナンス密度

自己観察としての制約。

D = |制約数| / |行動空間|

ガバナンス密度

Dt = |Constraintst| / |ActionSpacet|,   0 < D < 1

ガバナンスの対象となる行動の割合。D = 0 は無政府状態。D = 1 は麻痺。

動的調整

Dtarget = clamp(base + w1·λmax + w2·anomaly + w3·Ctask − w4·Bcomm, 0.1, 0.9)

Dはスペクトル半径、異常率、タスク複雑性、通信帯域幅にリアルタイムで適応する。

なぜ制約 = メタ認知なのか

Approval gate = two agents examine a decision

Evidence requirement = forced outcome documentation

Risk threshold = escalation triggers self-examination

Compliance check = alignment with stated values

ガバナンス密度スペクトラム

D = 0 (Chaos)D = 0.45D = 1 (Stagnation)
StagnationD > 0.7

Excessive constraints freeze adaptation

Stable0.3 < D < 0.7

Optimal zone — meaningful specialization

ChaosD < 0.2

Insufficient governance — cascading failures

Dは組織体における固有受容感覚センサーの密度である。それなしには、組織は感知も一貫性の維持もできない。

安定性法則

基本定理。

λ_max(A_t) < 1 − D_t

主定理

λmax(At) < 1 − Dt

影響行列のスペクトル半径は1からガバナンス密度を引いた値を下回る必要がある。これが基本的安定性条件。

状態進化

St+1 = At · St + (I − Dt · I) · εt

状態はガバナンス(D)で減衰された影響伝搬(A)を通じて進化する。外生的摂動は密度によって制限される。

安定性マージン

δ = (1 − D) − λmax(A)

安定性マージン。大きいマージン = 速い収束。ゼロ近傍のマージン = 摂動に対する脆弱性。収束はO(1/δ)。

パラメータ空間

D (Governance Density)λmaxUnstableStableλmax = 1 − Dcurrent11

直感的理解

影響伝搬が摂動を増幅する(λ_max)。ガバナンスの減衰がそれを吸収する(1−D)。安定性の条件: 減衰 > 増幅。

相図

組織の3つの体制。

停滞 / 安定 / 混沌

ロールエントロピー

H(r) = −∑r p(r) log p(r)

ロールエントロピーは組織の健全性を測定する。低すぎる = 停滞。高すぎる = 混沌。中程度 = 安定的専門化。

Stagnation

Parameters

D > 0.7, B_comm = low

Role Entropy

Near 0 within 50 epochs

Outcome

Throughput: 15% of maximum

Stable Specialization

Parameters

0.3 < D < 0.7, B_comm = mid-high

Role Entropy

Moderate, converging

Outcome

λ_max < 1 − D (bounded)

Chaos

Parameters

D < 0.2, B_comm = high

Role Entropy

Maximum, non-converging

Outcome

Divergence within 20 epochs

ドクターシステム

異常検知 + 収束。

組織の免疫システム。

複合異常スコア

Acombined = α · s(x) + (1−α) · σ(ε(x))

Isolation Forestスコア + Autoencoder再構成誤差。デュアル検出が突発的異常と漸進的ドリフトの両方を捕捉。

収束条件

limt→∞ E[||St+1 − St||] = 0

状態変化がゼロに近づくときシステムは収束する。有界な勾配、安定したD、Doctorの介入が必要。

応答閾値

< 0.85NormalFull autonomy
0.85 – 0.92Soft Throttle50% autonomy reduction
> 0.92Hard FreezeComplete halt

Bounded Policy Gradients

Gate-constrained RL framework limits update magnitude

Stable Governance Density

Momentum + rate limiters prevent oscillation

Doctor Intervention

Catch runaway agents before cascading failure

MARIA OS Mapping

Graph G
Decision Graph(Organizational structure)
Density D
Gate Engine(Governance controller)
Reward R
Evidence Layer(Outcome verification)
Anomaly
Doctor System(Safety net)

研究論文の全文を読む

Metacognition in Agentic Companies