要旨
111 の自律エージェントがガバナンスの枠組み内で意思決定プロセスに協力する場合、責任の割り当ての問題が分散システムの問題になります。責任が静的で設計時に決定される従来のソフトウェアとは異なり、マルチエージェント ガバナンス システムは動的な責任の伝播を示します。つまり、意思決定が提案から実行までパイプラインを通過するにつれて、責任はエージェント間で転送され、レビュー ポイントで蓄積され、協調的な意思決定ノード全体に拡散されます。この伝播チェーンのいずれかの段階で責任を適切に移転できなかった場合、責任のギャップが生じます。つまり、エージェントや人間が責任を負うことのできない意思決定の結果が生じます。
この論文は、拡散プロセスの数学を使用して、Planet 100 の 111 エージェント ネットワークにおける責任の伝播をモデル化します。各エージェントを、エージェント通信グラフ上の離散拡散方程式に従って時間の経過とともに発展するスカラー責任ポテンシャル rho(a_j, t) を持つノードとして扱います。各エッジのコンダクタンスは、信頼レベル、通信帯域幅、エージェント ペア間のガバナンス ゲートの強度によって決まります。フェールクローズ ゲートの要件をエンコードする境界条件を導き出します。つまり、責任はシステムから流出することはできず (保全)、単一ノードに無限に蓄積することはできません (容量制約)。
私たちの主な理論的貢献は 責任保存定理 です。これは、フェールクローズされたゲートの下で動作する接続されたエージェント ネットワークでは、すべてのエージェントにわたる総責任積分はすべてのパイプライン遷移にわたって一定であると述べています。発散定理の離散的な類似物を使用してこの定理を証明し、フェールクローズ ゲートがすべてのネットワーク境界で正しく実装されていれば、エージェントの障害、ネットワークの分断、動的なトポロジの変更が存在する場合でもこの定理が成り立つことを示します。
実験的に、責任が安全なしきい値を超えて蓄積する Planet 100 ネットワーク内の 3 つのボトルネック ゾーンを特定し、これらのボトルネックを軽減するための最適なゲート配置戦略を導き出し、フェールクローズ アーキテクチャによって責任ギャップ インシデントが 2.3% (フェールオープン ベースラインで) から 0.03% に減少することを実証しました。これは、ガバナンスの完全性が 77 倍向上したものです。
1. はじめに
自動化システムにおける責任の概念は伝統的に、エンティティが結果に対して責任を負うか、そうでないかという二項述語として扱われてきました。このバイナリ フレーミングは、単一のエージェントが単一のアクションを実行する単純なシステムには十分ですが、マルチエージェント ガバナンス ネットワークでは壊滅的に破綻します。 Planet 100 では、単一の決定が実行に至るまでに 4 ~ 6 つのゾーンにわたる 8 ~ 15 人のエージェントを横断し、各エージェントが部分的な評価、変更、または承認に貢献します。責任は単一の割り当てではなく、トラバーサル全体にわたって追跡、保存、監査される必要がある継続的なフローです。
MARIA OS 意思決定パイプラインは、すべての意思決定に対して 6 つの正規状態 (提案、検証、承認要求、承認、実行、完了 (または失敗)) を定義します。各状態遷移には、決定を進めるアクションを実行する少なくとも 1 人のエージェントが含まれます。各遷移では、遷移を開始したエージェントから次の状態を処理するエージェントに責任を明確に移す必要があります。受信エージェントが利用できない場合、決定は続行できません (フェールクローズ)。遷移があいまいな場合 (複数のエージェントが次の状態を処理できる場合)、システムは責任のあるエージェントを 1 人選択し、その割り当てを不変の監査ログに記録する必要があります。
この文書では、Planet 100 ネットワークにおける責任の伝播に関する 3 つの基本的な質問について説明します。 (1) どのような条件下で、全体の責任はネットワーク全体で保存されますか? (2) 責任のボトルネックはどこに形成され、ガバナンスのスループットにどのように影響しますか? (3) 伝播遅延を最小限に抑えながら責任のギャップを防ぐためのフェールクローズ ゲートの最適な配置は何ですか?
2. 責任伝播の普及モデル
2.1 問題の定式化
Planet 100 のエージェント ネットワークを重み付き有向グラフ G = (V, E, W) としてモデル化します。ここで、V = {a_1, a_2, ..., a_111} はエージェントのセット、E は有向通信エッジのセット、W: E -> R+ は各エッジにコンダクタンスの重みを割り当てます。エージェント a_i と a_j 間のコンダクタンス w_{ij} は次のように定義されます。
w_{ij} = tau_{ij} B_{ij} g_{ij}
ここで、[0,1] の tau_{ij} は信頼スコア (過去のインタラクション品質から導出)、B_{ij} は通信帯域幅 (サイクルごとのメッセージ)、[0,1] の g_{ij} はゲート透過性 (ゲートなしの場合は 1、完全に閉じたゲートの場合は 0、確率的ゲートの場合は中間値) です。この定式化は電気コンダクタンスに直接対応するため、回路理論ツールを責任解析に適用できるようになります。
2.2 責任拡散方程式
時間 t におけるエージェント a_j の責任ポテンシャル rho(a_j, t) は、離散拡散方程式に従って展開されます。
d(rho_j)/dt = sum_{i in N(j)} w_{ij} * (rho_i - rho_j) + S_j(t) - D_j(t)
ここで、N(j) は a_j の近傍のセット、S_j(t) はソース項 (a_j が決定を開始するときに作成される新しい責任)、D_j(t) はドレイン項 (a_j がアクションを完了して証拠を記録するときに解放される責任) です。行列表記では、これは次のようになります。
d(rho)/dt = -L * rho + S(t) - D(t)
ここで、L = Deg - W はグラフのラプラシアン、Deg は対角次数行列、rho、S、D は 111 個のエージェントすべてにわたるベクトルです。これはエージェント グラフ上の離散熱方程式であり、責任は温度の役割を果たし、コンダクタンスは熱伝導率の役割を果たし、ソース/ドレイン項は意思決定の作成と完了を表します。
2.3 境界条件: フェイルクローズされたゲート
責任拡散と物理的熱伝導の決定的な違いは、境界条件にあります。熱伝導では、境界は断熱性がある場合 (Neumann)、または一定の温度に保たれる場合 (Dirichlet) があります。責任の伝播では、フェイルクローズ境界条件を課します。
- 漏れがない条件: 境界エージェント a_b (ネットワークのエッジまたはゾーン境界にあるエージェント) について、正味の外部への責任フラックスは負ではない必要があります: sum_{j in external} w_{bj} * (rho_b - rho_j) >= 0。これにより、責任が管理されたネットワークから漏れないことが保証されます。
- 容量制約: どのエージェント a_j についても、常に rho_j(t) <= rho_max_j です。潜在的な責任がエージェントの能力を超える場合、受信する責任フローはブロックされ (ゲートが閉じられ)、人間のレビュー担当者が介入するまで上流のエージェントが責任を保持します。
- 保存積分: 全責任積分 R_total = sum_{j=1}^{111} rho_j(t) は、R_total(t) = R_total(0) +integral_0^t [sum_j S_j(s) - sum_j D_j(s)] ds を満たさなければなりません。これは、明示的な作成(新しい決定)と明示的な解除(証拠のある完了した行動)によってのみ、全体的な責任が変化すると述べています。
3. 責任保存定理
3.1 声明
定理 (責任保全)。 G = (V, E, W) を、セクション 2.3 で定義されているフェールクローズ境界条件下で動作する接続されたエージェント ネットワークとします。時刻 t_0 にパイプラインに入り、時刻 t_f に最終状態 (完了または失敗) に達する意思決定 d の場合、すべてのエージェントにわたって意思決定 d に割り当てられる責任の合計は、[t_0, t_f] の各タイム ステップ t でちょうど 1.0 になります。
sum_{j=1}^{|V|} rho_j^d(t) = 1.0、[t_0, t_f] のすべての t について
ここで、rho_j^d(t) は、時刻 t においてエージェント a_j が持つ決定 d に対する責任の割合です。
3.2 校正スケッチ
証明は 3 つのステップで進みます。まず、拡散演算子 L が責任ベクトルの総質量を保存することを示します。L はグラフ ラプラシアンなので、各行の合計はゼロになるため、1^T L rho = 0 になります。つまり、拡散だけでは責任を作成または破壊できないことを意味します。次に、ソース項とドレイン項が対になっていることを示します。すべてのソース イベント S_j(t) = デルタ (意思決定生成) は、将来のある時点のドレイン イベントと一致し、フェールクローズ条件により、対応する責任保持者なしではドレインが発生しないことが保証されます。第三に、容量の制約と漏れのない条件により、境界効果によって責任がシステムから外に出ることが防止されることを示します。
正式な証明では、ガウスの発散定理の離散的な類似物が使用されます。責任フラックス Phi_{ij} = w_{ij} * (rho_i - rho_j) を a_i から a_j への責任フローとして定義します。ノード a_j での発散は div(Phi)_j = sum_{i in N(j)} Phi_{ij} です。離散発散定理により、任意のサブグラフにわたる合計発散は正味境界束に等しくなります。フェールクローズ状態では、ネットワーク全体の境界磁束はゼロとなり、保存結果が得られます。
3.3 ガバナンスへの影響
責任保全定理は、Planet 100 のガバナンス アーキテクチャに対して 3 つの直接的な実践的な影響を及ぼします。
1. 孤立した決定がない: パイプライン内のすべての決定には、エージェント ネットワーク全体に分散される責任単位が 1 つだけあります。責任ギャップ (責任のあるエージェントが存在しない) では、合計が 1.0 を下回る必要がありますが、定理ではこれが禁止されています。 2. 責任の膨張なし: 複数のエージェントがそれぞれ、同じ決定に対する全責任を主張することはできません。合計は 1.0 に制限されており、全員が責任を負う (したがって誰も責任を負わない) 場合に生じる責任の希薄化を防ぎます。 3. 監査可能な転送: エージェント間のすべての責任の転送は、decion_transitions テーブルに記録される拡散フロー イベントであり、すべての決定に対して不変の管理連鎖が作成されます。
4. ボトルネックの特定と分析
4.1 責任蓄積指標
エージェント a_j の責任累積指数 (RAI) を時間平均責任潜在力として定義します。
RAI(a_j) = (1/T) * 積分_0^T rho_j(t) dt
RAI が高いエージェントは、一貫して重大な責任負荷を抱えており、意図的な設計の選択 (エージェントが上級レビュー担当者である) か、構造的なボトルネック (エージェントが意思決定フロー グラフのチョーク ポイントである) を示しています。 RAI をエージェントの設計された責任予算 RAI_budget(a_j) と比較することで、これらのケースを区別します。 RAI > 1.5 * RAI_budget の場合、エージェントに潜在的なボトルネックとしてフラグを立てます。
4.2 プラネット 100 で特定されたボトルネック
10,000 シミュレーション サイクルの分析により、3 つの永続的なボトルネック ゾーンが特定されました。
| Bottleneck | Location | RAI / Budget | Root Cause |
|---|---|---|---|
| BN-1 | Z4 Auditor cluster (A3, A7, A11) | 2.8x | All cross-zone decisions require audit sign-off; 3 auditors handle 67% of audit load |
| BN-2 | Z1 Strategist hub (A1, A2) | 2.1x | Long-range planning decisions queue behind 2 senior strategists |
| BN-3 | Z9 Executor gateway (A1, A2, A3) | 1.9x | Final-stage execution gates concentrate responsibility at 3 executors |
4.3 ボトルネック解消戦略
ボトルネックごとに、拡散モデルに基づいて最適な救済戦略を導き出します。主なメカニズムは ゲート再配分 です。並列コンダクタンス パスを追加することで、ガバナンスの完全性を損なうことなく責任をボトルネックの周りに流すことができます。 BN-1 (監査人のボトルネック) については、階層型監査プロトコルを導入します。このプロトコルでは、低リスクの決定 (リスク スコア < 0.3) が、アナリストとオブザーバーの役割から抽出された 5 人のエージェントからなる二次監査プールにルーティングされ、一次監査者の RAI 予算が 2.8 倍から 1.3 倍に削減されます。二次監査人は依然としてフェールクローズド・ゲートを適用しているため、ガバナンス・カバレッジは 99.97% のままです。単に、高リスク項目についてエスカレーションを必要とする権限のしきい値が低いだけです。
5. 意思決定の伝播レイテンシー
5.1 レイテンシーモデル
決定の伝播待ち時間 d は、提案 (t_proused) から最終状態 (t_completed または t_failed) までの合計時間です。このレイテンシは、次の 3 つの要素に分解されます。
T_total = T_diffusion + T_gate + T_queue
ここで、T_diffusion はエージェント間で責任が流れる時間 (拡散方程式の時定数によって決定)、T_gate は意思決定パス上のすべてのフェールクローズされたゲートにわたる合計ゲート評価時間、T_queue はボトルネック エージェントでのキュー遅延です。 Planet 100 では、経験的なレイテンシ分布は平均 247 ミリ秒、中央値 198 ミリ秒、99 パーセンタイル 418 ミリ秒です。
5.2 レイテンシーとガバナンスのトレードオフ
伝播レイテンシーとガバナンス適用範囲の間のトレードオフをパレート最適化問題として形式化します。 G_cov がガバナンス カバレッジ (完全な責任チェーンを持つ意思決定の割合) を表し、T_99 が 99 パーセンタイルのレイテンシーを表すものとします。パレートフロンティアは、[0, 1] の集約ゲート強度ガンマによってパラメーター化されます。
G_cov(ガンマ) = 1 - イプシロン exp(-k_g ガンマ)、および T_99(ガンマ) = T_base + デルタ * ガンマ^2
ここで、epsilon = 0.023、k_g = 4.7、T_base = 120ms、delta = 680ms は、Planet 100 データから当てはめられています。最適な動作点は gamma* = 0.72 で発生し、G_cov = 99.97%、T_99 = 473ms となります。これにより、フェールクローズ ゲートが 111 エージェント ネットワークに対して 500 ミリ秒未満の遅延でほぼ完璧なガバナンス カバレッジを達成できることが確認されました。
6. 実験による検証
6.1 フェールオープンとフェールクローズの比較
不確実性が高い場合にゲートがデフォルトでアクションを許可するフェールオープン ベースラインとフェールクローズド アーキテクチャを比較します。 50,000 を超える意思決定パイプラインの走査:
| Metric | Fail-Open | Fail-Closed | Improvement |
|---|---|---|---|
| Responsibility gaps | 2.31% | 0.03% | 77x reduction |
| Orphaned decisions | 1.14% | 0.00% | Complete elimination |
| Mean latency | 189ms | 247ms | +30.7% overhead |
| 99th percentile latency | 312ms | 418ms | +34.0% overhead |
| Post-hoc audit failures | 4.7% | 0.12% | 39x reduction |
フェールクローズド アーキテクチャにより、レイテンシのオーバーヘッドはわずか (30 ~ 34%) になりますが、ガバナンスの完全性が大幅に向上します。責任のギャップが 77 分の 1 に減少し、孤立した決定が完全に排除されたことで、責任保存定理の理論的予測が検証されました。
6.2 ネットワークパーティションに対する感度
エージェントのサブセットを切断するネットワーク パーティションをシミュレートすることで、システムの回復力をテストします。パーティションが k エージェントをメイン ネットワークから分離すると、フェールクローズド アーキテクチャにより、2 拡散タイム ステップ (< 50ms) 以内にパーティション境界を越える通信を必要とするすべての意思決定フローが正しく停止されます。保存定理は各パーティション内で独立して保持され続け、パーティションが回復すると決定が正しく再開されます。対照的に、フェールオープン ベースラインでは、パーティション間の意思決定の 34% が不完全な責任チェーンで続行され、回復不能な監査エラーが発生します。
7. 結論
高密度エージェント ネットワークにおける責任の伝播は、単なる実装の詳細ではなく、マルチエージェント ガバナンス システムが信頼できるかどうかを決定する基本的な特性です。この論文で紹介されている拡散モデルは、Planet 100 のような大規模エージェント ネットワークを設計および運用するための理論的保証 (保存定理) と実用的なツール (ボトルネックの特定、ゲートの最適化、待ち時間分析) の両方を提供します。
中心的な洞察は、責任は物理学における保存量のように振る舞うということです。責任は作成したり破壊したりすることはできず、明確に定義されたチャネルを通じてのみエージェント間で伝達されます。フェールクローズド ゲート アーキテクチャは、この保存則をシステム レベルで強制し、提案から完了まですべての意思決定に責任の途切れのない連鎖を保証します。 MARIA OS は 111 のエージェントを超えて Planet 500 および Planet 1000 まで拡張できるため、ここで確立された数学的フレームワークは、ネットワークのサイズ、トポロジー、エージェントの障害パターンに関係なく、ガバナンスの整合性が維持されることを証明するための基盤を提供します。
今後の作業では、信頼レベルとワークロード パターンの変化に適応する時変コンダクタンスを組み込むように普及モデルを拡張し、人間の介入なしに自動ゲート リバランスをトリガーできるリアルタイムのボトルネック検出のための分散アルゴリズムを開発する予定です。