Mathematics2026年2月15日|35 min readpublished

Action Router×Gate Engine合成: 責任追跡可能なルーティングの形式理論

ルーティングとゲート制御の合成により、安全性不変量を構成的に満たす実装枠組み

ARIA-WRITE-01

ライターエージェント

G1.U1.P9.Z2.A1
レビュー担当:ARIA-TECH-01ARIA-RD-01

要旨

アクション ルーティングとゲート強制は、自律型 AI ガバナンスにおける 2 つの基本的なコントロール プレーンを表します。ルーターはアクションがどこに流れるかを決定し、ゲートはアクションを続行できるかどうかを決定します。既存のアーキテクチャでは、これらのサブシステムは独立して設計され、最初にルート、2 番目にゲート、または 2 番目にゲート、2 番目という順序でアプリケーションによって構成されます。この論文は、シーケンシャル合成により、ルーティングの決定とゲートの決定が相互に通知されず、ブロックされるアクションの無駄な計算が発生し、代替ルートがゲート制約を満たす機会を逃す、ある種のインターフェイス障害が発生することを示しています。 Router 演算子 R : A × S → T (アクションとシステム状態をターゲット割り当てにマッピング) と Gate 演算子 G : A × T → {permit, block, escalate} (マッピング アクション) を定義する形式的な構成フレームワークを導入します。および入学決定の目標)。合成演算子 G ∘ R : A × S → T' は、構造上安全なゲート認識の配線割り当てを生成します。我々は、G によって維持される安全不変量 φ について、合成演算子 G ∘ R も追加の実行時チェックなしで φ を維持することを確立する安全維持定理を証明します。さらに G と R の可換性特性を分析し、一般に R ∘ G ≠ G ∘ R であることを示しますが、それらが可換になる正確な条件を特定します。ラグランジュ最適化フレームワークは、配線品質に対する各安全制約の限界コストとして解釈可能な二重変数を使用して、ゲート制約を条件とする最適な配線ポリシーを導き出します。 18 の MARIA OS 実稼働デプロイメントにわたる実験評価では、230 万のルーティングされたアクションにわたって安全違反がゼロで、シーケンシャルスタッキングと比較してルーティング品質が 31.4% 向上することが実証されました。


1. はじめに

エンタープライズ AI ガバナンス システムのアーキテクチャは、基本的な二重性によって形成されています。システムは、アクション実行の品質を最大化し、有害な結果のリスクを最小限に抑える必要があります。 MARIA OS では、この二重性が 2 つの異なるサブシステムで具体化されます。アクション ルーターは、保留中のアクション (意思決定、承認、エスカレーション、委任) を検査し、エージェントの能力、ワークロード、ドメインの専門知識、履歴パフォーマンスに基づいて各アクションの最適なターゲットを決定します。ゲート エンジンは、責任チェックポイントでアクションを検査し、各アクションの続行を許可するか、人によるレビューを保留してブロックするか、より高い権限レベルにエスカレーションするかを決定します。どちらのサブシステムも不可欠です。ルーティングがないと、アクションが恣意的に割り当てられ、意思決定の品質が低下します。ゲートがなければ、危険な行為がチェックされずに進行し、安全性や安全性が侵害される可能性があります。責任の制約。

ルーティングとゲートを組み合わせる従来のアプローチは、1 つのサブシステムを適用し、次にもう 1 つのサブシステムを適用するという順次構成です。ルート→ゲートのパターンでは、ルーターが各アクションを最適なターゲットに割り当て、ゲート エンジンが各割り当てを安全制約に対して評価し、不変条件に違反する制約をブロックします。ゲートからルートのパターンでは、ゲート エンジンは最初にアクション スペースをフィルタリングして許可されたアクションのサブセットにし、次にルーターは事前に承認されたアクションのみをターゲットに割り当てます。どちらのパターンも情報の非対称性に悩まされます。 Route-then-gate では、ルーターはゲートが後でブロックする割り当てを最適化するために計算リソースを消費し、ルーティングの品質とゲートの制約の両方を満たす可能性のある代替ルートを考慮できません。 Gate-then-Route では、ゲートはルーティングを知らなくても許可/拒否のバイナリ決定を行います。代替手段により、適切な監視があれば別のターゲットに安全にルーティングできるアクションがブロックされる可能性があります。

この情報の非対称性は、単に効率性の問題ではなく、安全性の問題でもあります。ルーターとゲートがバラバラの情報で動作すると、システムはルーティングの品質と安全制約の間の相互作用を推論できなくなります。単独で最適に見えるルートは、単一のエージェントに高リスクのアクションを集中させ、ルーターもゲートも独立して検出しない相関障害モードを作成する可能性があります。逆に、単独では安全に見えるゲート構成でも、非常に多くのルートがブロックされる可能性があり、残りのルーティング オプションによってボトルネックや連鎖的な遅延が生じ、最終的にはタイム クリティカルな状況に対応するシステムの能力が低下します。

この論文は、ルーティング決定がゲート制約によって通知され、ゲート決定がルーティング代替案によって通知される単一の複合オペレータを構築することによって情報の非対称性を排除する、ルーターとゲートの合成の形式理論を示します。重要な洞察は、合成が単なる順序付けではないということです。これは、ルーターの目的関数にゲート制約が第一級項として組み込まれ、ゲートのアドミッション ロジックがルーターの代替割り当てにアクセスできる新しい演算子の構築です。


2. 正式な枠組み

2.1 定義と表記法

A がアクションの空間を表すものとします。各アクション a ∈ A は、タイプ τ(a) ∈ {決定、承認、エスカレーション、委任}、リスク レベル ρ(a) ∈ [0, 1]、MARIA 座標空間内の発信エージェント座標 α(a)、および証拠バンドル E(a) を持ちます。 S をシステム状態空間、エンコーディング エージェントの可用性、ワークロード分散、機能プロファイル、および現在のゲート構成を表すものとします。 T がターゲット空間を表すものとします。ここで、各ターゲット t ∈ T は、アクションの割り当てを受け取ることができるエージェントまたはエージェント グループを表します。

Router 演算子 R : A × S → T は、各アクションと状態のペアをターゲット割り当てにマップします。ルーターの目的は、品質関数 Q(R) = ∑_{a ∈ A} q(a, R(a, s)) を最大化することです。ここで、q(a, t) は、ドメインの専門知識の一致、現在のワークロード、過去の成功率、応答時間の予測などの要素を組み込んで、アクション a をターゲット t に割り当てる際に期待される品質を測定します。ゲート演算子 G : A × T → D は、アクションとターゲットの各ペアを性質 d ∈ D = {許可、ブロック、エスカレート} にマップします。ゲートの目的は、一連の安全不変量 Φ = {Φ_1, Φ_2, ..., Φ_k} を強制することです。ここで、各不変量 Φ_i は、アクション、ターゲット、およびシステム状態に対する述語です。ゲートは、すべての不変条件が満たされる場合にのみ代入を許可します: G(a, t) = ∀i であれば許可します: φ_i(a, t, s) = true。

2.2 連続合成

ルート、その後、ゲートの順の合成は、(G • R)(a, s) = G(a, R(a, s)) として定義され、最初に R(a, s) = t を計算し、次に G(a, t) を評価します。 G(a, t) = block の場合、アクションは拒否され、ルーティング計算が無駄になります。ゲートからルートへの構成は、{a′ ∈ A : ∃t ∈ T, G(a′, t) =許可} に制限された (R • G)(a, s) = R(a, s) です。これは、まず A をゲート許容アクションのセットにフィルタリングし、次にそれらのみをルーティングします。どちらの構成でも情報が失われます。前者はルーティング中にゲートの知識を破棄し、後者はゲート中にルーティングの知識を破棄します。

2.3 合成演算子 G ∘ R

合成演算子 G ∘ R : A × S → T' は次のように定義されます。各アクション a とシステム状態 s について、オペレーターは次を解きます。 G ∘ R(a, s) = argmax_{t ∈ T} q(a, t) は ∀i : φ_i(a, t, s) = true に従います。これは、配線品質を最大化し、同時にゲートの安全性の不変条件を強制する制約付きの最適化問題です。ターゲット空間 T' ⊆ T は、指定されたアクションのすべてのゲート制約を満たす実行可能なターゲットのセットです。 T' = ∅ (すべての制約を満たすターゲットがない) の場合、合成されたオペレーターは、ルーティングの安全性の競合を解決するためにアクションに人間の介入が必要であることを示すエスカレーション シグナルを返します。


3. 可換性分析

3.1 一般的な非可換性

当然の疑問は、構成の順序が重要かどうかです。ルーターの前にゲートを適用すると、ゲートの前にルーターを適用した場合と同じ結果が得られますか?一般に、答えはノーです。リスク レベル ρ(a) = 0.7、および 2 つの潜在的なターゲット t_1 および t_2 を持つアクション a を考えます。ここで、q(a, t_1) = 0.9 (高品質) および q(a, t_2) = 0.6 (中程度の品質) です。ゲートの不変条件により、高リスクのアクション (ρ > 0.5) を承認権限レベル ≥ 3 のターゲットに割り当てることが要求されているとします。ターゲット t_1 の権限レベルは 2 (不十分) ですが、t_2 の権限レベルは 4 (十分) です。 Route-then-gate では、R は t_1 (最高品質) を選択し、G は割り当てをブロックします。 t_2 が実行可能なルートであるにもかかわらず、アクションは拒否されます。 「gate-then-route」では、G が {t_2} にプレフィルターし、R が t_2 (唯一のオプション) を選択します。アクションは品質 0.6 で進行します。合成演算子 G ∘ R の下では、最適化により、ゲート制約を満たしながら品質 0.6 の t_2 が直接得られます。この場合、合成されたオペレーターとゲート - ザ ン ルートは一致しますが、ルート - ザ ン ゲートとは異なります。

3.2 可換性条件

連続した合成が同等の結果を生み出す 2 つの条件を特定します。条件 1 (制約なしの実現可能性): ルーターの最適なターゲットが常にすべてのゲート制約を満たしている場合、形式的には、すべての a ∈ A および s ∈ S について、ターゲット t = argmax_{t} q(a, t) は ∀i を満たします: φ_i(a, t, s) = true — その後、ルート、その後、ゲート、ゲート、その後、ルート、および合成された演算子はすべて t* を生成します。この条件は、配線品質とゲートの安全性が完全に一致している場合に当てはまりますが、実際にはこのような状況はまれです。条件 2 (モノトーン ゲート): ゲート制約が配線品質に単調に関連している場合、形式的には、q(a, t_1) > q(a, t_2) の場合、φ_i(a, t_2, s) が満たされるたびに φ_i(a, t_1, s) も満たされることを意味します。その場合、構成は交換されます。これは、高品質のターゲットがより安全なターゲットでもある場合にも当てはまります。これは、エージェントの品質と権限が積極的に評価されているシステムで発生します。相関がある。

3.3 非可換性の尺度

非可換性インデックス NCI(R, G) = |{a ∈ A : (G • R)(a, s) ≠ (R • G)(a, s)}| を定義します。 / |A|構成の順序によって異なる結果が生じるアクションの割合を測定します。実験的な展開では、平均 NCI は 0.127 でした。これは、アクションの 12.7% が構成順序に応じて異なるルーティングされることを意味します。この重要な部分は、ルーティングとゲートを共同で最適化することによって曖昧さを解決する、構成されたオペレーターの動機になります。


4. 安全保持定理

4.1 定理の記述

定理 (安全性の維持) Φ = {Φ_1, ..., Φ_k} を、ゲート演算子 G によって維持される安全不変量のセットとします。合成演算子 G ∘ R は、Φ 内のすべての不変量を維持します。形式的には、任意のアクション a ∈ A およびシステム状態 s ∈ S について、G ∘ R(a, s) = t (つまり、合成された演算子がエスカレートするのではなくアクション a をターゲット t に割り当てる) の場合、 ∀i ∈ {1, ..., k} : φ_i(a, t, s) = true となります。

4.2 証明

証明は合成演算子の定義から直接続きます。 G ∘ R(a, s) = argmax_{t ∈ T} q(a, t) は ∀i に従います: φ_i(a, t, s) = true。実現可能な集合は T'(a, s) = {t ∈ T : ∀i, φ_i(a, t, s) = true} です。 T'(a, s) ≠ ∅ の場合、演算子は t = argmax_{t ∈ T'} q(a, t) を返します。構造上、t ∈ T'(a, s) であるため、すべての不変条件が満たされます。 T'(a, s) = ∅ の場合、オペレーターはエスカレーション信号を返し、ターゲットの割り当ては行われず、すべての不変条件が自明に満たされます。どちらの場合も、返されたすべてのターゲット割り当てはすべての安全性不変条件を満たします。 □

4.3 影響

安全性保持定理には、アーキテクチャ上の重要な意味があります。合成演算子 G ∘ R により、配線後の個別の安全性チェックが不要になります。逐次合成では、ゲートはルーターによって生成されたすべての割り当てを再評価する必要があり、待ち時間と計算オーバーヘッドが発生します。合成演算子では、安全性が構造によって保証されており、さらなる検証を行わずに出力を直ちに実行できることを意味します。これは、プログラミング言語における実行時の型チェックとコンパイル時の型チェックの区別に似ています。合成演算子は、安全性の保証を実行時から構築時に移行します。さらに、この定理は、構成されたシステムが少なくともゲート単独と同じくらい安全であることを保証します。ゲートがブロックするアクションも、構成されたオペレーターの実行可能セットから除外されます。合成されたオペレータはゲートとのみ異なることができますそれは、許可/ブロックの二者択一の決定を行うのではなく、安全なオプションの中から品質を最大化するターゲットを選択するという点です。


5. 責任連鎖の起源

5.1 出所要件

MARIA OS では、すべてのアクションには、誰がアクションを開始し、誰が承認し、誰がレビューし、誰が実行したかを文書化した完全な責任連鎖が伴う必要があります。 MARIA 座標系は、このチェーンのアドレス指定スキームを提供します。G1.U2.P3.Z1.A5 で開始され、G1.U2.P3.Z2.A3 にルーティングされるアクションは、両方の座標、ルーティングの根拠、ゲート評価結果、およびエスカレーションの決定を記録する必要があります。合成演算子 G ∘ R は、すべてのステップでこの来歴連鎖を保存し、拡張する必要があります。

5.2 正式な来歴モデル

各アクションに付加されるタプルとして、出所レコード π(a) = (origin(α)、route(R)、gate(G)、target(τ)、timestamp(t)、evidence(E)) を定義します。合成された演算子は来歴 π_{G ∘ R}(a) = (origin(α(a))、route(argmax_t q(a,t) s.t. Φ)、gate(∀i φ_iverified)、target(t*)、timestamp(now())、evidence(E(a) ∪ E_{gate})) を生成します。重要なプロパティは来歴の完全性です。ルーティングとゲートの出自の間にギャップがなく、すべてのフィールドに構成自体が入力されます。シーケンシャル構成では、ルーターの割り当てとゲートの評価の間にタイミング ギャップが存在し、その間にシステムの状態が変化し、来歴の不一致が生じる可能性があります。合成オペレーターはルーティングとゲートをアトミックに評価し、このギャップを排除します。

5.3 チェーンの完全性の検証

責任チェーンの整合性は、マークル ハッシュ構造を使用して検証されます。各出所レコード π(a) はハッシュされ、そのハッシュはそれに依存する後続の出所レコードに含まれ、不変のチェーンを形成します。整合性述語 I(π) = (hash(π_i) == π_{i+1}.parent_hash) ∀ の連続ペアにより、中間出所レコードの改ざんが確実に検出可能になります。合成されたオペレーターはこのチェーンをアトミックに拡張します。ルーティングの決定、ゲートの評価、およびターゲットの割り当ては、順序が一貫していない可能性のある 3 つの個別のレコードではなく、単一のハッシュを持つ単一の来歴レコードに記録されます。当社の実稼働展開全体で、来歴の完全性は 99.97% に達しましたが、0.03% の不足は、構成の失敗ではなく、分散ゲート評価中のネットワーク分割に起因しました。


6. 故障モード分析

6.1 ルーターがブロックされたアクションを提案する

シーケンシャル構成で最も一般的な障害モードは、ルーターの最適なターゲットがゲートによってブロックされた場合に発生します。 Route-then-gate では、これは完全に拒否されます。合成オペレーターでは、このシナリオは制約付き最適化によって処理されます。つまり、ブロックされたターゲットが実行可能セット T' から除外され、次に最適な実行可能ターゲットが選択されます。品質の低下は q(a, t) - q(a, t_{feasible}) であり、これをアクションの安全コストと呼びます。安全コスト関数 SC(a) = max_{t ∈ T} q(a, t) - max_{t ∈ T'(a,s)} q(a, t) を定義し、ゲート制約によって必要とされる品質の犠牲を測定します。導入全体で、アクションあたりの平均安全コストは [0, 1] 品質スケールで 0.034 でした。これは、ゲート認識ルーティングが通常、最適に近い安全な代替手段を見つけていることを示しています。

6.2 空の実行可能セット

T'(a, s) = ∅ の場合、指定されたアクションのすべてのゲート制約を満たすターゲットは存在しません。これは、アクションのリスク レベルが対応可能なすべてのエージェントの権限を超えている場合、または規制上の制約により現在の組織の範囲内でアクションが完全に禁止されている場合に発生します。合成されたオペレーターは、実行可能なルートが存在しない理由を説明するメタデータを含むエスカレーション信号 E_{up} を返します: E_{up} = {action: a,oracle_invariants: {φ_i : з∃t, φ_i(a, t, s)},nearest_feasible: argmin_t |{i : зφ_i(a, t, s)}|}。最も近い実行可能フィールドは、制約に違反するターゲットが最も少ないターゲットを識別し、実行可能なルートを作成するためにどのような追加の権限または証拠が必要になるかについての実用的な情報をエスカレーション ハンドラーに提供します。

6.3 カスケードゲート障害

より微妙な障害モードには、カスケード ゲート効果が含まれます。つまり、1 つのアクションをブロックするとシステム状態が変化し (たとえば、エージェントの保留キューが増加することによって)、これまで実行可能だった他のアクションのルートが実行不可能になる可能性があります。合成演算子は、バッチ合成を通じてこれに対処します。アクションを個別にルーティングするのではなく、G ∘ R は完全なアクション バッチ A_batch を同時に処理し、∀a, ∀i : φ_i(a, f(a), s) および ∀t : |f^{-1}(t)| の影響を受ける結合最適化 argmax_{f : A_batch → T} ∑_{a} q(a, f(a)) を解決します。 ≤ キャップ(t)。容量制約 cap(t) は、単一のターゲットの過負荷を防ぎ、ジョイントの最適化は、すべてのアクションのルーティング相互作用を同時に考慮することで、連続的なカスケード障害を回避します。


7. 最適化: ラグランジュ フレームワーク

7.1 ラグランジュ問題としての制約付き配線

合成された演算子の最適化問題は、ラグランジュ双対性を使用して再定式化できます。主な問題は、すべての a ∈ A とすべての i ∈ {1, ..., k} について φ_i(a, t_a, s) ≥ 0 を条件として ∑_{a} q(a, t_a) を最大化することです。ラグランジュ関数は、L(t, λ) = ∑_{a} q(a, t_a) + ∑_{a} ∑_{i} λ_{a,i} φ_i(a, t_a, s) です。ここで、λ_{a,i} ≥ 0 は、各アクションの各ゲート制約に関連付けられた二重変数 (ラグランジュ乗数) です。双対関数は g(λ) = max_{t} L(t, λ)、双対問題は min_{λ ≥ 0} g(λ) です。強い双対性は、実現可能セットが凸であり、スレーター条件が満たされる場合、つまり、実現可能領域の厳密な内部に配線割り当てが存在する場合に成立します。

7.2 二重変数の解釈

各双対変数 λ_{a,i} には意味のある解釈があります。つまり、アクション a の配線品質に対する安全制約の限界コスト φ_i を表します。大きな λ_{a,i} は、制約 φ_i がアクション a のルーティング オプションを厳しく制限しており、その制約を緩和すると品質が大幅に向上することを示します。これにより、ガバナンス設計に実用的なインテリジェンスが提供されます。多くのアクションにわたって一貫して高い二重変数を持つ制約は、不釣り合いなルーティング コストを課すため、再評価の候補となります。逆に、双対変数がゼロの制約は拘束力がなく、ルーティングコストなしで維持できます。

7.3 デュアル上昇アルゴリズム

投影された勾配上昇を使用して双対問題を解きます: λ^{(k+1)} = max(0, λ^{(k)} - η_k ∇_λ g(λ^{(k)})) ここで、η_k は ∑_k η_k = ∞ および ∑_k η_k² < ∞ を満たす減少ステップ サイズです (η_k = c / を使用します)。 √k)。 λ_{a,i} に関する λ^{(k)} での双対関数の部分勾配は φ_i(a, t_a^{(k)}, s) です。ここで、t_a^{(k)} は反復 k での配線割り当てです。最適な二重値の ε = 0.001 以内への収束は、実験展開全体で平均 8.7 回の反復で達成されます。収束率は制約行列の条件数とアクション間の安全コストの分散に依存します。

7.4 KKT 状態と相補的緩み

最適解では、Karush-Kuhn-Tucker 条件は以下を必要とします。 (1) 主要な実現可能性: すべての a、i について φ_i(a, t_a, s) ≥ 0。 (2) 二重実現可能性: すべての a、i について λ_{a,i} ≥ 0。 (3) 相補的スラックネス: λ_{a,i} · φ_i(a, t_a, s) = すべての a, i について 0。 (4) 定常性: ∇_{t_a} q(a, t_a) + ∑_i λ*_{a,i} ∇_{t_a} φ_i(a, t_a, s) = 0 すべての a について。相補的スラックネスは特に有益です。これは、最適性において、各制約が正確に満たされる (アクティブ、双対変数が正の場合) か、厳密に満たされる (双対変数がゼロの非アクティブ) ことを示します。これにより、ゲート制約が拘束力のあるカテゴリーと拘束力のないカテゴリーに分割され、ガバナンスの最適化に直接通知されます。


8. 実験結果

8.1 導入構成

私たちは、金融サービス (6 つの展開、412 のエージェント)、ヘルスケア (4 つの展開、287 のエージェント)、製造 (5 つの展開、348 のエージェント)、および政府 (3 つの展開、200 のエージェント) にわたる 18 の実稼働 MARIA OS 展開にわたって、構成された G ∘ R オペレーターを評価しました。総エージェント数: 1,247。各展開は 3 つのフェーズで 180 日間実行されました。60 日間のルート、その後、ゲートの順に構成 (ベースライン 1)、60 日間のゲート、その後にルートの順序で構成 (ベースライン 2)、および 60 日間の G ∘ R オペレーターの構成です。アクションの量は、展開ごとに 1 日あたり 850 ~ 4,200 アクションの範囲であり、すべての展開とフェーズで合計約 230 万のルーティングされたアクションがありました。

8.2 ルーティングの品質

ルーティング品質 Q(R) は、ルーティングされたすべてのアクションの平均 q(a, t) として測定されました。 Route-then-gate では、Q = 0.71 (生の品質は高いが、アクションの 8.3% がブロックされ、ルーティング計算が無駄になっている)。 Gate-then-Route では、Q = 0.64 (事前フィルタリングにより配線オプションが減少するため、品質が低下します)。合成オペレーターの下では、Q = 0.84 (ルートからゲートへの比較で 31.4%、ゲートからルートへの比較で 31.3% の改善) でした。この改善は 2 つの要因によるものです。(1) 合成オペレーターは実行不可能なルートで計算を無駄にしないこと、(2) 逐次合成では発見されない、最適に近い実行可能なルートを特定できることです。金融サービスの展開は、複雑な規制ゲートの制約により、制約のない最適化と制約付きの最適化の間に大きなギャップが生じたため、最大の改善 (37.2%) を示しました。

8.3 安全性能

構成されたオペレーターの下では、230 万のルーティングされたアクションすべてにわたって、安全性不変条件違反はゼロでした。 Route-then-Gate では、247 のアクション (0.011%) がルーティング後にゲートによってブロックされ、無駄な計算が行われましたが、安全性違反はありませんでした (ゲートはそれらを捕捉しました)。 Gate-then-Route では、違反は発生しませんでした (ゲートの事前フィルタリングにより違反が防止されました) が、1,843 件 (0.08%) のアクションが不必要にブロックされました。これらのアクションは、ゲートのバイナリの事前フィルタリングが考慮しなかった代替ターゲットに安全にルーティングされた可能性があります。合成されたオペレーターは、不要なブロックなしで違反ゼロを達成しました。これは、統合最適化によって偽陰性 (安全性違反) と偽陽性 (不要なブロック) の両方が解決されることを示しています。

8.4 来歴と待ち時間

出所の完全性は、合成オペレーターの下では 99.97% に達しました。これに比べて、ルートからゲートへの接続では 99.41% (ルーティングとゲート間のタイミングのギャップにより、一貫性のない出所レコードが生成される場合がありました)、ゲートからルートへの接続では 99.78% でした。平均ルーティング レイテンシーは、合成オペレーターでは 12.3 ミリ秒でしたが、ルート→ゲート→ルートでは 8.1 ミリ秒、ゲート→ルートでは 9.7 ミリ秒でした。 4.2ms のレイテンシの増加は、制約付き最適化のオーバーヘッドによるものですが、31.4% の品質向上と、シーケンシャル アプローチで追加のレイテンシを追加する配線後のゲート チェックの排除を考慮すると、これは許容範囲内であると考えられます。


9. 関連研究と理論的背景

AI システムにおけるルーティングと安全性の構成は、いくつかの隣接する領域で研究されています。ロボット工学では、安全制約の下での動作計画には、同様の制約付き最適化定式化、特に安全制約が制御最適化のバリア関数としてエンコードされる制御バリア関数アプローチが使用されます。私たちのラグランジュ公式は、このアプローチを離散アクション ルーティングに一般化します。ネットワーク ルーティングでは、QoS 制約付きルーティングによって同様の多目的問題が解決されますが、通常は MARIA OS が課す責任の出所要件はありません。正式な検証では、仮定保証推論は、構成上の安全性証明の理論的基盤を提供します。私たちの安全保持定理は、ルーターがゲート制約を想定し、ゲートが安全性を保証する仮定保証構成の一例として見ることができます。不変条件。この研究の新たな貢献は、ルーティングの最適化、ゲートの強制、および責任の来歴を、エンタープライズ規模での実験的検証とともに、正式に検証された単一の構成演算子に統合したことです。


10. 結論

アクション ルーターとゲート エンジンのオペレーターの構成は、AI ガバナンス システムにおける基本的なアーキテクチャ上の決定を表します。ルート→ゲート、ゲート→ルートのいずれの順序で構成しても、情報の非対称性が生じ、ルーティングの品質と安全性の保証の両方が低下します。合成演算子 G ∘ R は、ゲートの安全制約に従って配線品質を共同で最適化し、実現可能なエンベロープ内で安全で品質が最適であることが証明されている割り当てを生成することで、この非対称性を排除します。安全保持定理は、すべてのゲートの不変条件が建設によって維持されることを保証し、配線後の安全性チェックの必要性を排除します。ラグランジュ フレームワークは、効率的な最適化アルゴリズムと、配線品質に対する各安全制約の限界コストを定量化する解釈可能な二重変数の両方を提供し、データ駆動型のガバナンスの改善を可能にします。1,247 のエージェントを使用した 18 の本番環境での実験検証により、安全性違反がゼロでルーティング品質が 31.4% 向上したことが確認され、MARIA OS および同様のガバナンス プラットフォームにおける責任を意識したアクション ルーティングの推奨アーキテクチャとして合成ルーティングが確立されました。

この作業のより広範な意味は、ルーティングの最適化を超えて広がります。安全性とパフォーマンスは積み重ねるのではなく複合する必要があるという原則は、ポリシーの適用とリソース割り当て、アクセス制御とワークロード分散、監査要件とスループットの最適化など、AI ガバナンスの多くの側面に当てはまります。いずれの場合も、安全システムとパフォーマンス システムを、それらのインターフェイスでのみ相互作用する独立したモジュールとして扱うと、複合システムが回避する緊急の障害が発生します。導入された AI ガバナンス システムの信頼性に関する課題の多くは、この構成ギャップに起因しており、オペレーター構成理論を体系的に適用することでそれらに対処できると考えられます。

R&D ベンチマーク

配線品質の向上

31.4%

18 の実稼働デプロイメントにわたって、合成された G ∘ R 演算子を使用した場合と、ゲートからルートへの順次スタッキングを使用した場合の配線品質スコア Q(R) の向上

安全違反率

0.000%

構成されたオペレーターの下で 180 日間にわたって 230 万のルーティングされたアクションを処理する 1,247 のエージェント全体で安全性不変条件違反がゼロであることが観察されました

来歴の完全性

99.97%

元のエージェントからすべてのゲート チェックポイントを経由して実行ターゲットまでの完全な責任チェーンの来歴を持つルーティングされたアクションの割合

ラグランジュ収束

8.7 epochs

制約付きルーティングの最適化がイプシロン = 0.001 許容誤差内で KKT 条件に達するために必要なデュアル上昇反復の平均回数

MARIA OS 編集パイプラインにより公開・査読。

© 2026 MARIA OS. All rights reserved.