Name: MARIA OS
Author: MARIA OS

要約。 ルーティングは、AI システムが入力を受け取ったときに行う最初の決定です。すべてのダウンストリームアクション (すべてのエージェント呼び出し、すべてのデータベースクエリ、すべての承認リクエスト) は、ルーターが入力を適切なハンドラーに送信するかどうかによって異なります。それでも、AI ルーティングの支配的なパラダイムは依然としてキーワード分類です。つまり、入力からトークンを抽出し、カテゴリラベルと照合し、ディスパッチします。このペーパーでは、キーワードベースのルーティングがカテゴリエラーであることを示します。ルーティングは分類の問題ではありません。行動制御の問題です。アクションルーターを関数 R: (コンテキスト × 意図 × 状態) → アクションとして形式化します。これは、完全な意思決定コンテキストを、前提条件、効果、および責任の割り当てを備えた具体的な実行可能なアクションにマッピングします。アクションルーターが MARIA OS ゲートエンジンと自然に構成され、責任の保持を実現することを示します。ルーティング層。アクション空間全体にわたるルーティング目標を導出し、ゲート制約付きの最小化が実際にどのように解決されるかを示します。つまり、連続緩和の投影勾配近似を使用して、事前にフィルタリングされた実行可能候補に対する正確な O(K) 選択です。企業意思決定コーパスのシミュレートされたベンチマークでは、複合アクションゲートアーキテクチャにおいて、ミスルーティングの 67% の削減、責任帰属の失敗の 94% の排除、セマンティック類似性ルーティングと比較したレイテンシの 3.2 倍の改善、およびゲートコンプライアンスの 99.7% が実証されました。

1. はじめに: エージェントシステムにおけるルーティングの問題

すべてのエージェントシステムは、ルーティングの決定から始まります。ユーザーが「この払い戻しを処理する」、「この契約を確認する」、「このコンプライアンス問題をエスカレーションする」などのリクエストを送信すると、そのリクエストの宛先を何かが決定する必要があります。従来のソフトウェアシステムでは、ルーティングは明示的な URL パス、API エンドポイント、またはメッセージキュートピックによって処理されます。ルーティングロジックはハードコーディングされており、決定的です。エージェントシステムでは、ルーティングはインテリジェントである必要があります。同じ自然言語入力でも、コンテキスト、ユーザーの役割、システムの状態、リスクレベルに応じて異なるハンドラーが必要になる場合があります。

インテリジェントルーティングへの一般的なアプローチは、キーワードベースの分類です。ルーターは入力から顕著なトークン (「返金」、「契約」、「準拠」) を抽出し、それらを事前定義されたカテゴリーにマッピングし、対応するハンドラーにディスパッチします。より洗練されたバリアントでは、埋め込みベースの意味的類似性や微調整された分類子が使用されますが、基本的なパラダイムは同じであり、ルーティングは入力テキストからカテゴリラベルまでの関数として扱われます。

この論文では、このパラダイムはエンタープライズエージェントシステムにとって根本的に間違っていると主張し、それに代わるものとして Action Router を提案します。重要な洞察は一見単純です: ルーティングは、入力がどのカテゴリに属するかではなく、どのようなアクションを実行するかを決定する必要があります。この違いは意味的なものではありません。それは建築的です。カテゴリラベルはパッシブメタデータです。アクションは、検証する必要がある前提条件、予測する必要がある効果、割り当てる必要がある責任、およびクリアする必要があるゲートを備えた実行可能な仕様です。

1.1 キーワードルーティングが大規模に失敗する理由

具体的なシナリオを考えてみましょう。ユーザーは、「クライアントは契約をキャンセルして返金を受けたいと考えていますが、元の条件とのコンプライアンスに問題があります。」と提出します。キーワードルーターは、「キャンセル」、「契約」、「返金」、「コンプライアンス」という 4 つのキーワードを少なくとも 3 つの異なるカテゴリにマッピングします。どのカテゴリーが優勝するでしょうか？キーワードルーターは、最長一致、最も高い信頼度、最初の一致、または多数決などのヒューリスティックを適用する必要があります。これらはすべて任意です。それらのどれも、システムがどのようなアクションをとるべきかという実際の質問には答えていません。

Action Router は入力を分類しません。これは、完全なコンテキスト (ユーザーが誰であるか、ユーザーの権限レベルは何か、契約の状態は何か) を分析し、意図 (ユーザーが多面的な問題の解決を望んでいる) を抽出し、システムの状態 (契約はキャンセル可能な状態にあるか、ポリシーの制限内で返金があるか、保留中のコンプライアンスレビューがあるか) を評価し、事前定義されたアクションスペースから最適なアクションを選択します。選択されたアクションは「initiate_contract_review_with_compliance_hold」です。これは、定義された責任チェーンとゲート要件を備え、3 つの懸念事項すべてに同時に対処する単一のアクションです。

1.2 貢献

この論文は 5 つの寄稿を行っています。まず、キーワード検出の誤謬を形式化し、より優れたキーワードエンジニアリングだけでは除去できないミスルーティングに関する情報理論的な下限を導き出します。次に、アクションルーターをトリプル (コンテキスト、インテント、状態) に対する関数として形式的に定義し、それがキーワードとセマンティックルーティングの両方を縮退ケースとして包含することを証明します。第三に、事前条件効果セマンティクスを使用してアクション空間を形式化し、この形式化により MARIA OS ゲートによる構成ルーティングが可能になることを示します。第 4 に、アクション空間全体にわたるコスト関数を導出し、実行可能な候補セットに対する線形時間の正確な選択と連続緩和下での投影勾配近似など、扱いやすい最適化レジームを特徴付けます。 5 番目に、4 つのエンタープライズワークロードにわたるアクションルーティングの優位性を実証するシミュレートされたベンチマークを示します。

1.3 カテゴリとアクション (操作上の違い)

カテゴリ: ディスパッチのみに使用されるパッシブラベル。
アクション: 前提条件、予測される効果、責任の割り当て、ゲート要件、およびコストを含む実行可能オブジェクト。
ガバナンスへの影響: カテゴリは事後的に記録できます。アクションは、実行前に監査、承認、拒否、またはエスカレーションできます。

2. キーワード検出の誤謬

2.1 キーワードルーティングの正式モデル

Σ を語彙、x ∈ Σ* をユーザー入力とします。キーワードルーター R_kw は、カテゴリとキーワードのマッピングのセット {(c_j, K_j)} を定義します。ここで、c_j はカテゴリラベル、K_j ⊆ Σ はカテゴリ j のキーワードセットです。ルーティングの決定は次のとおりです。

R_{\text{kw}}(x) = \arg\max_{c_j} \; |\{w \in x : w \in K_j\}| \cdot \text{weight}(c_j) $$

これは重み付けされたバッグオブワード分類器です。 NLP の数十年にわたる進歩にも関わらず、驚くほど多くの本番ルーティングシステムがまさにこの式を実装しており、TF-IDF 重みや N-gram マッチングでドレスアップされている場合もありますが、構造的には同一です。

2.2 ミスルーティングに対する情報理論の限界

私たちは、キーワードルーティングには、キーワードエンジニアリングをどれだけ行っても克服できない根本的な精度の上限があることを証明しています。

定理 1 (キーワードルーティング境界、Fano 形式)。 入力 X を与えられた正しいアクション A の条件付きエントロピーを H(A | X) とし、キーワード特徴 K(X) ⊆ X のみを与えた A の条件付きエントロピーを H(A | K(X)) とします。有限のアクションスペース A では、キーワードルーターのエラー率は次を満たします。

P(\text{misroute}) \geq \max\left(0, \frac{H(A \mid K(X)) - 1}{\log |\mathcal{A}|}\right) $$

ギャップ H(A | K(X)) - H(A | X) は、キーワードへの入力を減らすことによって失われる情報を表します。エンタープライズコーパスでは、正しいアクションはコンテキスト (誰が要求しているか)、状態 (現在のシステム構成は何か)、および意図 (ユーザーがどのような結果を望んでいるのか) に依存するため、このギャップはかなり大きくなります。そのいずれもキーワードだけでは捉えられません。

証明スケッチ。 これは、圧縮された特徴 K(X) から A をデコードするための標準的な Fano 下限です。キーワード抽出はコンテキスト変数と状態変数を破棄するため、正しいアクションがキーワード以外の特徴に依存する場合は常に、H(A | K(X)) は H(A | X) よりも厳密に大きいままになります。したがって、キーワードが完全に一致した場合でも、ゼロ以外の誤ったルーティングフロアが残ります。 ◼

2.3 限界の経験的検証

カスタマーサポートチケット (n = 12,000)、契約レビューリクエスト (n = 4,500)、コンプライアンスエスカレーション (n = 3,200)、および内部運用リクエスト (n = 8,800) の 4 つの企業コーパスに関するキーワード情報のギャップを測定します。キーワードのみの条件付きエントロピー H(A | K(X)) は、4 つのコーパスすべてにわたってフルコンテキストエントロピー H(A | X) を 1.4 ～ 2.8 ビット上回っており、 |A| に応じて 20 ～ 44% の範囲の Fano スタイルのミスルーティングフロアが生じます。経験的に、展開されたキーワードルーターは、これらのコーパス上で 23 ～ 47% の誤ったルーティングを達成します。これは下限と一致しています。

2.4 意味的類似性の拡張とその限界

意味的類似性ルーティングは、キーワードの一致を埋め込み距離に置き換えます: R_sem(x) = argmin_{c_j} d(embed(x), embed(c_j))。ここで、embed はテキストをベクトル空間にマップし、d はコサインまたはユークリッド距離です。このアプローチでは、キーワードよりも入力の意味をより多く捉えますが、それでも入力をカテゴリにマッピングします。根本的な問題は依然として残ります。正しいルーティングの決定は、入力だけではなく (コンテキスト、インテント、状態) に依存します。意味的類似性は H(A | K(X)) を減少させますが、埋め込みはテキストの意味を捕捉しますが世界の状態を捕捉しないため、H(A | X) までのギャップは縮まりません。

3. アクションルーター: 正式な定義

3.1 ルーティングトリプル

Action Router は、生の入力 x ではなく、トリプル (C、I、S) で動作します。

コンテキスト C: ユーザー ID、権限レベル (MARIA 座標)、セッション履歴、時刻、アクティブな組織ポリシー、関連するドキュメントの状態を含む完全な環境コンテキスト。正式には、C ∈ C です。ここで、C はコンテキスト空間です。
インテント I: 抽出されたユーザーインテント。これはカテゴリラベルではなく、構造化された目標仕様です。ユーザーはどのような結果を望んでいるのか、どのような制約を課しているのか、どのような優先順位を割り当てているのか。正式には、I ∈ I です。ここで、I は意図空間です。
状態 S: アクティブなワークフロー、保留中の決定、エージェントの可用性、リスクレベル、リソース使用率などの現在のシステム状態。形式的には、S ∈ S ここで、S は状態空間です。

3.2 アクションルーター機能

アクションルーターは次のように定義されます。

R: \mathcal{C} \times \mathcal{I} \times \mathcal{S} \rightarrow \mathcal{A} $$

ここで、A はアクション空間 (セクション 4 で定義) です。キーワードルーティングとの主な違いは、R はラベルを返さず、アクションを返すことです。アクションは文字列や列挙型ではありません。これは、前提条件、効果、責任の割り当て、およびゲート要件を備えた構造化オブジェクトです。

3.3 以前のルーティングパラダイムの包含

アクションルーターは、キーワードルーティングとセマンティックルーティングを縮退特殊ケースとして包含します。

命題 1 (仮定) (a) キーワードルーティングは、C = ∅、I = K(x)、S = ∅、および A = {カテゴリ}を持つアクションルーターです。 (b) セマンティックルーティングは、C = ∅、I = embed(x)、S = ∅、および A = {categories} のアクションルーターです。 (c) どちらも、完全な Action Router の情報損失のある投影です。

この命題は、アクションルーティングが厳密にはより一般的であることを確立します。キーワードまたはセマンティックルーティングによって達成できるルーティング品質は、アクションルーティングによっても達成できますが、その逆はありません。 (C, S) の追加情報により、入力専用ルータでは不可能なルーティング決定が可能になります。

3.4 インテント抽出とキーワード抽出

Action Router では、キーワード抽出ではなくインテント抽出が必要です。意図の抽出により、ユーザーの目標の構造化された表現が生成されます。

I = \text{IntentParser}(x, C) = (\text{goal}, \text{constraints}, \text{priority}, \text{urgency}) $$

{
  "goal": "resolve_multi_issue",
  "constraints": ["refund_limit<=10000", "regulatory_hold_if_flagged"],
  "priority": 0.82,
  "urgency": "high"
}

インテント抽出では、入力 x とコンテキスト C の両方を引数として受け取ることに注意してください。これは重要です。「この返金を処理する」という同じ入力でも、C がユーザーが顧客 (目標: お金の受け取り)、サポートエージェント (目標: チケットの解決)、または監査人 (目標: 返金コンプライアンスの確認) であることを示すかどうかに応じて、異なる意図を持ちます。対照的に、キーワード抽出では、コンテキストに関係なく同じ出力が生成されます。

4. アクション空間の形式化

4.1 アクションの定義

アクション a ∈ A はタプル a = (id, pre, eff, resp,gate,cost,rev,comp) です。ここで、

id: MARIA 座標系内の一意のアクション識別子
pre(C, S) → {true, false}: アクションが現在のコンテキストおよび状態で実行可能かどうかを決定する前提条件関数
eff(S) → S': 現在の状態をアクション後の状態にマッピングするエフェクト関数
resp ∈ MARIA_Coowned: このアクションの実行を担当するエージェントまたはチームの MARIA 座標
ゲート ∈ GateSpec: リスク層によって決定されるゲート仕様 (自動承認、人間によるレビュー、またはエスカレーション)
cost(C, I, S) → ℝ≥0: 指定されたコンテキスト、意図、および状態でこのアクションを実行するコスト
rev ∈ {可逆、不可逆}: アクション効果の可逆クラス
comp ∈ \mathcal{A} \cup {\emptyset}: rev = 不可逆の場合に必要なオプションの補償アクション

4.2 アクションスペースの構造

アクション空間 A = {a₁, a₂, ..., a_n} は有限ですが、潜在的に大きくなります (エンタープライズ展開では数百から数千のアクション)。 MARIA 座標に合わせた階層分解を通じて A に構造を課します。

\mathcal{A} = \bigcup_{G} \bigcup_{U \in G} \bigcup_{P \in U} \bigcup_{Z \in P} \mathcal{A}_{Z} $$

ここで、A_Z はゾーン Z 内で利用可能なアクションのセットです。この分解により、効率的なルーティングが可能になります。ルーターは、ゾーンローカルのアクション空間内を検索する前に、まず関連する銀河、宇宙、惑星、およびゾーンに絞り込みます。この階層構造では、アクション検索の複雑さは O(|A|) ではなく O(log|A|) になります。

4.3 前提条件の検証

アクションにルーティングする前に、アクションルーターはアクションの前提条件が満たされていることを確認する必要があります。これは重要な安全特性です。前提条件が満たされていないアクションにルーティングすると、確実に失敗します。時間 t で設定された実行可能なアクションを次のように定義します。

\mathcal{A}_{\text{feasible}}(C, S) = \{a \in \mathcal{A} : \text{pre}_a(C, S) = \text{true}\} $$

アクションルーターは、実行可能なアクションのみを考慮し、キーワードルーターでは防止できないクラスの誤ったルーティングエラー (現在の状態では実行できないハンドラーへのルーティング) をすべて排除します。私たちの実験では、ルーティング機能自体を最適化する前に、前提条件フィルタリングだけでミスルーティングが 31% 減少しました。

4.4 影響予測と状態遷移の安全性

各アクションの効果関数 eff_a: S → S' は、アクション後の状態を予測します。 Action Router は、効果予測を使用して、選択前に候補アクションを評価します。これにより、先読みルーティングが有効になります。ルーターは、入力に最も一致するアクションを選択するのではなく、予測される効果がユーザーの意図を最もよく満たすアクションを選択します。

R(C, I, S) = \arg\min_{a \in \mathcal{A}_{\text{feasible}}} \; d(\text{eff}_a(S), \text{goal}(I)) + \lambda \cdot \text{cost}_a(C, I, S) $$

ここで、d は予測されたアクション後の状態とユーザーの目標との間の距離を測定し、λ はコスト項の重み付けを行います。この定式化により、ルーティングがパターンマッチング (最も近いカテゴリの検索) から計画 (目標を最もよく達成するアクションの検索) に変換されます。

5. ゲート統合: アクションルーター × MARIA OS ゲートエンジン

5.1 構成プロパティ

Action Router の中心となるアーキテクチャ上の革新は、MARIA OS Gate Engine との構成上の統合です。ルーティング後にゲートを適用する (キーワードルーターで使用される後付けアプローチ) のではなく、アクションルーターはゲート制約をルーティングの決定自体に組み込みます。

R_{\text{gated}}(C, I, S) = \text{Gate}(R(C, I, S), \text{RiskLevel}(C, I, S)) $$

より正確には、ゲートルーティング機能は、選択されたアクションのゲート仕様をルーティング出力の一部として適用します。ゲートはアクションを変更しません。ゲートは、必要な承認レベルを強制する実行エンベロープでアクションをラップします。

リスクレベル = 低: ゲート = 自動承認。アクションはすぐに実行されます。
リスクレベル = 中: ゲート = 人間によるレビュー。アクションは、責任あるレビュー担当者の MARIA 座標を使用して人間による承認を得るためにキューに入れられます。
リスクレベル = 高: ゲート = エスカレーション。アクションは、完全なコンテキスト、意図、および状態の文書とともに上級意思決定者に送られます。

5.2 責任保存定理

定理 2 (責任の保持と制御された回復可能性)。 任意の入力 (C、I、S) および任意のアクション a = R(C、I、S) について、複合アクションゲートルーティング R_gated は次のプロパティを保持します。 (a) トレーサビリティ: 責任のあるエージェントの MARIA 座標がルーティング出力に埋め込まれます。 (b) 監査可能性: 完全なルーティング決定 (入力トリプル、検討された実行可能なアクション、選択されたアクション、適用されたゲートレベル) は、不変の監査レコードとして記録されます。 (c) 制御された回復可能性: 可逆的なアクションは実行可能なロールバックを宣言する必要がありますが、不可逆的なアクションはゲート = エスカレート、より強力な証拠の要件、および補償アクションを宣言する必要があります。

証明プロパティ (a) はアクション定義から次のとおりです: すべての a ∈ A は構造により resp ∈ MARIA_Coowned を持ちます。プロパティ (b) は MARIA OS 監査パイプラインから派生し、ゲートエンジン層ですべてのルーティング決定を傍受します。特性 (c) は、(rev、comp) の登録制約から得られます。つまり、可逆的なアクションはテスト済みのロールバック手順でのみ許可され、不可逆的なアクションはエスカレーション、証拠の強化、および補償の回復パスが明示的にアタッチされている場合にのみ許可されます。 ◼

5.3 ゲート制約のある最適化

ゲートの存在により、配線の最適化が変更されます。ハイゲートアクションではレイテンシー (人間の承認を待つ) が発生するため、最適なアクションを選択するメリットと比較検討する必要があります。コスト関数を拡張してゲートレイテンシーを含めます。

J_{\text{gate}}(a; C, I, S) = \text{cost}_a(C, I, S) + \mu \cdot \text{GateLatency}(\text{gate}_a) + \nu \cdot \text{RiskPenalty}(a, S) $$

ここで、μ は待ち時間コストに重みを付け、ν は高リスクのアクションを選択するためのリスクペナルティに重みを付けます。ルーティングの最適化は、アクションの品質 (ユーザーの目標への近さ)、実行速度 (ゲートレイテンシー)、安全性 (リスクペナルティ) の間の 3 つのトレードオフになります。運用環境では、前提条件によって候補が K 個の実行可能なアクションに減らされ、J_gate がアクションごとに計算可能である場合、正確な最小化は線形 O(K) スキャンになります。より大きな緩和定式化または微分可能な緩和定式化の場合、投影勾配法は、明示的な近似誤差追跡を使用して最適に近い解決策を提供します。

6. アクションルーティングにおける責任の保持

6.1 責任の連鎖

ルーティングされたすべてのアクションは責任チェーンを作成します。つまり、アクションを要求した人 (ユーザーまたは上流エージェント)、アクションをルーティングした人 (アクションルーターインスタンス)、アクションを実行する人 (下流エージェント)、およびアクションを承認した人 (ゲートリゾルバー) を識別する一連の MARIA 座標です。このチェーンはルーティング時に構築され、アクションエンベロープに添付されます。

\text{Chain}(a) = [\text{coord}_{\text{requester}}, \text{coord}_{\text{router}}, \text{coord}_{\text{executor}}, \text{coord}_{\text{approver}}] $$

キーワードルーターには「実行者」の概念がないため、このチェーンを構築できません。キーワードルーターは責任のあるエージェントではなく、カテゴリにルーティングします。アクションルーターは定義に従ってそれを構築します。すべてのアクションはその実行者の MARIA 座標を保持します。

6.2 監査証跡の完全性

私たちは、監査証跡の完全性を、監査ログから完全な責任チェーンを再構築できるルーティング決定の一部として定義します。キーワードルーティングシステムでは、ルータは下流の実行パスではなくカテゴリのみをログに記録するため、監査証跡の完全性は通常 40 ～ 60% です。 Action Router システムでは、アクション定義に 4 つのチェーン要素すべてが含まれるため、構築時の完全性は 100% です。

6.3 クロスゾーンルーティングと座標伝播

アクションが複数の MARIA ゾーンにまたがる実行を必要とする場合 (例: 異なるゾーンの法務、財務、コンプライアンス担当者が関与する契約レビュー)、アクションルーターはアクションをサブアクションに分解し、それぞれに独自の責任が割り当てられます。

a_{\text{composite}} = [a_1^{Z_1}, a_2^{Z_2}, a_3^{Z_3}] \quad \text{where } \text{resp}(a_k) \in Z_k $$

複合アクションでは、MARIA OS の階層的責任構造が維持されます。つまり、ギャラクシーレベルの所有者が最終的な責任を保持し、ゾーンレベルのエージェントが運用上の責任を負います。この分解は、マルチゾーンアクションの概念がないキーワードルーティングでは不可能です。

7. 数学的枠組み: コスト関数と最適化

7.1 ルーティングコスト関数

ルーティングコスト関数を次の 4 つの要素の加重和として定義します。

J(a; C, I, S) = \alpha \cdot d(\text{eff}_a(S), \text{goal}(I)) + \beta \cdot \text{risk}(a, S) + \gamma \cdot \text{latency}(\text{gate}_a) + \delta \cdot \text{resource}(a, S) $$

ここで、 d は目標距離 (アクションの予測結果がユーザーの意図からどれだけ離れているか) を測定し、リスクは悪影響の確率を測定し、レイテンシはゲート遅延を含む予想実行時間を測定し、リソースは実行の計算コストと組織コストを測定します。重み α、β、γ、δ は展開ごとに構成可能で、組織の優先順位を反映します。

7.2 連続緩和に対する勾配ベースの最適化

アクション空間 A は離散的ですが、最適化の目的で連続緩和を定義します。 p ∈ Δ^{|A|} をアクションの確率分布 (アクションスコアのソフトマックス) とします。予想されるコストは次のとおりです。

\mathbb{E}[J] = \sum_{a \in \mathcal{A}_{\text{feasible}}} p(a) \cdot J(a; C, I, S) $$

J は 4 つのコスト成分に分解可能であり、各成分は p に関して微分可能であるため、勾配 ∇_p E[J] を効率的に計算できます。シンプレックス Δ^{|A|} で投影勾配降下法を使用して最適な配線分布を見つけ、最も高い確率でアクションを選択します。このアプローチにより、アクションの結果が観察されたときに、アクションルーターのエンドツーエンドのトレーニングが可能になります。

7.3 オンラインアクションルーティングのリグレットバウンド

ルーティングの決定が順番に行われ、実行後に結果が観察されるオンライン設定では、アクションルーターがサブリニアリチャードを達成することを証明します。

定理 3 (リグレット限界)。 アクションスコアの乗算重み更新ルールの下では、T ルーティング決定後のアクションルーターの累積リグレットは次を満たします。

\text{Regret}(T) = \sum_{t=1}^{T} J(a_t) - \min_{a^*} \sum_{t=1}^{T} J(a^*) \leq \sqrt{2T \ln |\mathcal{A}|} $$

この O(√T log|A|) リグレス限界は、アクションルーターがレート O(1/√T) で最適な固定アクションに収束し、|A| に依存することを意味します。対数のみです。 |A| を使用した一般的なエンタープライズ展開の場合= 500、T = 10,000 回のルーティング決定 (約 1 週間の運用) 後、決定ごとのリグアランスは 0.1 未満になります。

8. 従来のルーティングパラダイムとの比較

8.1 3者間比較

Dimension	Keyword Router	Semantic Router	Action Router
Input	Raw text tokens	Embedded text vector	(Context, Intent, State) triple
Output	Category label	Category label	Executable action with metadata
State awareness	None	None	Full system state
Context awareness	None	Partial (embedding)	Full organizational context
Precondition check	None	None	Mandatory before routing
Effect prediction	None	None	Required for goal-directed routing
Responsibility	Not assigned	Not assigned	Embedded in action (MARIA coord)
Gate integration	Retrofit (post-hoc)	Retrofit (post-hoc)	Native (compositional)
Audit trail	Category log only	Category + similarity score	Full chain: requester → router → executor → approver
Misrouting rate	23-47%	15-28%	8-12%
Latency (P99)	12ms	89ms	28ms

8.2 セマンティックルーティングでは不十分な理由

セマンティックルーティングは、トークンではなく意味を取得することでキーワードルーティングを改善しますが、依然としてルーティングを分類として扱います。埋め込みスペースは、意味的には似ているが、操作的には異なるリクエストを混同します。「コンプライアンスについてこの契約を確認してください」と「交渉の影響についてこの契約を確認してください」は意味的には似ていますが（コサイン類似度が高い）、完全に異なるアクション、異なるエージェント、異なるゲート、および異なる責任チェーンが必要です。アクションルーターは、入力埋め込みがほぼ同一であっても、インテント抽出によって異なる目標仕様 (compliance_verification と Negotiation_analysis) が生成されるため、これらを区別します。

8.3 レイテンシー分析

直感に反しますが、Action Router はより多くの作業を実行するにもかかわらず、セマンティックルーティングよりも高速です。その理由はアーキテクチャ上にあります。セマンティックルーティングでは、埋め込みモデルを通過する前方パス (実稼働グレードのエンコーダの場合は通常 50 ～ 100 ミリ秒) に続いて、カテゴリ埋め込み空間に対する最近傍検索が必要です。アクションルーターは、意図の抽出 (組織データでトレーニングされた軽量分類器を使用して 10 ～ 15 ミリ秒)、前提条件のフィルタリング (2 ～ 5 ミリ秒、純粋なルールベース)、および事前にフィルターされた実現可能セットに対する目標の最小化 (5 ～ 8 ミリ秒、通常は実現可能セットサイズ K で線形) を実行します。合計 P99 は 28 ミリ秒であるのに対し、セマンティックルーティングの場合は 89 ミリ秒です。

9. 実験結果

9.1 実験設定と測定基準の定義

私たちは、次の 4 つのエンタープライズワークロードでキーワードルーティングとセマンティックルーティングに対してアクションルーターを評価します。(1) 47 のアクションタイプにわたる 12,000 のチケットを備えたカスタマーサポート (CS)。 (2) 23 のアクションタイプにわたる 4,500 件のリクエストによる契約レビュー (CR)。 (3) 31 のアクションタイプにわたる 3,200 件のインシデントを含むコンプライアンスエスカレーション (CE)。 (4) 62 のアクションタイプにわたる 8,800 のリクエストを含む内部操作 (IO)。すべてのワークロードには、ドメインの専門家によって割り当てられたグラウンドトゥルースアクションラベルと、責任を検証するための MARIA 調整アノテーションが含まれています。

メトリックの曖昧さを避けるために、評価メトリックを明示的に定義します。 - ミスルート: 選択したアクションがそのリクエストに対して設定された専門家承認のアクションラベルにない場合、または選択したアクションがディスパッチ時の実行適格性チェックに失敗した場合にカウントされます。 - 責任帰属失敗: 必要なチェーン要素が間違っているか欠落している場合にカウントされます (実行者の不一致、ゲートアクションの承認者の欠落、または不変の監査レコードの欠落)。 - ゲートコンプライアンス: 実行前に必要なゲートをすべて満たす、実行されたアクションの割合。同等に、1 から必須ゲートのバイパス率を引いたものとなります。

9.2 配線の精度

Workload	Keyword Router	Semantic Router	Action Router	Action Router + Gate
CS (n=12K)	62.3%	74.1%	88.7%	91.2%
CR (n=4.5K)	53.1%	71.8%	86.4%	89.1%
CE (n=3.2K)	57.8%	68.2%	90.3%	93.6%
IO (n=8.8K)	71.4%	79.6%	92.1%	94.8%

アクションルーターは、すべてのワークロードにわたって、キーワードルーティングを 21 ～ 33 パーセントポイント、セマンティックルーティングを 12 ～ 22 パーセントポイント上回っています。ゲート制約 (アクションルーター + ゲート) を追加すると、責任制約に違反するアクションがフィルタリングされるため、さらに 2 ～ 4 ポイント改善されます。

9.3 責任の帰属

Metric	Keyword Router	Semantic Router	Action Router
Chain completeness	41.2%	52.7%	100%
Correct executor ID	34.8%	48.3%	97.1%
Gate compliance	71.3%	76.8%	99.7%
Audit reconstructability	38.4%	55.1%	100%

9.4 レイテンシの分布

Percentile	Keyword Router	Semantic Router	Action Router
P50	3ms	52ms	14ms
P90	8ms	78ms	22ms
P99	12ms	89ms	28ms
P99.9	45ms	142ms	41ms

Action Router は、P99 のセマンティックルーティングよりも 3.2 倍高速でありながら、大幅に高い精度を実現します。 P99.9 では、まれなエッジケースがフルコンテキストの再評価へのフォールバックを引き起こすため、ギャップは縮小しますが、アクションルーターは末尾であってもキーワードルーティングで競争力を維持します。

10. 結論

アクションルーターは、分類から制御へ、キーワードからアクションへ、ラベルから実行可能な仕様へという AI ルーティングのパラダイムシフトを表しています。ルーティングは、入力がどのカテゴリに属するかではなく、何をすべきかを決定する必要があるという重要な洞察は、エンタープライズエージェントシステムに重大な影響を与えます。すべてのルーティングの決定により、前提条件、効果、責任の割り当て、ゲート要件を伴うアクションが生成されると、ルーティング層自体がガバナンスメカニズムになります。ルーティング後に責任を後付けする必要はありません。責任は、構築によってルーティング出力に埋め込まれます。

私たちが提示する数学的フレームワーク、つまりゲート制約を伴う構造化されたアクション空間に対する客観的な最適化は、適応性（リグレス理論的な意味で）と安全（責任保持の意味で）の両方を備えたルーティングの原則的な基盤を提供します。明示的なミスルート/責任/ゲート定義を使用して測定されたシミュレートされたベンチマークは、この理論上の利点が実際の優位性につながることを示しています。ミスルーティングの 67% 削減、責任帰属の失敗の 94% の排除、レイテンシ 3.2 倍の改善、およびゲートコンプライアンス 99.7% です。

MARIA OS の場合、Action Router はオプションの拡張機能ではありません。ゲートベースのガバナンスを大規模に可能にするのはルーティング層です。アクションレベルのルーティングがなければ、事後チェックとしてゲートを改造する必要があります。このパターンは、私たちの実験では 71% しか準拠していません。アクションルーティングでは、ゲートは構成的なものになります。ゲートはアクション定義自体から生成され、構築によってほぼ完璧な準拠を実現します。インテリジェントルーティングの将来は、よりスマートな分類ではありません。それは行動制御です。

参考文献

1. さくら / 凡銀館 (2026) AI ルーティングがキーワードベースではなくアクションベースである必要がある理由。 note.com。 2. ラッセル、S. & ノーヴィグ、P. (2021)。 人工知能: 現代的なアプローチ。第4版、ピアソン。 3. フロイント、Y. & シャパイア、R.E. （1997年）。オンライン学習の意思決定理論による一般化。 JCSS、55(1)、119-139。 4. ガラブ、M. 他。 (2004)。 自動化された計画: 理論と実践。モーガン・カウフマン。 5. MARIA OS 技術文書 (2026)。アクションルーターアーキテクチャ仕様、v1.0。

Action Router知能理論: ルーティングは語の分類ではなく行動制御であるべき理由