TAG ARCHIVE
self-extending-agent
MARIA OSブログのself-extending-agentタグに関連する8件の記事。ボンギンカンの判断OS、AIガバナンス、Agentic Company研究をテーマ別に参照しやすい技術記事アーカイブです。
判断OS / 決断インテリジェンスOS
組織の判断を実行可能な意思決定システムに変換するMARIA OS中核研究。
エージェント型企業アーキテクチャ
人間とエージェントの組織、委任境界、役割トポロジー、ガバナンス付き自律性に関する研究。
責任ゲートとAIガバナンス
AIエージェントの安全性、説明責任、フェイルクローズドゲート、監査可能性、HITL制御。
マルチエージェント数学
収束、安定性、ゲーム理論、グラフダイナミクス、マルチエージェント評価の形式モデル。
エビデンス、RAG、ナレッジガバナンス
エビデンスバンドル、検索アーキテクチャ、Graph RAG、ナレッジトラスト、監査可能な推論パイプライン。
Agentic R&Dと判断科学
研究運用、シミュレーションラボ、判断科学、再帰的改善、実験的AIガバナンス。
コマンドレスAIアーキテクチャ — Goal駆動型Agentが事前定義なしに自律実行するOS設計
コマンドレジストリを排除し、Goal分解・Plan生成・動的Tool合成によるAgent自律実行を実現する
従来のAgentアーキテクチャは事前定義されたコマンドセットに束縛される。本論文はMARIA OSのコマンドレスアーキテクチャを提示する。AgentはコマンドではなくGoalを受け取り、階層的Planに分解し、能力ギャップを検出し、必要なToolを動的に合成して実行する。Goal空間G、Plan空間P、Tool空間T間の射を形式化し、再帰的計画のもとでTool空間が収束することを証明する。
Capability Gap Detection — Agentが自分の能力不足を認識するメタ認知アーキテクチャ
形式的ギャップ分析を通じて、自分にできないことを認識し自律的な自己拡張をトリガーする方法
自己拡張型Agentには、ほとんどのアーキテクチャが無視する前提条件がある。自分に何ができないかを知る能力である。本論文はCapability Gap Detectionをメタ認知レイヤーとして形式化する。必要な能力をAgentの能力モデルと比較し、検出されたギャップを分類し、緊急度とインパクトで優先順位付けし、合成・要求・委任・エスカレーションの判断を下す。能力カバレッジメトリック、ギャップエントロピー測度、マルチAgent間ギャップ交渉プロトコルを導入する。
自己書き換えAgentシステム — Tool・Command・Workflowを自律的に進化させるアーキテクチャ
ツール生成を超えて — 安定性保証と不変監査証跡を備えた有界自己修正の形式的フレームワーク
新しいツールを生成するだけのAgentには限界がある。真の運用自律性には、パフォーマンスフィードバックに基づいて既存のツール・コマンド・ワークフローを自ら書き換える能力が必要だ。本稿では、Lyapunov安定性解析・停止保証・責任ゲート付き監査証跡を備えた有界自己修正アーキテクチャSMASを提示する。
Agent Tool Compiler — 自然言語からAPI設計・コード生成・実行までのコンパイルパイプライン
コンパイラとしてのAgent — NL意図を中間表現を経由して最適化された型安全なランタイムツールに変換する形式的フレームワーク
ツール生成Agentはアドホックなコード生産者である。本稿ではツール合成をコンパイル問題として再定義する。自然言語意図をIntent AST(意図の抽象構文木)に解析し、Tool IR(中間表現)に変換し、セキュリティ強化・デッドコード除去などの最適化パスを適用し、型安全な実行可能コードとしてエージェントランタイムにホットロードする。形式言語理論に基づくAgent Tool Compilerアーキテクチャを提示する。
自己拡張型Agentアーキテクチャ — 能力不足を自ら認識し、ツールを自律生成するOS設計
Agentが自身の限界を検知し、コード生成でツールを合成し、サンドボックスで検証し、OSランタイムに登録する — すべてガバナンス制約の下で
従来のAIエージェントは、人間が提供したツールセットに束縛される。未対応タスクに遭遇すると停止し、人間の介入を待つ。本論文では、Self-Extending Agent Architecture(SEAA)を提案する。エージェントが自律的に能力ギャップを検出し、構造化コード生成でツールを合成し、サンドボックス環境で検証し、OSランタイムに登録するフレームワークである。エージェント状態モデル X_t = (C, T, M, R) を形式化し、自己拡張方程式 X_{t+1} = E_t ∘ G_t ∘ J_t(X_t) を導出し、検証ゲート下での能力単調性定理を証明する。MARIA OSの階層座標系における具体的な実装を示す。
ツールを自ら書くAgent — Tool Discovery, Synthesis, Validation, Registrationの4フェーズ設計
静的ツールチェーンから自己拡張能力へ — MARIA OSのAgentが実行時に必要なツールを自ら生成する方法
通常のエージェントは人間がツールを作るのを待つ。MARIA OSのエージェントは自らツールを作る。本論文では、エージェントが不足能力を特定し、ツール実装を生成し、サンドボックス環境で正確性と安全性を検証し、OSランタイムに新ツールをホットロードする4フェーズアーキテクチャ — Discovery, Synthesis, Validation, Registration — を詳述する。ツール生成率、品質収束、マルチエージェントツール共有を形式化し、監査エージェントが実行時にOCR抽出ツールを生成したケーススタディを提示する。
Agent Capability OS — Command Registry・Tool Registry・Capability Graphで能力を管理するOS設計
個々のエージェントでは組織的な能力管理ができない理由と、OSレベルの抽象化がもたらす解決策
エージェント組織が数十体規模に拡大すると、能力管理はシステムレベルの課題となり、単一エージェントでは解決できなくなる。本稿ではAgent Capability OS — エージェント集団全体の能力の登録・発見・割当・進化を統治するOS抽象化を提案する。3つの中核レジストリ(Command Registry、Tool Registry、Capability Graph)を形式化し、OSレベルの能力管理がO(log N)の発見遅延を実現することを証明する。54体エージェント監査事務所のケーススタディでは、6フロアにわたる200以上のツールを能力衝突ゼロで管理した実績を示す。
ガバナンス下のツール生成:生成コードを安全にコマンド化する方法
サンドボックス検証、権限昇格モデル、監査証跡、ロールバック機構による自己拡張エージェントシステムの安全性フレームワーク
AIエージェントが生成したコードが本番システムの新しいコマンドになりうるとき、そのコードのすべての行が攻撃対象面となる。生成からレジストリ登録までの間にガバナンスゲートがなければ、自己拡張エージェントは自己増殖する脆弱性と区別がつかない。本論文はMARIA OSツール生成フレームワークを提示する:生成コードをガバナンス済みコマンドに変換する7段階パイプラインであり、サンドボックス検証、形式的安全性証明、束論に基づく権限昇格モデル、改ざん不可能な監査証跡、自動ロールバック機構を含む。有界実行の仮定のもとでツール安全性が多項式時間で決定可能であることを証明し、10,000件のツール生成イベントにわたるベンチマークで99.7%の安全性コンプライアンスを12%のレイテンシオーバーヘッドで達成することを示す。中心的命題:自己拡張は危険ではない。ガバナンスなき自己拡張が危険なのだ。