再帰的自己改善
ワークフロートポロジー、エージェント配置、ロールバウンド仕様を継続的に最適化する統制された再帰サイクル。すべてのイテレーションがエビデンスを次に供給する — 制御不能にはならない。
継続的自己改善、
設計による統治。
5つのステージが無限に循環する:意思決定パターンの観察、価値コンフリクトの分析、ワークフロートポロジーの書き換え、ゲートによる検証、監査証跡を伴うデプロイ。すべてのサイクルがエビデンスを次に供給する。
すべての意思決定ソースを、 1つの基盤に。
承認、会議、チャット、PRレビュー、実行ログを不変のタイムライン再構築付きの単一イベント基盤に正規化する。
承認
稟議と署名
会議
議事録とメモ
PRレビュー
コードの意思決定
チャットログ
Slack、Teams
実行ログ
実行トレース
統合
イベント基盤
不変のタイムライン
監査グレードの保持
リプレイ機能
ブランチ検出
価値帰属
コンフリクト分析
隠れた 判断ポイントを見つける。
稟議承認ログを分析し、結果が分岐する意思決定ブランチポイントを特定。ヒートマップの強度は各分岐点での価値コンフリクトを示す — 各ブランチの背後にあるメタバリューが組織の真のアーキテクチャ。
承認文書から 判断アーキテクチャへ。
承認文書から抽出されたすべてのブランチポイント、メタバリュータグ、価値コンテキストが、再帰的改善ループに直接供給される。MARIA OSのサービスは内部接続されており — 各抽出サイクルが次を研ぎ澄ます。
接続サービス
Decision Scanner
承認文書を構造化ブランチトポロジーに解析
Value Scanner
すべての判断ポイントでメタバリュータグを抽出
Workflow Scanner
ブランチパターンをワークフローDAGの書き換えにフィードバック
Recursive Loop
改善されたワークフローが新たな意思決定を生成 — サイクルが繰り返される
最小限のゲートで、 最大限の制御を。
ゲートは3つで十分。多すぎれば窒息し、少なすぎれば混乱を招く。各ゲートが意思決定ファネルを絞り込み — 統治されたアクションのみが通過する。
業界安全ゲート
規制、コンプライアンス、法的制約。交渉不可。
ブロック
規制違反、安全上の危険、法的リスク
通過
すべての準拠した意思決定、標準業務
企業価値ゲート
MVVアラインメントチェック。実践された価値に矛盾する意思決定をブロック。
ブロック
価値の矛盾、戦略的ドリフト、文化違反
通過
MVV整合の意思決定、価値一貫性のあるアクション
構造変更ゲート
ワークフロー再設計、ロール変更、パラメータ変更。常に人間の承認が必要。
ブロック
未承認のスコープ変更、権限エスカレーション、設計の書き換え
通過
承認された構造変更のみ
統治された実行
監査可能、追跡可能、可逆的
再帰前 vs. 再帰後。
各再帰サイクルがボトルネックを特定し、冗長なノードを除去し、承認トポロジーを最適化する。ワークフローの書き換えは構造変更提案として扱われ — 常にゲート承認される。
ノード削減
9 → 6
-33%
ボトルネック
2 → 0
-100%
平均リードタイム
5.2d → 1.8d
-65%
リピート却下率
28% → 4%
-86%
ロールバウンドエージェント、 進化する仕様。
エージェントは静的なクォータではなく、依存性圧力によって配置される。権限スコープ、リスク予算、承認閾値はバージョン管理された仕様として進化する — 自律的には決して行われない。
ゾーントポロジー
Power
Capital
Institution
Mass
Narrative
Chaos
仕様の進化
読み取り専用分析
+ 低リスク実行
+ クロスゾーン調整
+ 構造提案
不変条件:エージェントは自身の仕様バージョンを自律的に拡張できない。すべてのアップグレードには構造変更ゲートを通じた人間の承認が必要。
すべての 再帰サイクルを測定。
84
72
91
88
66
77
再帰サイクルを実行
進化は許可される。 価値の自己変更は許されない。
研究ビジュアライゼーション:再帰的自己改善が何を変更でき、何を変更できないか
改善可能
再帰的自己改善が最適化できる領域
- 目標評価関数
- 実行戦略
- ゲートの精度と正確性
- ワークフロートポロジー
- エージェント配置とロール
保護領域
AIが自己変更できない領域
- ミッション価値 (Vₘ)
- 中核的倫理原則
- 責任の割り当て
- 価値ベクトル次元
- 人間の権限境界
オーバーライドゲート
特別な条件下でのみミッション更新
- 人間の承認が必要
- クーリング期間経過(24時間以上)
- インパクトシミュレーション完了
- 全目標の再投影済み
- 変更ログの永続保存
V_m(t+1) = normalize(V_m(t) + ΔV)
only if HumanApproval
∧ CoolingPeriod
∧ ImpactAnalysisアラインメント評価アルゴリズムは進化する。価値軸は進化しない。これがMARIA OSの文明的原則である。