TAG ARCHIVE
safety
MARIA OSブログのsafetyタグに関連する4件の記事。AIエージェントの安全性、説明責任、フェイルクローズドゲート、監査可能性、HITL制御。 検索エンジンとLLMが技術テーマ単位で参照しやすい正規アーカイブです。
Doctorアーキテクチャ: MARIA OSにおける異常検知と企業メタ認知
二重モデル異常検知、閾値設計、ゲート統合、loop gain / buffer 監視
DoctorはIsolation ForestとAutoencoderを組み合わせ、A_combined = α·s(x) + (1-α)·σ(ε(x)) で異常度を算出する。0.85でソフトスロットル、0.92でハードフリーズを適用し、Gate Engineと連動して潜在ガバナンス密度を調整する。さらに運用影響行列 A_t に対し exact loop gain `g_t=(1-D_t)λ_max(A_t)` と buffer `δ_buffer=1-D_t-λ_max(A_t)` を監視し、連鎖障害を早期に抑制する。
Action Router×Gate Engine合成: 責任追跡可能なルーティングの形式理論
ルーティングとゲート制御の合成により、安全性不変量を構成的に満たす実装枠組み
RouterとGateを独立順次適用すると界面で失敗が生じる。本稿は複合演算子 G∘R を導入し、安全性制約下でのルーティング品質最適化を同時に扱う。Safety Preservation定理とラグランジュ最適化により、安全性不変量を維持しつつ実行可能集合内で最適割当を求める。
Safety-Firstミニマックス生産最適化: 安全制約下のスループット設計
最悪安全リスク最小化を主目的に置き、生産下限を満たす意思決定を導く
生産最適化を『安全制約付き速度追求』ではなく『安全最小化主導』で再定式化する。ラグランジュ双対でゲート閾値を導出し、安全遵守と生産維持のバランスを明示する。
MAXスコアFail-Closed証明: 平均化ゲートの構造的限界と代替設計
平均スコアが重大リスクを覆い隠す条件を示し、MAX判定の安全特性を解析する
複数リスク軸を平均化すると、単一軸の高危険度が希釈される場合がある。MAXベース判定の安全上の利点を形式的に示し、fail-closed設計での誤許容抑制条件を提示する。