Safety & Governance2026年2月14日36 min read

信頼度と証拠の結合則: エージェント統治のためのキャリブレーション設計

証拠十分性・矛盾圧・出典信頼度に応じて信頼度を制約し、高確信誤答を抑制する

信頼度を内部スコアとして独立に扱うと、証拠が弱いまま高確信出力が生じる。本稿は信頼度を証拠品質と単調結合させる法則を提示し、キャリブレーション誤差とエスカレーション精度を同時に改善する運用原理を示す。

confidence-calibrationevidence-qualitymeta-insightagentic-governancerisk-managementcalibration-errordecision-intelligenceai-reliabilitySEO-research
Mathematics2026年2月14日35 min read

ゲート付き自律運用のためのActor-Critic強化学習: 責任制約下のPPO最適化

中リスク業務を対象に、人間承認ゲートを組み込んだ方策学習を実装するControl Layer設計

PPOベースのActor-Criticを責任境界付き環境へ適用し、行動空間をゲート条件で動的制約する。方策勾配の制約項と信頼領域更新を通じて、自律性と統治準拠を同時に維持する運用枠組みを示す。

actor-criticPPOreinforcement-learninggated-autonomypolicy-gradienthuman-approvalrisk-managementagentic-companycontrol-theoryMARIA OS
Industry Applications2026年2月12日48 min read

AML検知責任ゲート最適化: 反マネロンの制約付き損失最小化

誤検知・見逃し・遅延コストを統合し、ゲート強度を連続制御として最適化する

AML運用のコスト構造を連続ゲート強度 `g` で定式化し、規制制約下で最適点を導く。二値開閉ではなく連続調整として設計することで、検知要件を維持しながら総コストを抑える。

financeamlgate-optimizationfalse-positivecompliancerisk-managementresponsibility-gates
Industry Applications2026年2月12日36 min read

Safety-Firstミニマックス生産最適化: 安全制約下のスループット設計

最悪安全リスク最小化を主目的に置き、生産下限を満たす意思決定を導く

生産最適化を『安全制約付き速度追求』ではなく『安全最小化主導』で再定式化する。ラグランジュ双対でゲート閾値を導出し、安全遵守と生産維持のバランスを明示する。

manufacturingsafetyminimaxthroughput-optimizationproductionrisk-managementgovernance