TAG ARCHIVE

constrained-rl

MARIA OSブログのconstrained-rlタグに関連する2件の記事。ボンギンカンの判断OS、AIガバナンス、Agentic Company研究をテーマ別に参照しやすい技術記事アーカイブです。

判断OS / 決断インテリジェンスOS

組織の判断を実行可能な意思決定システムに変換するMARIA OS中核研究。

エージェント型企業アーキテクチャ

人間とエージェントの組織、委任境界、役割トポロジー、ガバナンス付き自律性に関する研究。

責任ゲートとAIガバナンス

AIエージェントの安全性、説明責任、フェイルクローズドゲート、監査可能性、HITL制御。

マルチエージェント数学

収束、安定性、ゲーム理論、グラフダイナミクス、マルチエージェント評価の形式モデル。

エビデンス、RAG、ナレッジガバナンス

エビデンスバンドル、検索アーキテクチャ、Graph RAG、ナレッジトラスト、監査可能な推論パイプライン。

Agentic R&Dと判断科学

研究運用、シミュレーションラボ、判断科学、再帰的改善、実験的AIガバナンス。

統治付き意思決定科学としてのAgentic R&D: 速度・品質・責任を両立する6研究領域

6つの数理研究プログラムと4つの混成チームで、研究活動自体を監査可能な意思決定系として設計する

判断改善の研究プロセスそのものを統治対象に置くため、仮説生成・検証・更新をfail-closedゲートで管理するResearch Universeを提示する。6研究領域を同一責任モデルで接続し、再現可能な研究運用基盤を定義する。

倫理を固定ルールではなく、学習可能で進化可能なシステム特性として設計する

責任拡張報酬と倫理記憶を組み込んだ制約付きRLにより、安全不変量を守りながら価値適応を行う。文化差分や倫理負荷を含む運用指標を導入し、長期安定性を評価する。