ブログへ戻る
TAG ARCHIVE
constrained-rl
MARIA OSブログのconstrained-rlタグに関連する2件の記事。ボンギンカンの判断OS、AIガバナンス、Agentic Company研究をテーマ別に参照しやすい技術記事アーカイブです。
判断OS / 決断インテリジェンスOS
組織の判断を実行可能な意思決定システムに変換するMARIA OS中核研究。
エージェント型企業アーキテクチャ
人間とエージェントの組織、委任境界、役割トポロジー、ガバナンス付き自律性に関する研究。
責任ゲートとAIガバナンス
AIエージェントの安全性、説明責任、フェイルクローズドゲート、監査可能性、HITL制御。
マルチエージェント数学
収束、安定性、ゲーム理論、グラフダイナミクス、マルチエージェント評価の形式モデル。
エビデンス、RAG、ナレッジガバナンス
エビデンスバンドル、検索アーキテクチャ、Graph RAG、ナレッジトラスト、監査可能な推論パイプライン。
Agentic R&Dと判断科学
研究運用、シミュレーションラボ、判断科学、再帰的改善、実験的AIガバナンス。
Theory2026年2月12日52 min read
統治付き意思決定科学としてのAgentic R&D: 速度・品質・責任を両立する6研究領域
6つの数理研究プログラムと4つの混成チームで、研究活動自体を監査可能な意思決定系として設計する
判断改善の研究プロセスそのものを統治対象に置くため、仮説生成・検証・更新をfail-closedゲートで管理するResearch Universeを提示する。6研究領域を同一責任モデルで接続し、再現可能な研究運用基盤を定義する。
agentic-rdresearch-architecturespeculative-pipelineincremental-evaluationbelief-calibrationconflict-quality-loopconstrained-rlhuman-in-the-loopresearch-universejudgment-science
Safety & Governance2026年2月12日45 min read
自律系における倫理学習: 責任報酬と長期道徳記憶を持つ制約付き強化学習
倫理を固定ルールではなく、学習可能で進化可能なシステム特性として設計する
責任拡張報酬と倫理記憶を組み込んだ制約付きRLにより、安全不変量を守りながら価値適応を行う。文化差分や倫理負荷を含む運用指標を導入し、長期安定性を評価する。
constrained-rlethical-memoryvalue-hierarchycross-cultural-ethicsmoral-stressMARIA-OS