ブログへ戻る
TAG ARCHIVE
actor-critic
MARIA OSブログのactor-criticタグに関連する2件の記事。ボンギンカンの判断OS、AIガバナンス、Agentic Company研究をテーマ別に参照しやすい技術記事アーカイブです。
Architecture2026年2月14日35 min read
エージェント組織のアルゴリズムスタック: 7層アーキテクチャに対応する必須10手法
生成AI単体では埋まらない運用要件を、7層統合とレビュー比率制御で補完する
自律運用企業には、言語理解だけでなく意思決定予測、状態制御、構造推論、異常検知が同時に必要となる。本稿は10アルゴリズムを7層に対応付け、7状態/6遷移パイプライン、劣化時のエスカレーション、運用レビュー比率 `R_review` を含む統合設計指針を示す。
algorithm-stacktransformergradient-boostingrandom-forestMDPactor-criticmulti-armed-banditGNNPCAclustering
Mathematics2026年2月14日35 min read
ゲート付き自律運用のためのActor-Critic強化学習: 責任制約下のPPO最適化
中リスク業務を対象に、人間承認ゲートを組み込んだ方策学習を実装するControl Layer設計
PPOベースのActor-Criticを責任境界付き環境へ適用し、行動空間をゲート条件で動的制約する。方策勾配の制約項と信頼領域更新を通じて、自律性と統治準拠を同時に維持する運用枠組みを示す。
actor-criticPPOreinforcement-learninggated-autonomypolicy-gradienthuman-approvalrisk-managementagentic-companycontrol-theoryMARIA OS