ブログへ戻る

TAG ARCHIVE

multi-armed-bandit

MARIA OSブログのmulti-armed-banditタグに関連する2件の記事。ボンギンカンの判断OS、AIガバナンス、Agentic Company研究をテーマ別に参照しやすい技術記事アーカイブです。

2 件の記事|発行元: Bonginkan

判断OS / 決断インテリジェンスOS

組織の判断を実行可能な意思決定システムに変換するMARIA OS中核研究。

エージェント型企業アーキテクチャ

人間とエージェントの組織、委任境界、役割トポロジー、ガバナンス付き自律性に関する研究。

マルチエージェント数学

収束、安定性、ゲーム理論、グラフダイナミクス、マルチエージェント評価の形式モデル。

エビデンス、RAG、ナレッジガバナンス

エビデンスバンドル、検索アーキテクチャ、Graph RAG、ナレッジトラスト、監査可能な推論パイプライン。

Agentic R&Dと判断科学

研究運用、シミュレーションラボ、判断科学、再帰的改善、実験的AIガバナンス。

Architecture2026年2月14日35 min read

エージェント組織のアルゴリズムスタック: 7層アーキテクチャに対応する必須10手法

生成AI単体では埋まらない運用要件を、7層統合とレビュー比率制御で補完する

自律運用企業には、言語理解だけでなく意思決定予測、状態制御、構造推論、異常検知が同時に必要となる。本稿は10アルゴリズムを7層に対応付け、7状態/6遷移パイプライン、劣化時のエスカレーション、運用レビュー比率 `R_review` を含む統合設計指針を示す。

algorithm-stacktransformergradient-boostingrandom-forestMDPactor-criticmulti-armed-banditGNNPCAclustering
Intelligence2026年2月14日32 min read

企業戦略最適化のためのMulti-Armed Bandit: Thompson/UCB/Contextual手法の実装

探索と活用のトレードオフを、Layer 5の戦略探索基盤として定式化する

既知戦略の活用と新規戦略の探索を同時に扱うため、Thompson sampling・UCB・Contextual Banditを比較設計する。後悔最小化指標を経営運用へ接続し、戦略エンジンへの組み込み手順を示す。

multi-armed-banditThompson-samplingUCBexploration-exploitationstrategy-optimizationA/B-testingpricingresource-allocationagentic-companyMARIA OS