ブログへ戻る

TAG ARCHIVE

self-improvement

MARIA OSブログのself-improvementタグに関連する2件の記事。ボンギンカンの判断OS、AIガバナンス、Agentic Company研究をテーマ別に参照しやすい技術記事アーカイブです。

2 件の記事|発行元: Bonginkan

判断OS / 決断インテリジェンスOS

組織の判断を実行可能な意思決定システムに変換するMARIA OS中核研究。

エージェント型企業アーキテクチャ

人間とエージェントの組織、委任境界、役割トポロジー、ガバナンス付き自律性に関する研究。

マルチエージェント数学

収束、安定性、ゲーム理論、グラフダイナミクス、マルチエージェント評価の形式モデル。

エビデンス、RAG、ナレッジガバナンス

エビデンスバンドル、検索アーキテクチャ、Graph RAG、ナレッジトラスト、監査可能な推論パイプライン。

Agentic R&Dと判断科学

研究運用、シミュレーションラボ、判断科学、再帰的改善、実験的AIガバナンス。

Theory2026年3月7日13 min read

The Brain as a Recursive Self-Improving System

Predictive coding, dopamine learning, and the millisecond A/B test running inside your skull

The human brain continuously generates predictions, measures errors, and updates its own parameters — a recursive self-improvement loop that operates across timescales from milliseconds to decades. This article explores the neuroscience of predictive coding, dopamine reward prediction error, and synaptic plasticity as a blueprint for agent evolution.

neurosciencepredictive-codingrecursive-improvementdopamineMARIA-VITALagent-evolutionlearningself-improvement
Intelligence2026年2月15日36 min read

Action Routingの再帰適応: MARIA OSが実行結果から学習する仕組み

実行フィードバックで高品質方策へ収束しつつ、Lyapunov安定性を維持する自己改善ルーティング

固定ルール型ルーティングでは、能力変化や負荷変動に追従できない。本稿は実行結果を用いて θ_{t+1}=θ_t+η∇J(θ_t) で方策を更新する再帰適応を提案する。確率近似の下での収束性とLyapunov安定性を示し、Thompson samplingと多エージェント協調で探索と競合抑制を両立する。

action-routerrecursive-learningadaptationMARIA-OSreinforcement-learningexecution-feedbackself-improvement