TAG ARCHIVE
self-improvement
MARIA OSブログのself-improvementタグに関連する2件の記事。ボンギンカンの判断OS、AIガバナンス、Agentic Company研究をテーマ別に参照しやすい技術記事アーカイブです。
The Brain as a Recursive Self-Improving System
Predictive coding, dopamine learning, and the millisecond A/B test running inside your skull
The human brain continuously generates predictions, measures errors, and updates its own parameters — a recursive self-improvement loop that operates across timescales from milliseconds to decades. This article explores the neuroscience of predictive coding, dopamine reward prediction error, and synaptic plasticity as a blueprint for agent evolution.
Action Routingの再帰適応: MARIA OSが実行結果から学習する仕組み
実行フィードバックで高品質方策へ収束しつつ、Lyapunov安定性を維持する自己改善ルーティング
固定ルール型ルーティングでは、能力変化や負荷変動に追従できない。本稿は実行結果を用いて θ_{t+1}=θ_t+η∇J(θ_t) で方策を更新する再帰適応を提案する。確率近似の下での収束性とLyapunov安定性を示し、Thompson samplingと多エージェント協調で探索と競合抑制を両立する。