CATEGORY ARCHIVE

Safety & Governance

MARIA OSのSafety & Governanceカテゴリに属する20件の記事。ボンギンカン、判断OS、AIガバナンス、決断インテリジェンス、エージェント型組織に関する研究・実装知見を分類して掲載しています。

20 件の記事|発行元: Bonginkan

判断OS / 決断インテリジェンスOS

組織の判断を実行可能な意思決定システムに変換するMARIA OS中核研究。

エージェント型企業アーキテクチャ

人間とエージェントの組織、委任境界、役割トポロジー、ガバナンス付き自律性に関する研究。

責任ゲートとAIガバナンス

AIエージェントの安全性、説明責任、フェイルクローズドゲート、監査可能性、HITL制御。

マルチエージェント数学

収束、安定性、ゲーム理論、グラフダイナミクス、マルチエージェント評価の形式モデル。

エビデンス、RAG、ナレッジガバナンス

エビデンスバンドル、検索アーキテクチャ、Graph RAG、ナレッジトラスト、監査可能な推論パイプライン。

Agentic R&Dと判断科学

研究運用、シミュレーションラボ、判断科学、再帰的改善、実験的AIガバナンス。

Safety & Governance2026年5月30日40 min read

運用されるAIガバナンスは技術的優位性になるか：MARIA OSの現実的評価

内部では自動復旧を攻め、外部ではHITLを厚くする。責任契約・fail-closed・回復経路を実装レイヤーで見る

企業AIの次の優位性は、完全自律を主張することではなく、どこで止めるか、どう復旧するか、人間の責任をどう残すかを本番運用で証明することから生まれる。本稿では、ボンギンカンのMARIA OSが持ちうる技術的優位性と、グローバル・日本市場での現実的な位置づけを、過剰な断定を避けて評価する。

MARIA-OStechnical-moatagent-governanceHITLfail-closedoperational-aijapanese

Safety & Governance2026年5月30日26分

自動改修ハーネス：Runtime Failureを安全でReview可能な改善へ変換する

Failure episode、repair proposal、rollback envelope、approval boundaryによるself-healing agentic system

自動改修は自動実装の次段階である。Dynamic harnessはruntime failureを観測し、driftを分類し、repairを下書きし、evidenceをreplayし、rollbackとapproval boundaryを通してpatchをrouteできる。ただしagentが自分自身の憲法を書き換えることは許さない。

dynamic-harnessauto-repairself-healingruntime-episodesagent-governancejapanese

Safety & Governance2026年3月8日28 min read

ガバナンス下のツール生成：生成コードを安全にコマンド化する方法

サンドボックス検証、権限昇格モデル、監査証跡、ロールバック機構による自己拡張エージェントシステムの安全性フレームワーク

AIエージェントが生成したコードが本番システムの新しいコマンドになりうるとき、そのコードのすべての行が攻撃対象面となる。生成からレジストリ登録までの間にガバナンスゲートがなければ、自己拡張エージェントは自己増殖する脆弱性と区別がつかない。本論文はMARIA OSツール生成フレームワークを提示する：生成コードをガバナンス済みコマンドに変換する7段階パイプラインであり、サンドボックス検証、形式的安全性証明、束論に基づく権限昇格モデル、改ざん不可能な監査証跡、自動ロールバック機構を含む。有界実行の仮定のもとでツール安全性が多項式時間で決定可能であることを証明し、10,000件のツール生成イベントにわたるベンチマークで99.7%の安全性コンプライアンスを12%のレイテンシオーバーヘッドで達成することを示す。中心的命題：自己拡張は危険ではない。ガバナンスなき自己拡張が危険なのだ。

tool-genesiscode-generationgovernanceself-extending-agentagentic-company

Safety & Governance2026年2月22日48 min read

Open Ethics Specification: Designing a Public Research Framework for Structural AI Governance

A four-layer public architecture that transforms the Agentic Ethics Lab from a corporate research institute into an open, reproducible, and standards-defining initiative for structural AI ethics

Open ethics declarations without structural enforcement are organizational theater, and closed ethics research without external validation is institutional self-deception. This paper presents the Open Ethics Specification — a public research framework that exposes the Agentic Ethics Lab's structural ethics methodology to external scrutiny, academic collaboration, and industry adoption. We formalize a four-layer public architecture (White Papers, Open Ethics Specification, Open Simulation Sandbox, Industry Collaboration Program), prove that open-closed information boundaries preserve commercial viability while maximizing trust accumulation, and demonstrate that a mathematically rigorous open research initiative outperforms closed proprietary ethics in regulatory alignment, talent acquisition, and long-term enterprise valuation. The framework introduces formal models for trust accumulation, standard adoption diffusion, and research quality metrics — all grounded in the MARIA OS coordinate system and fail-closed governance architecture.

open-ethicspublic-researchethics-specificationethics-dslgovernancestandardsMARIA-OSfail-closedtrust-architecture

Safety & Governance2026年2月16日28 min read

Gated Meeting Intelligence: Fail-Closed Privacy Architecture for AI-Powered Meeting Transcription

Designing consent, scope, and export gates that enforce data sovereignty before a single word is stored

When an AI bot joins a meeting, the first question is not 'what was said?' but 'who consented to recording?' This paper formalizes the gate architecture behind MARIA Meeting AI — a system where Consent, Scope, Export, and Speak gates form a fail-closed barrier between raw audio and persistent storage. We derive the gate evaluation algebra, prove that the composition of fail-closed gates preserves the fail-closed property, and show how the Scope gate implements information-theoretic privacy bounds by restricting full transcript access to internal-only meetings. In production deployments, the architecture achieves zero unauthorized data retention while adding less than 3ms latency per gate evaluation.

meeting-aiconsent-gateprivacyfail-closedtranscriptiongovernancedata-sovereigntygate-engine

Safety & Governance2026年2月16日32 min read

Agentic Companyにおけるミッション制約付き最適化

価値を保存しながらゴール実行を行うための数理フレームワーク

局所的なゴール最適化は組織ミッションと衝突する。この衝突を7次元ミッション価値ベクトル上の制約付き最適化問題として定式化し、アラインメントスコアとペナルティベース目的関数を導出する。価値毀損を防ぎつつゴール追求パフォーマンスを保つ3段階意思決定ゲートアーキテクチャを提示する。

mission-alignmentconstrained-optimizationmvv-vectorvalue-gatesrecursive-self-improvementagentic-company

Safety & Governance2026年2月14日46 min read

高密度エージェント網における責任伝播: Planet 100の111エージェント意思決定フロー解析

拡散方程式とfail-closed境界条件に基づき、責任フローの保存とボトルネックを形式解析する

Planet 100ネットワークの責任伝播を熱拡散類推でモデル化し、責任保存定理を導出する。責任が蓄積しやすいボトルネック領域を特定し、fail-closedゲートが責任ギャップを防ぐ条件を理論と実験の両面で示す。

planet-100responsibility-propagationdecision-flowagent-networksfail-closedgovernancediffusion-model

Safety & Governance2026年2月14日44 min read

LOGOSとAI審判: 国家AIシステムにおける意思決定パターン、持続可能性最適化、改憲動学

多目的最適化と民主的オーバーライドの確率過程から、国家ごとのAI戦略分岐を説明する

各国家のLOGOSが最適化する持続可能性目的を制約付き多目的問題として定義し、Pareto前線上の選択が戦略分岐を生む条件を示す。改憲によるAI勧告の上書き過程を閾値確率モデルとして扱い、衝突発生条件を整理する。

civilizationLOGOSAI-tribunalsustainability-optimizationconstitutional-amendmentmulti-objectivenational-AIgovernance

Safety & Governance2026年2月14日17 min read

マルチエージェントチームの責任配分: 連続割当関数による自律性と説明責任の両立

責任を保存量として扱い、漏れなく配分するための設計原理

複数エージェント協働時の責任配分を、総和1.0を満たす連続資源配分問題としてモデル化する。fail-closed制約下での配分関数を導出し、ゲート強度が自律性と説明責任のトレードオフに与える影響を明確化する。

team-designresponsibility-distributionautonomy-accountabilityallocation-functionsconservation-lawfail-closedgovernancezero-sum

Safety & Governance2026年2月14日44 min read

ガバナンス制約下の再帰的自己改善: 収縮写像とLyapunov安定性による制御再帰

無制約RSIを収束型自己補正へ変換し、改善速度と整合性維持を両立する形式枠組み

再帰的自己改善を M_{t+1}=R_sys ∘ R_team ∘ R_self(M_t,E_t) として定式化し、gamma<1 の収縮条件で固定点収束を保証する。さらにHuman-in-the-LoopゲートをLyapunov的安全境界として扱い、SRIの乗法構造が単一層劣化を全体評価へ反映して暴走改善を抑制することを示す。

meta-insightrecursive-self-improvementAI-safetyLyapunov-stabilitycontraction-mappinggoverned-recursionHITLalignmentMARIA-OSgovernance

Safety & Governance2026年2月14日36 min read

信頼度と証拠の結合則: エージェント統治のためのキャリブレーション設計

証拠十分性・矛盾圧・出典信頼度に応じて信頼度を制約し、高確信誤答を抑制する

信頼度を内部スコアとして独立に扱うと、証拠が弱いまま高確信出力が生じる。本稿は信頼度を証拠品質と単調結合させる法則を提示し、キャリブレーション誤差とエスカレーション精度を同時に改善する運用原理を示す。

confidence-calibrationevidence-qualitymeta-insightagentic-governancerisk-managementcalibration-errordecision-intelligenceai-reliabilitySEO-research

Safety & Governance2026年2月14日42 min read

再帰AIフィードバックループの防御: Meta-Insightにおける敵対的反省ハードニング

プロンプト注入・フィードバック汚染・方策乗っ取りに対する多層防御フレームワーク

自己改善ループの学習チャネルは同時に攻撃面でもある。本稿は出典検証、異常スコアリング、ロバスト更新、隔離運用を組み合わせ、適応性能を維持しながら攻撃時の劣化を有界化する設計を示す。

adversarial-aifeedback-poisoningprompt-injectionmeta-insightrecursive-intelligencesecurity-governanceagentic-companypolicy-hardeningSEO-research

Safety & Governance2026年2月14日36 min read

エージェントシステム安全のための異常検知: Deviation Controlの実装

Isolation ForestとAutoencoder再構成誤差で構成する安全監視レイヤー

運用逸脱の早期検知を目的に、木ベース異常度と再構成誤差を併用した監視系を設計する。異常時のthrottle/freezeカスケードと安定条件 `spectral_radius < 1 - governance_density` を運用ガードとして実装する。

anomaly-detectionisolation-forestautoencoderdeviation-monitoringrunaway-agentfraud-detectionsafety-layerreconstruction-erroragentic-companyMARIA OS

Safety & Governance2026年2月12日42 min read

責任階層型RAG出力制御: ゲート統治で検索生成精度を高める数理モデル

Top-k最適化に加えて、リスク階層に応じた検証強度制御を導入する

RAG精度を検索品質だけでなく検証統治で引き上げるため、責任ティア別ゲートを設計する。低リスク高速応答を維持しつつ、高リスク回答の検証密度を高めてハルシネーション低減を図る。

RAGresponsibility-gatesrisk-tiershallucination-reductionHITLmathematical-models

Safety & Governance2026年2月12日44 min read

エージェント統治のFail-Closedゲート設計: 責任分解と最適エスカレーション

責任境界を崩さないための最小アーキテクチャとしてのゲート制御

本番変更や外部呼び出しの意思決定に対し、失敗時に閉じるゲートを責任分解の基盤として定式化する。人間介入率と遅延のトレードオフを最適化し、責任被覆を維持する設計を示す。

fail-closedagent-governanceresponsibility-gatesrisk-scoringHITLoptimization

Safety & Governance2026年2月12日45 min read

実行可能アーキテクチャとしての倫理: 多主体AI統治の計算可能制約化

宣言的倫理を、制約エンジン・ドリフト監視・検証サンドボックスへ落とし込む

倫理原則を運用可能にするため、数式制約化・時系列ドリフト検知・価値衝突可視化・監督整合評価を統合する。導入前シミュレーションで倫理影響を検証する実装フレームを示す。

ethicsconstraint-formalizationdrift-detectionconflict-mappingsandbox-simulationhuman-oversightMARIA-OSresponsible-aigovernancefail-closed

Safety & Governance2026年2月12日45 min read

自律系における倫理学習: 責任報酬と長期道徳記憶を持つ制約付き強化学習

倫理を固定ルールではなく、学習可能で進化可能なシステム特性として設計する

責任拡張報酬と倫理記憶を組み込んだ制約付きRLにより、安全不変量を守りながら価値適応を行う。文化差分や倫理負荷を含む運用指標を導入し、長期安定性を評価する。

constrained-rlethical-memoryvalue-hierarchycross-cultural-ethicsmoral-stressMARIA-OS

Safety & Governance2026年1月24日24 min read

責任移転の定量化: 自動化が責任を減らすのかを検証する形式モデル

実行責任と結果責任を分離し、移転後も保存される責任量を定義する

自動化によって責任が消えるのではなく、形を変えて移る現象を数理化する。`T(h->a)` を用いて責任移転を記述し、結果責任保存則の下でのガバナンス設計を明確化する。

responsibilityautomationgovernancemathematical-modelconservation-lawdecision-theory

Safety & Governance2026年1月2日36 min read

リスクティア設計の数理基準: 影響・不可逆性・規制圧の統合スコア

ヒューリスティック分類を置き換える、しきい値導出可能な評価関数

影響範囲・不可逆性・規制強度の3軸を連続量で統合し、意思決定のリスクティアを計算する。損失関数ベースでしきい値を導出し、業種別校正が可能な分類枠組みを提示する。

risk-tiersscoring-functionsthreshold-designregulatory-compliancedecision-classificationloss-functions

Safety & Governance2025年12月22日23 min read

可逆性の形式化: 可逆/不可逆意思決定のリスク差分解析

可逆性を連続指標で評価し、ゲート強度を意思決定特性に合わせて校正する

意思決定の危険度を可逆性 `Rev(d)` で連続評価し、低可逆性案件に対するリスク増幅を定量化する。可逆性に反比例した統治強度設計で、安全性と運用効率の両立を図る。

reversibilityrisk-analysisgate-calibrationdecision-theoryirreversibilitygovernance