Engineering2026年6月1日19 min read

AIエージェントが業務で失敗する理由は、LLMではなくハーネス不足である

PoCでは動くのに本番化できない原因を、目的・権限・記憶・停止条件・復旧経路・監査証跡の設計から捉える

企業AIエージェントが失敗する主因は、モデル性能だけではない。目的、権限、記憶、品質、停止条件、復旧経路、監査証跡を囲うハーネスがないまま、AIに行動させようとしていることが本質である。

AI-agentDynamic-Harnessenterprise-AIHITLMARIA-OSjapanese
Engineering2026年5月30日12分

動的ハーネス駆動開発により保守されるアプリケーション

Runtime evidenceを収集し、改修計画へ変換し、AI支援プロダクトを安定運用するための汎用モデル

このアプリは動的ハーネス駆動開発により保守されています。Harness結果を運用証跡として扱い、失敗を境界付きの改修計画へ変換し、内部実装の詳細を公開せずに学習を残す方法です。

dynamic-harnessharness-driven-developmentsoftware-maintenanceruntime-governancequality-engineeringjapanese
Engineering2026年5月30日24分

ハーネス駆動開発:Runtime Evidenceから逆算してAgentic Systemを作る

実装より先にscenario、gate、scorecard、repair boundaryを設計する開発方法論

ハーネス駆動開発では、dynamic harnessをテスト補助ではなく主仕様として扱う。promptやtoolを書く前に、runtime episode、failure taxonomy、scorecard、authority boundaryを定義し、実装を測定可能な振る舞いへ収束させる。

dynamic-harnessharness-driven-developmentagent-engineeringruntime-governanceevaluation-harnessjapanese
Engineering2026年5月30日28分

MARIA Self-Healing Runtime:Agentic Systemの安全な自律改修基盤

Failure Analyzer、Meta-Harness、Envelope、Memory Store、Human Approval Gate、Loop Controlで自己修復を統治する

MARIA Self-Healing Runtimeは、MARIA OS内部の安全第一の改修runtimeである。失敗を検知し、原因を分析し、境界付き改修を計画し、review可能なPRを作り、横断Harnessで再検証し、再発防止をMemory化しながら、高リスク変更の最終責任を人間に戻す。

self-evolving-harnessmaria-self-healing-runtimeautonomous-harness-runtimeself-healing-ai-systemsruntime-governancefailure-analyzermemory-storejapanese
Engineering2026年5月30日28分

Dynamic Workflow Agent監視Harness:安全な業務Agentを量産する方法

監視ツール、品質・製造管理Harness、Loop Guard、Agent BlueprintでDynamic Workflow Agentを量産するMARIA OS設計

Dynamic Workflow Agentはpromptの複製で量産してはいけない。MARIA OSでは、すべての業務AgentをBlueprint、Harness Binding Plan、Quality Observatory、Settlement Ledger、Loop Guard、Memory改善経路を持つ製造単位として扱う。

dynamic-workflow-agentmaria-osmonitoring-harnessmanufacturing-managementquality-engineeringagent-operationsjapanese
Engineering2026年5月30日28分

安全性はfan-inに宿る:fail-closedな並列マルチハーネス設計

エージェント基盤で複数のHarnessを並列実行しても安全性を弱めないための5つの実装規律

エージェント基盤では、1つのactionに対してidentity、authority、trust、surface固有のHarnessを同時に走らせたくなる。しかしfail-closedなsystemでは、素朴な並列化が安全性を静かに弱める。この記事では、正規化されたenvelope列に対するfan-in fold、timeoutの制限側変換、DAG依存、budget、snapshotの設計規律を実装レベルで整理する。

parallel-harnessfail-closedagent-governancefan-inruntime-safetyjapanese
Engineering2026年3月8日40 min read

MARIA Voice:AGIパートナーアーキテクチャ — 感情検出からメタ認知的応答生成まで

7層プロンプト階層、5つの会話モード、ゼロレイテンシ知識注入、文レベルストリーミングが、話す前に理解する音声AIを実現する方法

音声アシスタントは質問に答える。MARIA Voiceは人間を理解する。7層プロンプト階層(憲法、アイデンティティ、応答スタイル、メタ認知、安全ゲート、ペルソナ、記憶)に基づき、MARIA Voiceは完全な認知パイプラインを実装する:キーワードベースの感情検出、コンテキスト感応型モード切替、2層知識注入、6層永続記憶、モード適応型応答生成 — すべてがリアルタイム音声用に最適化され、初回文レイテンシ800ms未満を達成。本論文では認知科学と治療的対話の理論的基盤、完全なシステムアーキテクチャ、感情・モード検出の数学モデル、そして数千の音声セッションからの運用結果を報告する。

MARIA-VoiceAGI-assistantvoice-uiemotion-detectionmeta-cognitionprompt-engineeringconversation-modeknowledge-injectionmemory-systemstreaming
Engineering2026年3月8日30 min read

Agent Tool Compiler — 自然言語からAPI設計・コード生成・実行までのコンパイルパイプライン

コンパイラとしてのAgent — NL意図を中間表現を経由して最適化された型安全なランタイムツールに変換する形式的フレームワーク

ツール生成Agentはアドホックなコード生産者である。本稿ではツール合成をコンパイル問題として再定義する。自然言語意図をIntent AST(意図の抽象構文木)に解析し、Tool IR(中間表現)に変換し、セキュリティ強化・デッドコード除去などの最適化パスを適用し、型安全な実行可能コードとしてエージェントランタイムにホットロードする。形式言語理論に基づくAgent Tool Compilerアーキテクチャを提示する。

tool-compilercode-generationapi-designself-extending-agentagentic-company
Engineering2026年3月8日30 min read

ツールを自ら書くAgent — Tool Discovery, Synthesis, Validation, Registrationの4フェーズ設計

静的ツールチェーンから自己拡張能力へ — MARIA OSのAgentが実行時に必要なツールを自ら生成する方法

通常のエージェントは人間がツールを作るのを待つ。MARIA OSのエージェントは自らツールを作る。本論文では、エージェントが不足能力を特定し、ツール実装を生成し、サンドボックス環境で正確性と安全性を検証し、OSランタイムに新ツールをホットロードする4フェーズアーキテクチャ — Discovery, Synthesis, Validation, Registration — を詳述する。ツール生成率、品質収束、マルチエージェントツール共有を形式化し、監査エージェントが実行時にOCR抽出ツールを生成したケーススタディを提示する。

tool-synthesistool-discoverytool-validationself-extending-agentagentic-company
Engineering2026年3月8日30 min read

MARIA OS 評価ハーネス:Agentの品質を測定するための標準テストインフラストラクチャ

形式的テストカテゴリ、複合スコアリング、継続的評価パイプラインによって、Agent品質を主観的評価から再現可能なエンジニアリング測定へ変革する

Agent品質は測定できなければ管理できない。従来のソフトウェアテストは決定論的な入出力マッピングを検証するが、AIエージェントは確率的かつ多段階の意思決定空間で動作し、正確さは文脈依存であり、安全性は確率的であり、ガバナンス準拠は構造的である。本論文はMARIA OS評価ハーネスを紹介する——4つのテストカテゴリ(正確性、安全性、パフォーマンス、ガバナンス準拠)、4つの主要メトリクス(意思決定精度、Gate準拠率、エビデンス品質スコア、負荷時レイテンシ)、そして形式的な複合スコアリングフレームワークを定義する標準化されたテストインフラストラクチャである。テストランナー、シナリオジェネレーター、オラクルコンパレーター、リグレッションディテクターで構成されるハーネスアーキテクチャを提示し、すべてのコンポーネントがMARIA座標系を通じてスコーピングされる。複合Agentスコアが真の品質改善に対して単調応答性を持つことを証明し、継続的評価パイプラインが本番デプロイ前に94.7%の品質回帰を検出することを実証する。

evaluation-harnessagent-qualitytestingbenchmarksagentic-company
Engineering2026年2月22日48 min read

Robot Judgment OS Lab: Designing Responsibility-Bounded Physical-World AI with Multi-Universe Gates

An agentic R&D team architecture for robot governance research — two lab divisions, eleven specialized agents, and five research themes bridging MARIA OS Multi-Universe evaluation with physical-world robotic systems

Physical-world robots demand governance architectures that digital-only agent systems cannot provide: sub-millisecond fail-closed gates, real-time multi-universe conflict detection, embodied ethical learning under sensor noise, and quantitative human-robot responsibility allocation at every decision node. This paper presents the Robot Judgment OS Lab — an agentic R&D team design embedded within the MARIA OS coordinate system, organized into two divisions (Robot Gate Architecture Lab and Embodied Learning & Conflict Lab) with eleven specialized agents operating under fail-closed research gates. We formalize five research themes: Responsibility-Bounded Robot Decision, Physical-World Conflict Mapping, Embodied Ethical Learning, Human-Robot Responsibility Matrix, and ROS2 Multi-Universe Bridge. Mathematical contributions include a real-time ConflictScore function, constrained RL for embodied ethics calibration, a four-factor responsibility decomposition protocol, safety-bounded action spaces, and a layered architecture formalization from ROS2 base through Multi-Universe, Gate, and Conflict layers. The lab design demonstrates that structured R&D governance — where research teams are themselves governed by the infrastructure they study — produces faster, safer, and more auditable advances in robot judgment than traditional unstructured robotics research.

roboticsrobot-osphysical-worldmulti-universefail-closedembodied-ethicsconflict-mappingresponsibility-matrixMARIA-OSROS2
Engineering2026年2月16日30 min read

Real-Time Meeting Session Orchestration: State Machine Design for Multi-Component Bot Systems

How a seven-state machine coordinates browser automation, audio capture, speech recognition, and live streaming into a coherent meeting intelligence pipeline

A meeting AI bot is not a single component — it is an orchestra of subsystems that must start, coordinate, and stop in precise sequence. The browser must launch before audio can be captured. Audio must flow before speech recognition begins. Recognition must produce segments before minutes can be generated. And when the meeting ends, all components must shut down gracefully without losing data. This paper presents the state machine design of MARIA Meeting AI's session manager, which coordinates Playwright browser automation, CDP audio capture, Gemini Live Audio ASR, and incremental minutes generation through a seven-state lifecycle with EventEmitter-based real-time streaming to dashboard clients.

meeting-aistate-machineorchestrationevent-drivenssereal-timeplaywrightsession-management
Engineering2026年2月15日41 min read

完全版Action Router: MARIA OSでの理論・実装・スケーリング

Intent Parser / Action Resolver / Gate Controllerの3層構成と、再帰最適化・100+エージェント運用の実装指針

Action Router理論を実装へ落とし込む3層アーキテクチャを提示する。実行結果から方策を更新する再帰最適化ループをオンライン凸最適化として定式化し、座標ベース分割・階層キャッシュ・ゾーン内解決で高スループットを実現。Decision Pipelineとの積オートマトン統合により、整合した遷移制御を行う。

action-routerscalingimplementationMARIA-OSmulti-agentstate-machinerecursive-improvement
Engineering2026年2月15日32 min read

文単位ストリーミングVUIアーキテクチャ: 認知理論からMARIA OS本番実装まで

文境界検出、順次TTSチェーン、ローリング要約により自然さと長時間セッション安定性を両立する

VUIは低遅延と自然発話品質のトレードオフを抱える。本稿は、Geminiトークン列から文境界を検出して順次TTS再生する方式を中核に、バージイン制御・発話デバウンス・ハートビート回復・ツールルーティングを統合した実装を示す。実運用セッションで低初動遅延と順序破綻ゼロを確認した。

voice-uistreamingTTSspeech-recognitionreal-timeGeminiElevenLabsaction-routerMARIA-OScognitive-science
Engineering2026年2月14日44 min read

Planet 100の通信トポロジーと情報カスケード: 100+エージェント群のボトルネック検出と帯域最適化

111エージェント通信行列のスペクトル解析により、ボトルネック署名と実用的ルーティング戦略を導出する

111エージェント通信網を重み付き有向グラフとして解析し、スペクトル分割と最小費用フロー最適化を組み合わせてボトルネックを同定する。帯域再配分により、情報カスケード失敗の低減とエンドツーエンドスループット改善を確認した。

planet-100communication-topologyinformation-cascadingbottleneck-detectionbandwidth-optimizationspectral-analysisagent-clusters
Engineering2026年2月14日17 min read

人間-エージェント混成チームの認知負荷平準化: ワークロード分配と注意配分モデル

高負荷で監督品質が崩れる理由を、待ち行列理論と疲労モデルで補正する

人間監督者の認知容量を有限資源として扱い、負荷・疲労・回復を含む動的モデルを導入する。注意配分を制約最適化として解き、重要イベントの監督カバレッジを維持しつつ過負荷閾値超過を抑えるスケジューリングを提示する。

team-designcognitive-loadworkload-distributionhuman-agent-hybridattention-allocationqueueing-theoryfatigue-modeloversight-quality
Engineering2026年2月14日18 min read

フォールトトレラントなチーム設計: 単一点障害に対するマルチエージェント耐障害アーキテクチャ

信頼性理論に基づく冗長設計で、単一エージェント障害からの崩壊リスクを下げる

本番統治システムで発生する単一点障害を対象に、直列/並列分解、Markov故障モデル、k冗長解析を適用する。最小冗長度、待機戦略、回復プロトコルを導出し、責任ローテーションを含む実装指針を示す。

team-designfault-toleranceresiliencereliability-engineeringredundancygraceful-degradationMTTFsingle-point-of-failure
Engineering2026年2月14日38 min read

エージェントチームの生産的異論プロトコル: 意思決定品質を高める構造化ディセント

合意偏重を避け、証拠ベースの反論経路と検証多様性を制度として実装する

高合意は高速だが、相関した盲点を温存しやすい。本稿は異論クオータ、独立証拠要件、解決ゲートを導入し、異論をノイズではなく検証可能な仮説生成として扱うことで、品質と速度の両立を図る。

agent-teamsdisagreement-protocolgroupthink-preventionmeta-insightdecision-qualityorganizational-learningmulti-agent-governancevalidation-diversitySEO-research
Engineering2026年2月12日36 min read

品質ゲート制御理論: 製造AIにおけるリアルタイム安定性解析

欠陥率を状態量として扱い、制御理論に基づく品質ゲート設計を行う

製造工程の欠陥率を動的システムとしてモデル化し、Lyapunov条件とPID型制御でゲート挙動を安定化する。多段工程への拡張を通じ、欠陥伝播の抑制と応答遅延の管理を同時に行う設計枠組みを示す。

manufacturingquality-gatecontrol-theorystability-analysisreal-timedefect-rategovernance
Engineering2026年2月12日45 min read

責任あるロボット判断OS: 物理世界自律系のマルチユニバースゲート制御

デジタルエージェントのfail-closed統治を、実時間ロボット判断へ拡張する

ミリ秒制約下のロボット意思決定に対し、安全・規制・効率・倫理・快適性を同時評価するゲート設計を示す。遅延、センサ雑音、身体化倫理ドリフトを含む実環境条件で責任境界を維持する。

roboticsrobot-judgmentphysical-worldfail-closedembodied-ethicsROS2MARIA-OS