ブログへ戻る
TAG ARCHIVE
cognitive-science
MARIA OSブログのcognitive-scienceタグに関連する2件の記事。ボンギンカンの判断OS、AIガバナンス、Agentic Company研究をテーマ別に参照しやすい技術記事アーカイブです。
Engineering2026年2月15日32 min read
文単位ストリーミングVUIアーキテクチャ: 認知理論からMARIA OS本番実装まで
文境界検出、順次TTSチェーン、ローリング要約により自然さと長時間セッション安定性を両立する
VUIは低遅延と自然発話品質のトレードオフを抱える。本稿は、Geminiトークン列から文境界を検出して順次TTS再生する方式を中核に、バージイン制御・発話デバウンス・ハートビート回復・ツールルーティングを統合した実装を示す。実運用セッションで低初動遅延と順序破綻ゼロを確認した。
voice-uistreamingTTSspeech-recognitionreal-timeGeminiElevenLabsaction-routerMARIA-OScognitive-science
Intelligence2026年2月15日35 min read
VUI設計の認知科学的基盤: マルチモーダル対話における注意資源配分モデル
多重資源理論・ワーキングメモリ理論・情報理論を統合し、設計原則を形式化してMARIA VOICEで検証する
VUI設計を経験則から脱し、聴覚処理の特性に基づく数理モデルとして再定式化する。文単位TTS、1.2秒デバウンス、バージイン抑制、ローリング要約の設計判断を理論的に導出し、MARIA VOICE実装での妥当性を検証する。
voice-uicognitive-scienceinformation-theoryworking-memoryattention-resourcesmultimodal-interactionspeech-processingmaria-voiceformal-methodshuman-computer-interaction