ブログへ戻る

TAG ARCHIVE

speech-recognition

MARIA OSブログのspeech-recognitionタグに関連する1件の記事。ボンギンカンの判断OS、AIガバナンス、Agentic Company研究をテーマ別に参照しやすい技術記事アーカイブです。

1 件の記事|発行元: Bonginkan

判断OS / 決断インテリジェンスOS

組織の判断を実行可能な意思決定システムに変換するMARIA OS中核研究。

責任ゲートとAIガバナンス

AIエージェントの安全性、説明責任、フェイルクローズドゲート、監査可能性、HITL制御。

エビデンス、RAG、ナレッジガバナンス

エビデンスバンドル、検索アーキテクチャ、Graph RAG、ナレッジトラスト、監査可能な推論パイプライン。

Agentic R&Dと判断科学

研究運用、シミュレーションラボ、判断科学、再帰的改善、実験的AIガバナンス。

Engineering2026年2月15日32 min read

文単位ストリーミングVUIアーキテクチャ: 認知理論からMARIA OS本番実装まで

文境界検出、順次TTSチェーン、ローリング要約により自然さと長時間セッション安定性を両立する

VUIは低遅延と自然発話品質のトレードオフを抱える。本稿は、Geminiトークン列から文境界を検出して順次TTS再生する方式を中核に、バージイン制御・発話デバウンス・ハートビート回復・ツールルーティングを統合した実装を示す。実運用セッションで低初動遅延と順序破綻ゼロを確認した。

voice-uistreamingTTSspeech-recognitionreal-timeGeminiElevenLabsaction-routerMARIA-OScognitive-science