1. 専門知識の脆弱性の問題
1.1 挑戦の規模
世界の保険業界は米国だけで約 280 万人を雇用しており、引受業務は価値創造の中核を担っています。商業不動産の上級保険会社は、単にチェックリストを適用するだけではありません。建物の建設データ、損失履歴、地理的危険への曝露、占有特性、防火システム、管理品質シグナル、市場状況を総合的なリスク評価に統合し、リスクを受け入れるか拒否するか、そしてどのような価格でリスクを受け入れるかを決定します。この統合には何百もの暗黙のルールが含まれており、その多くは保険会社が明示的に説明することができません。これらのルールは、何十年にもわたって何千件もの申請にさらされて開発されたパターン認識に組み込まれています。
組織が AI 引受エージェントを導入する場合、通常は 2 つのパスのいずれかに従います。最初のパスは教師あり学習です。専門家の承諾/辞退の結果と価格設定をラベルとして使用して、過去の引受決定に基づいてモデルをトレーニングします。 2 番目のパスはルール抽出です。専門家にインタビューし、決定ルールを成文化し、AI エージェントが参照する決定論的なルール エンジンとして実装します。どちらのパスも同じ基本的な問題に悩まされています。つまり、専門家の推論構造を保持せずに専門家の出力を取得するということです。
具体的な例を考えてみましょう。大規模な倉庫を評価する上級引受会社は、次の 3 つの要素間の複雑な相互作用に基づいてリスクを辞退する可能性があります。建物の防火評価は限界に達している (ただし、単独では許容可能)、占有には、回収の可能性が限られた高額在庫が含まれている (関連するが、単独では失格ではない)、損失履歴は、不適切なメンテナンスを示唆する少額の損耗請求のパターンを示している (個別には弱いシグナル)。これらの要因はいずれも、それ自体が下落を引き起こすことはありません。引受会社の専門知識は、相互作用を認識することにあります。これら 3 つの限界シグナルが同時に発生すると、歴史的に 3 ~ 5 年以内に重大度の大きな損失につながるリスク プロファイルを示します。
結果に基づいてトレーニングされた教師あり学習モデルは、トレーニング データに十分な例が含まれている場合、このリスクを回避することを学習します。しかし、それは誤った相互作用を学習する可能性があります。つまり、衰退を 3 つの要因のうちの 2 つと関連付けたり、まったく異なる組み合わせと関連付けたりする可能性があります。ルールベースのシステムは、専門家が明確に説明すれば 3 要素の相互作用を捉えますが、専門家が最も洗練された推論を明確に説明することはめったにありません。それはまさに、それが意識的な分析の閾値以下で機能するためです。
1.2 論理損失の結果
AI エージェントへの転送中にエキスパート ロジックが失われると、次の 3 つのカテゴリの障害が発生します。
サイレント劣化 エージェントは、現在のビジネス書に関する専門家の決定と統計的に類似した決定を下しますが、新規の提出には一般化できません。エージェントは専門家の「分布」を学習しましたが、その「ロジック」は学習しませんでした。市場の状況が変化したり、新しい建物タイプが出現したり、規制要件が変化したりすると、代理店の決定は専門家の決定と乖離します。この相違は、過去のテスト セットでは検出できないため沈黙しています。これは、数年後に損失が現実化した場合にのみ明らかになります。
境界の浸食。 専門の保険会社は、規制要件、再保険契約の条件、または過去の壊滅的な損失からの厳しい教訓を反映した明確な決定境界を維持しています。これらの境界線は交渉の余地のないものです。洪水地帯から 500 フィート以内の建物は、501 フィートの建物とは根本的に異なって扱われます。これは、その境界線で物理的リスクが変化するためではなく、再保険条約がそれを要求しているためです。機械学習モデルは、その性質上、これらの境界を滑らかにして勾配を形成します。エージェントは、専門家がきっぱりと断ったであろう、わずかに高い価格設定で 498 フィートのリスクを受け入れる可能性があります。価格差は条約違反を補填するものではありません。
インタラクションの崩壊。 専門家の推論には、機能間の高次のインタラクションが含まれます。上記のウェアハウスの例は 3 方向のインタラクションです。標準的な機械学習アーキテクチャは、特徴空間に明示的に組み込まれない限り、高次の相互作用に苦労します。ディープ ニューラル ネットワークは理論的にはあらゆる相互作用を表現できますが、正しい相互作用を学習したことを検証するメカニズムは提供しません。その結果、エージェントは、専門家の判断と保険数理表を区別する複雑な条件ロジックを体系的に過小評価することになります。
1.3 精度が十分ではない理由
これらの懸念に対する従来の対応は、予測精度を測定することです。エージェントが送信内容の 95% について専門家と一致する場合、そのエージェントのパフォーマンスは良好です。この指標は 3 つの理由から誤解を招く危険があります。
まず、引受業務は階級の不均衡の問題です。エキスパートが送信の 85% を受け入れる場合、すべてを受け入れるエージェントは 85% の精度を達成します。専門家の最も重要なリスク判断を表す 15% の偏角が完全に欠落しています。
第 2 に、観察された分布に基づいて精度が測定されます。エージェントが明日直面する提出物は、トレーニング セットのものと異なる場合があります。論理の保存により一般化が保証されます。精度はそうではありません。
第三に、2 人のエージェントの精度は同じでも、推論は大きく異なる場合があります。エージェント A は、火災リスクの高い物件を正しく断り、洪水リスクの高い物件を誤って受け入れる可能性がありますが、エージェント B はその逆を行います。どちらも同じ精度を達成しますが、故障モードはまったく異なります。洪水が発生しやすい地域にエージェント A を展開する組織は、エージェント B のロジックで回避できたはずの損失を被ることになります。
これらの理由から、知識伝達の質の正しい尺度は出力の正確さではなく、論理保存、つまりエージェントの内部推論構造が専門家の意思決定プロセスをどの程度忠実に表現しているかであると私たちは主張します。これは、継承関数の形式化によって解決される問題です。
2. エキスパートロジックの形式表現
2.1 決定述語の分解
論理の保存を正式に検証するには、まず専門家の推論を構造的な比較に適した形式で表現する必要があります。専門家の意思決定関数をアトミックな論理単位に分割する意思決定述語分解 (DPD) を導入します。
定義 1 (決定述語)。 決定述語 p は、引受特徴空間 X 上のブール値関数です。
各述語は、専門家の推論における単一の評価可能な条件を表します。例としては次のものが挙げられます。
- 建物築年数(x) > 40 年の場合、p_1(x) = 1
- fire_protection_class(x) >= 7 の場合、p_2(x) = 1
- loss_ratio_5yr(x) > 0.65 の場合、p_3(x) = 1
- distance_to_coast(x) < 1 マイル AND construction_type(x) = "frame" の場合、p_4(x) = 1
述語には単一の特徴 (p_1、p_2、p_3) または特徴の相互作用 (p_4) が含まれる場合があることに注意してください。専門家が使用するすべての述語のセットが述語語彙を構成します。
定義 2 (述語語彙)。 エキスパート保険会社の述語語彙 V_expert は、決定機能を完全に特徴付ける決定述語の有限セットです。
ここで、K は専門家が使用するアトミックな決定条件の数です。経験的に、商業不動産の上級引受会社は、80 ~ 200 の述語の範囲で K を使用して業務を行っていますが、明示的に表現できるのは 30 ~ 50% だけかもしれません。
2.2 専門家の意思決定機能
述語語彙が与えられると、専門家の決定関数は述語のブール値の組み合わせになります。
ここで、Φ は K 個のバイナリ入力に対するブール関数です。最も単純なケースでは、Φ は結合 (すべての条件が満たされた場合に受け入れ) または論理和 (何らかの危険信号が存在する場合に拒否) です。実際には、専門家の推論には、複雑な入れ子になった条件文が含まれます。
この表現は、次の場合にリスクを受け入れる: (建物が新しく、十分に保護されている)、または (損失履歴がきれいで、海岸にさらされておらず、占有の危険性が低い)、または (アカウントが大きく、管理が洗練されており、防火設備が適切で、適用範囲の制限がない) の場合にリスクを受け入れます。専門家は、この形式的な表記法で推論を表現できない場合がありますが、構造化された引き出しと決定木分析を通じて、専門家の決定をこの形式に分解できます。
2.3 述語語彙の抽出
述語語彙は、次の 3 つの補完的な方法を通じて抽出されます。
方法 1: 構造化された専門家の抽出。 分野の専門家は、過去の特定の事例をたどることによって意思決定ルールを導き出す認知タスク分析プロトコルである重要な意思決定法 (CDM) を使用してインタビューされます。専門家は各ケースについての推論を語り、面接官はその語りから意思決定の述語を特定します。この方法では、専門家が意識的に表現できる述語語彙の約 40 ~ 60% が捕捉されます。
方法 2: デシジョン ツリー誘導。 デシジョン ツリーは、専門家が利用できるものと同じ機能を使用して、専門家の過去の決定に基づいてトレーニングされます。ツリーの分割条件は、決定述語に直接対応します。ツリーは、人間の引受人の予想される認知能力に一致する深さと複雑さに制限されており (最大深さ 8 ~ 12、最大リーフ数 50 ~ 150)、人間の推論を反映しない過度に粒度の高い述語をアルゴリズムが学習するのを防ぎます。この方法は、専門家が暗黙的に使用する述語、つまり専門家が一貫して従うものの明確に表現できないパターンを捕捉します。
方法 3: 反事実の調査 専門家には、単一の特徴の次元が異なる提出物のペアが提示され、承認/拒否の決定が記録されます。決定の変更により、決定述語として機能する特徴が特定されます。この方法は、言語誘発やツリー誘導では確実に捕捉できない境界条件や相互作用効果を特定するのに特に効果的です。
3 つの方法すべての述語を結合すると、完全な述語ボキャブラリが形成されます。各述語には、そのソース方法 (誘発、誘導、または調査)、その推定重要度 (意思決定に影響を与える頻度に基づく)、およびその信頼レベル (抽出方法間の一貫性に基づく) の注釈が付けられます。
2.4 継続的な決定の処理
引受業務は純粋に二項対立 (承諾/辞退) ではありません。専門家は価格、契約条件も設定します。価格設定関数を基本レートと述語条件付き調整に分解することで、述語フレームワークを継続的な意思決定に拡張します。
ここで、δ_k は述語 p_k に関連付けられた価格調整 (例: 防火クラス >= 7 の場合 +15%)、δ_jk は相互作用調整 (例: 海岸露出とフレーム構造の両方が存在する場合 +25%) を捕捉し、ε は述語モデルによって捕捉されなかった残差変動を表します。
この述語内線形表現は制限的ではありません。十分な数の対話述語を含めることで、任意の非線形価格設定関数を任意の精度に近似できます。主な利点は、各用語が特定のリスク要因または要因の組み合わせに関する専門家の判断として直接解釈され、個々の用語レベルでの論理保存の検証が可能になることです。
3. 継承関数定義: I(f_expert, f_agent)
3.1 動機と設計原則
継承関数 I(f_expert, f_agent) は、AI エージェントの決定関数が人間のエキスパートの決定関数の論理構造をどの程度忠実に保持しているかを定量化する [0, 1] のスカラー尺度です。この関数は、次の 4 つの原則に従って設計されています。
原則 1: 統計的ではなく、構造的です。 私は出力の一致ではなく、論理の保存を測定します。出力が 95% 一致するが、推論構造が根本的に異なる 2 つの関数は、I のスコアが低くなります。逆に、出力が 90% 一致するが、推論構造が同一である (キャリブレーションのみが異なる) 2 つの関数は、スコアが高くなります。
原則 2: 分解可能。 論理保存の特定の側面に対応する解釈可能なサブスコアに分解し、全体のスコアが低い場合に的を絞った診断を可能にする必要があります。
原則 3: 一か八かのロジックに敏感。 高リスク、高影響の提出に対する決定ロジックの保存は、日常的な提出に対するロジックの保存よりも I に大きく貢献するはずです。壊滅的なリスクの評価を忠実に処理するが、日常的な口座の価格をわずかに誤ったエージェントは、日常的な口座の価格を完璧に設定するが、壊滅的なリスクの取り扱いを誤るエージェントよりも優れています。
原則 4: ガバナンスは単調です。 ガバナンスの強度を高めると (責任ゲートが増え、人間の監視が増えると)、I はわずかに増加します。これは、ガバナンス メカニズムがロジックの相違を捉えて修正するためです。
3.2 正式な定義
定義 3 (継承関数)。 f_expert を述語語彙 V_expert = {p_1, ..., p_K} を持つエキスパート決定関数とし、f_agent をエージェント決定関数とします。継承関数は次のとおりです。
どこ:
- w_k は、Σ_k w_k = 1 を満たす述語 p_k の重要度の重みです。重みは、専門家の決定関数に対する述語の影響から導出されます。つまり、より多くの決定に影響を与える述語、または高リスクの提出を管理する述語ほど、より高い重みが与えられます。
- σ_k(f_expert, f_agent) は述語 p_k の保存スコアであり、エージェントの決定関数がエキスパートの推論における p_k の論理的役割をどの程度忠実に尊重しているかを測定します。
保存スコア σ_k 自体は複合値です。
ここで、α_1 + α_2 + α_3 = 1、および:
- Activation(p_k) は、エージェントの決定関数が述語 p_k のアクティブ化に応答するかどうかを測定します。専門家が防火クラス >= 7 を危険因子として扱う場合、この条件が真になったときにエージェントの出力は変わりますか?
- Boundary(p_k) は、エージェントが p_k に関連付けられた専門家の決定境界を保持しているかどうかを測定します。専門家が築年数に 40 年のしきい値を使用した場合、エージェントの決定表面は 40 年付近で対応する不連続性を示しますか?
- Interaction(p_k) は、エージェントが p_k を含む対話構造を保存しているかどうかを測定します。専門家が防火と建物築年数を相互作用要因 (古い + 不十分な保護 = 衰退) として扱う場合、エージェントは同じ相互作用パターンを示しますか?
3.3 アクティベーションスコアの計算
活性化スコアは、述語 p_k に対するエージェントの決定関数の感度を測定します。関数導関数アプローチを使用してそれを定義します。
二項決定の場合、偏導関数は、他のすべての述語を固定したまま、p_k が 0 から 1 に切り替わるときの決定確率の変化として解釈されます。
述語 p_k に対するエージェントの感度が入力分布全体にわたってエキスパートの感度と正確に一致する場合、活性化スコアは 1.0 になります。エージェントが専門家と比較して述語に対して過剰に応答するか過小応答する場合、この値は減少します。スコア 0.0 は、エージェントが専門家が重要と考える述語を完全に無視すること、またはその逆を意味します。
実際の例。 述語 p_k = "築年数 > 40 年" により、専門家は衰退確率を平均 0.15 増加させたとします (他のフィーチャの分布の平均)。 p_k がアクティブ化されたときにエージェントが辞退確率を 0.12 増加させる場合、アクティブ化スコアは次のようになります。
エージェントは、建物年齢に対する専門家の感度の 80% を維持します。これは、エージェントが建物年齢を要素として認識しているものの、専門家と比較してそれを軽視していることを示す、中程度に良好なスコアです。
3.4 境界スコアの計算
境界スコアは、エージェントが専門家の決定しきい値を維持しているかどうかを測定します。しきい値条件 (建物年齢 > 40 など) を含む述語 p_k ごとに、しきい値付近の専門家とエージェントの決定面を比較します。
ここで、τ_expert,k は述語 p_k に対するエキスパートのしきい値、τ_agent,k はエージェントの有効しきい値 (p_k に関連付けられた特徴に沿ったエージェントの決定曲面の変曲点を見つけることによって識別されます)、range_k は特徴の自然範囲です。
カテゴリ述語 (construction_type = "frame" など) の場合、境界スコアはバイナリ一致に減ります。エージェントがエキスパートと同じカテゴリを扱う場合は 1.0、そうでない場合は 0.0 になります。
実際の例 専門家は、「消防署までの距離」のしきい値として 500 フィートを使用しています。エージェントの決定曲面は、480 フィートに変曲点を示しています。機能範囲は 0 ~ 10,000 フィートです。
境界は高い忠実度で保存されます。ただし、エージェントの変曲点が 750 フィートの場合は次のようになります。
まだ許容範囲内ですが、250 フィートのシフトは、エージェントが専門家とは大幅に異なる距離基準を適用していることを意味し、500 ~ 750 フィートの範囲の物件の決定に影響を与える可能性があります。
3.5 インタラクションスコアの計算
インタラクション スコアは、最も計算コストが高くなりますが、最も重要なコンポーネントでもあります。インタラクション効果は、知識の伝達中に専門家の判断が最も低下することが多いためです。
各述語 p_k について、専門家の決定関数で相互作用する述語のセットを識別します。 2 つの述語 p_j と p_k は、決定に対するそれらの共同効果が個々の効果の合計と異なる場合に相互作用します。
これは要因実験計画法からの標準的な交互作用コントラストです。述語 p_k の相互作用スコアは次のとおりです。
ここで、Partners(k) はエキスパートの関数で p_k と相互作用する述語のセット、IE^expert_{j,k} は p_j と p_k の間のエキスパートの相互作用効果、IE^agent_{j,k} はエージェントの対応する相互作用効果です。
エージェントが p_k を含むすべての専門家の対話パターンを完全に再現した場合、スコアは 1.0 になります。エージェントが相互作用の捕捉に失敗した場合(専門家が因子を依存しているものとして扱う場合に因子を独立なものとして扱う場合)、または偽の相互作用を導入する場合(専門家が因子を独立しているものとして扱う場合に依存因子として扱う場合)は減少します。
実際の例 専門家の決定関数は、防火クラスと建築年数の間に強い相互作用を示しています。防火性の低い古い建物は、築年数と防火性の個別の影響から予測されるものよりも 30 パーセント ポイント高い割合で衰退します。エージェントの関数は、この相互作用を 22 パーセント ポイントで示しています。防火述語の相互作用スコア (年齢の相互作用のみを考慮) は次のとおりです。
エージェントは、この重要な相互作用効果の 73.3% を保持します。これは懸念すべきスコアです。エージェントは、古くて保護が不十分な建物の複合リスクを過小評価しています。これはまさに、逆選択につながるタイプの論理損失です。
3.6 重要度の重み付け
各述語の重要度の重み w_k は、次の 3 つの要素から計算されます。
- Frequency_k は、述語 p_k が専門家の決定に影響を与える提出物の割合です。より多くの送信にとって重要な述語は、より高い重みを受け取ります。
- Impact_k は、決定に対する述語の影響の平均の大きさです。大きな変動を引き起こす述語 (たとえば、承諾から辞退への切り替え) は、わずかな価格調整を引き起こす述語よりも高い重みを受け取ります。
- Irreversibility_k は、この述語に関連する決定エラーを修正することの難しさを表します。適切なリスクの拒否は元に戻すことができます (ブローカーは再送信できます)。壊滅的なリスクを受け入れることはできません(損失は何年にもわたって現実化します)。
重みは、Σ_k w_k = 1 になるように正規化されます。この正規化により、I(f_expert, f_agent) が [0, 1] に制限されることが保証されます。
4. 決定木の等価性テスト
4.1 正準決定木表現
継承関数は述語レベルで動作しますが、エキスパートとエージェントの意思決定ロジック間の全体的な構造比較も必要です。デシジョン ツリーは論理構造を明示するため、この比較に自然な標準形式を提供します。各内部ノードは述語テスト、各ブランチは述語結果、各リーフは決定です。
定義 4 (正規決定木)。 述語語彙 V に対する決定関数 f が与えられると、正規決定木 T(f) は f を正確に表す最小深さの決定木であり、述語は各レベルでの情報利得によって順序付けされます。
正規表現は、同じ論理関数を複数の構造的に異なるツリーで表現できる場合に生じるあいまいさを解決します。述語の順序を修正する (情報の獲得) ことで、論理的に同等の関数が同一の標準ツリーを生成し、構造的に異なる関数が真の論理の違いを反映した違いを持つツリーを生成することを保証します。
4.2 ツリー編集距離
正規化ツリー編集距離 (TED) を使用して構造的等価性を測定します。 2 つのツリー T_1 と T_2 の間のツリー編集距離は、次の 3 つの操作を使用して T_1 を T_2 に変換する最小コストです。
- ノードの挿入: 新しい内部ノード (述語テスト) またはリーフを追加します。コスト: c_ins。
- ノードの削除: 内部ノードまたはリーフを削除し、その子を親に接続します。コスト: c_del。
- ノードのラベル変更: 内部ノードの述語またはリーフの決定を変更します。コスト: c_rel。
正規化された TED は次のとおりです。
ここで |T|はツリー T 内のノードの数を示します。NTED の範囲は 0 (同一のツリー) から 1 (完全に異なるツリー) までです。構造的等価性スコアは次のとおりです。
4.3 運用コストの校正
編集作業のコストは一律ではありません。各操作タイプの引受重要性を反映するようにそれらを調整します。
- c_ins = 1.0 (エキスパートが使用していないノードを挿入すると、エージェントがエキスパートの推論に存在しないロジックを導入したことを示唆します。これは有益な場合も有害な場合もあり、調査が必要です)。
- c_del = 1.5 (エキスパートが使用するノードの削除は、エージェントがエキスパート ロジックの一部を失ったことを意味します。これは知識の損失を表すため、挿入よりも懸念事項です)。
- c_rel(p_j, p_k) = d(p_j, p_k) (再ラベル付けのコストは、元の述語と置換述語の間の意味論的な距離によって決まります。「築年数 > 40」を「築年数 > 45」に置き換えるのは、述語が意味的に似ているためコストが低くなります。「築年数 > 40」を「占有タイプ = 製造」に置き換えるのは、述語が意味的に似ているためコストが高くなります。関係ありません)。
意味的距離 d(p_j, p_k) は、2 つの述語の特徴の重複としきい値の類似性から計算されます。同様のしきい値を持つ同じ特徴を含む述語の距離は短くなります。さまざまな特徴を含む述語の距離は 1.0 に近づきます。
4.4 サブツリー保存解析
全体的な TED スコアに加えて、サブツリー保存分析を実行して、どの論理部分構造が保存され、どれが失われたかを特定します。エキスパートのツリーの内部ノード n をルートとするサブツリーは、論理サブ関数、つまり実行がノード n に到達したときに発生する推論に対応します。各サブツリーの保存スコアを計算します。
ここで、最大値はエージェントのツリー内のすべてのノード m にわたって取得されます。 1.0 に近いサブツリー保存スコアは、ノード n における専門家の推論と厳密に一致するサブ構造がエージェントのツリーに含まれていることを示します。 0.0 に近いスコアは、この推論の基礎構造が完全に失われたことを示します。
この分析により、専門家の推論のどの部分がよく保存され、どの部分が劣化しているかを正確に強調表示するサブツリー保存マップが生成されます。このマップは、緑 (保存)、黄色 (部分的に保存)、赤 (失われた) の色で、専門家の意思決定ツリーに視覚的にオーバーレイして引受マネージャーに表示されます。
4.5 アンサンブルおよびニューラル エージェント アーキテクチャの処理
最新の AI エージェントは内部でデシジョン ツリーを使用しない場合があります。勾配ブースト アンサンブル、ニューラル ネットワーク、またはハイブリッド アーキテクチャを使用する場合があります。ツリー等価性テストを適用するには、次の手順を使用して、エージェントの意思決定関数から意思決定ツリー サロゲートを抽出します。
1. 機能空間にわたる合成提出の大規模なサンプルを生成します。 2. 各合成送信についてエージェントの決定機能をクエリします。 3. 専門家の標準ツリーと同じ深さと複雑さに制限された、(提出、決定) ペアに関するデシジョン ツリーをトレーニングします。 4. このサロゲート ツリーを等価比較の T(f_agent) として使用します。
サロゲート ツリーの近似では誤差が生じますが、この誤差は忠実度メトリクス、つまりサロゲート ツリーが完全なエージェントと一致する元のサンプルの割合を使用して制限しました。適切に構築されたサロゲートの一般的な忠実度値は 0.95 を超えます。これは、ツリーベースの等価性テストがエージェントの論理構造の少なくとも 95% を捕捉していることを意味します。
忠実度が 0.90 未満の場合、結果にフラグを付け、述語レベルの継承関数でツリーベースの分析を補完します。この関数はツリー抽出を必要とせず、エージェントの意思決定面で直接動作します。
5. ロジック保存メトリクス
5.1 6 つの指標フレームワーク
ロジック保存の包括的な評価を提供する 6 つの指標を定義します。これらのメトリックは、個別に測定可能で、診断的に実行可能で、転送中にエキスパート ロジックが低下する可能性がある方法を集合的に網羅するように設計されています。
5.2 指標 1: 述語カバレッジ (PC)
述語カバレッジは、エージェントの決定関数で表されるエキスパートの述語語彙の割合を測定します。
ここで、 θ_act は、述語が「表現されている」とみなされる最小アクティブ化しきい値です (デフォルト: 0.05)。 θ_act を下回る活性化スコアを持つ述語は、事実上エージェントの推論に含まれません。
解釈。 PC = 1.0 は、エージェントがエキスパートが使用するすべての決定要素を使用することを意味します。 PC < 1.0 は、エージェントが無視する特定の要因を特定します。実際には、0.90 を超える PC 値はデプロイメントに許容されるとみなされ、欠落している述語には監視対象のフラグが立てられます。
典型的な所見: エージェント モデルは一般に、管理品質シグナル (数値的にエンコードするのが難しい)、地理的ニュアンス (微気候の影響、地方条例の変動)、および時間的パターン (季節的なリスクの変動、損失の発生傾向) に関連する述語を見逃します。これらはまさに、専門家の判断が保険数理表よりも最も価値を加える要素です。
5.3 指標 2: 境界忠実度 (BF)
境界忠実度は、エージェントが専門家の決定しきい値をどれだけ正確に再現するかを測定します。
ここで、K_thresh は識別可能なしきい値を持つ述語の数、Boundary(p_k) はセクション 3.4 で定義された境界スコアです。
解釈. BF = 1.0 は、すべてのしきい値が正確に保持されることを意味します。実際には、0.95 を超える BF 値が優れていると考えられます。 0.90 未満の値は、調査が必要な体系的なしきい値ドリフトを示します。
重大なケース: 規制境界は BF = 1.0 でなければなりません。規制のしきい値 (保険可能な最大洪水ゾーン距離など) が BF < 1.0 の場合、エージェントは、モデルの全体的な精度に関係なく、規制要件に違反する可能性のある決定を下していることになります。これは、MARIA OS 実装におけるハード制約として強制されます。
5.4 指標 3: インタラクションの保存 (IP)
インタラクション保存は、エージェントがエキスパートの因子相互作用パターンをどの程度忠実に再現するかを測定します。
ここで、E_expert はエキスパートの関数で相互作用する因子ペアのセット、w_jk は相互作用の重要度の重み (j, k)、InteractionMatch(j, k) = 1 - |IE^expert_{j,k} - IE^agent_{j,k}| です。 / |IE^expert_{j,k}|。
解釈. IP = 1.0 は、すべての専門家の対話が完全に保存されていることを意味します。インタラクション効果は知識の伝達中に維持することが最も難しいため、IP は通常最もスコアの低い指標です。 0.80 を超える値は良好であるとみなされます。 0.70 未満の値は、エージェントによる複雑な多要素リスクの処理における論理の大幅な低下を示します。
5.5 メトリック 4: 単調性一貫性 (MC)
エキスパートの引受ロジックは単調性制約を尊重します。つまり、リスク要因の値が悪化すると、他のすべてが等しいまま、常に悪い結果 (または少なくとも良くない結果) がもたらされるはずです。たとえば、他のすべてが等しい場合、築年数が長くなってもリスクプレミアムが減少することはありません。
ここで、V_monotone は既知の単調関係を持つ述語のサブセットであり、MonotonicityPreserved(p_k) はエージェントの決定関数がエキスパートの決定関数と同じ単調関係を維持しているかどうかをチェックします。
解釈. MC < 1.0 は、単調性が期待される非単調な関係をエージェントが学習したことを示します。これは論理破損の強力な兆候です。これは、要因が悪化したときにエージェントがリスクを良く見せようとする場合があることを意味しますが、これは保険数理的に一貫性がありません。私たちの経験では、MC 違反は、トレーニング データ内のノイズに過剰適合したニューラル ネットワーク エージェントで最も一般的に発生します。
5.6 指標 5: 例外処理の完全性 (EHC)
専門の保険会社は、一連の例外ルール、つまり一般的な決定ロジックに関係なく適用されるハード オーバーライドを維持しています。例としては、「遊園地には決して保険をかけない」、「TIVが5,000万ドルを超える口座は常に上級引受会社に紹介する」、「過去10年間に放火関連の請求が3件を超えた場合はリスクを断つ」などが挙げられる。
解釈。 導入するには EHC は 1.0 である必要があります。例外規定は、引受業務における最も厳しい制約を表しており、壊滅的な損失、規制上の義務、または再保険契約の制限から学んだ教訓をコード化しています。エージェントが例外ルールを 1 つでも見逃していると、組織が許容できないリスクにさらされる可能性があります。 MARIA OS では、例外は、エージェントの一般的な決定ロジックの前に起動される実行前責任ゲートとして実装されます。
5.7 メトリクス 6: 信頼性キャリブレーション (CC)
二者択一または継続的な決定を超えて、エージェントの決定に対する自信が専門家の自信に照らして調整されているかどうかを測定します。専門家が決定に非常に自信を持っている場合(たとえば、明らかに良いリスクがある場合)、エージェントも自信を持っている必要があります。専門家が不確かな場合(慎重な審議が必要なギリギリの提出)、エージェントはその不確実性を反映する必要があります。
ここで、ECE は予想されるキャリブレーション誤差であり、エージェントの信頼度ごとに提出物をビン分けし、各ビンのエージェントの信頼度と専門家の信頼度の間の平均絶対差を測定することによって計算されます。
解釈 CC = 1.0 は、完全に校正された信頼性を意味します。 CC < 0.80 は、エージェントが専門家と比較して系統的に自信過剰または自信不足であることを示します。自信過剰なエージェントは、不確実性に基づいたエスカレーション ゲートをトリガーできないため、特に危険です。つまり、境界線の決定が人間のレビューを回避することを意味します。
5.8 複合ロジック保存スコア
6 つのメトリクスは、複合ロジック保持スコア (LPS) に結合されます。
β 重みは組織の優先順位を反映します。保険業界の標準を反映したデフォルトの重み付けは次のとおりです。
| Metric | Weight | Rationale |
|---|---|---|
| PC (Predicate Coverage) | 0.15 | Foundation — can the agent see all factors? |
| BF (Boundary Fidelity) | 0.20 | Critical for regulatory compliance |
| IP (Interaction Preservation) | 0.25 | Highest value-add of expert judgment |
| MC (Monotonicity Consistency) | 0.15 | Actuarial soundness requirement |
| EHC (Exception Handling) | 0.15 | Hard safety constraint |
| CC (Confidence Calibration) | 0.10 | Enables appropriate escalation |
LPS には最小導入しきい値があります。自律運用には LPS >= 0.85 が必要で、LPS [0.70, 0.85) の場合は人間による監視が必要で、LPS < 0.70 の場合はすべての決定について人間による完全なレビューが必要です。
6. 責任連鎖の検証
6.1 出所の問題
AI エージェントが商業不動産の提出を拒否すると、仲介業者または被保険者は「なぜ拒否されたのですか?」と尋ねる可能性があります。人間による引受システムでは、答えは簡単です。引受会社がその理由を説明します。 AI 引受システムでは、回答はエージェントが継承した専門ロジックに正式にたどることができなければなりません。このトレーサビリティ要件により、出所の問題が発生します。エージェントのあらゆる決定について、どの専門家ルールが決定に寄与したかを特定し、それらのルールが正しく適用されたことを検証できなければなりません。
6.2 責任の出所グラフ
定義 5 (責任来歴グラフ)。 責任来歴グラフ G = (N, E) は、有向非巡回グラフです。
- N はノードのセットで、エキスパート ルール ノード (R)、エージェント決定ノード (D)、および証拠ノード (Ev) の 3 つのタイプに分割されます。
- E は、導出関係を表す有向エッジのセットです。
エッジの種類には次のものがあります。
- (R_i, D_j): エージェントの決定 D_j はエキスパート ルール R_i から導出されます。このエッジは、述語 p_k (ルール R_i に対応) がサブミット j に関するエージェントの決定においてゼロ以外のアクティベーションを持つ場合に存在します。
- (D_j, Ev_m): エージェントの決定 D_j は証拠 Ev_m (評価されたデータ要素) によってサポートされます。
- (R_i, R_l): エキスパート ルール R_i はエキスパート ルール R_l に依存します (ルール チェーン、1 つのルールの出力が別のルールにフィードされる)。
来歴グラフにより、次の 2 つの重要な機能が有効になります。
前方追跡可能性: エキスパート ルール R_i が与えられた場合、このルールを呼び出したすべてのエージェントの決定を見つけます。これは、「専門家の知識はどのように活用されているのか?」という答えになります。
後方追跡可能性: エージェントの決定 D_j が与えられた場合、それに寄与したすべてのエキスパート ルールを見つけます。これは、「なぜエージェントはこの決定を下したのか、そしてそれは誰の専門知識を反映しているのか?」という答えになります。
6.3 チェーンの完全性の検証
責任チェーンは、すべてのエージェントの決定が少なくとも 1 つのエキスパート ルールまで遡ることができ、チェーン内のすべてのエキスパート ルールが元の述語語彙に照らして検証できるときに完了します。
定義 6 (チェーンの完全性)。 以下の場合、責任チェーンは決定 D_j に対して完了しています。
そして
チェーンの完全性は 2 つの性質であり、すべての決定が追跡可能であるか追跡できないかのいずれかです。私たちのフレームワークでは、展開のためにチェーンの完全性が 100% である必要があります。どのエキスパート ルールにも追跡できないエージェントの決定は 孤立した決定 です。これはエージェントがエキスパートの知識とは無関係に生成したロジックを表しており、正しいかもしれませんが、継承フレームワークを通じて検証することはできません。
孤児の決断が必ずしも間違っているわけではありません。エージェントは、専門家が明言しなかった有効なパターンを発見した可能性があります。ただし、孤立した決定には、別のメカニズム (統計的バックテスト、保険数理的見直し、または人間による専門家の評価) による個別の検証が必要です。責任チェーン フレームワークは、これらの決定を識別して、適切な検証経路にルーティングできるようにします。
6.4 チェーンの強度測定
バイナリの完全性を超えて、各責任チェーンの「強さ」、つまりエージェントの決定が専門家のルールからどの程度直接的かつ明確に導き出されているかを測定します。
ここで、Ancestors(D_j) は、逆方向トラバーサルによって D_j から到達可能なすべてのエキスパート ルール ノードのセット、w_i はルール R_i の重要度の重み、σ_i は R_i に対応する述語の保存スコアです。
ChainStrength の範囲は 0 ~ 1 です。1.0 に近い値は、エージェントの決定がよく保存された専門家のロジックに強く根ざしていることを意味します。 0.0 に近い値は、名目上、決定がエキスパート ルールに追跡可能であるが、それらのルールがエージェントの機能内であまり保持されていないことを意味します。
ChainStrength メトリクスは、ガバナンスの失敗の 2 つのタイプを区別します。
- 壊れたチェーン (ChainStrength = 0): エージェントは追跡可能な専門家の起源を持たずに決定を下しました。これはチェーンの完全性チェックによって検出されます。
- 弱いチェーン (ChainStrength < しきい値): エージェントの決定は名目上エキスパート ルールから導出されますが、それらのルールは劣化しすぎて導出は無意味です。これは、より潜行的な障害モードです。システムは準拠しているように見えますが (すべての決定には出所追跡があります)、トレースは破損したロジックを示しています。
6.5 時代的な来歴
専門家の知識が更新され、エージェントのモデルが再トレーニングされ、市場状況が変化するにつれて、責任の連鎖は時間の経過とともに進化します。述語語彙とエージェントの決定関数の両方をバージョン管理することにより、時間的来歴を維持します。
来歴グラフの各バージョンは不変であり、永続的に保存されます。規制監査で、6 か月前に意思決定が行われた理由を理解する必要がある場合、システムは、述語語彙のバージョン、エージェント モデルのバージョン、アクティブであった特定のエキスパート ルールを含む、その期間の来歴グラフを取得します。
この時間的な起源は、保険規制の遵守にとって重要です。州の保険部門は、引受決定が下されてから数か月または数年後に調査する場合があります。組織は、各決定が提出された料金と規則に従って行われたことを証明できなければなりません。出所グラフはこの証明を提供します。
7. ドリフト検出: エージェントがエキスパート ロジックから逸脱したとき
7.1 ドリフト問題
エージェントが高度にロジックを保持して開始したとしても、その決定動作は時間の経過とともに変動する可能性があります。ドリフトはいくつかの理由で発生します。
- モデルの再トレーニング。 エージェントのモデルが新しいデータで再トレーニングされる場合、再トレーニングされたモデルは元のモデルと同じ論理構造を保持しない可能性があります。新しいデータ パターンは、学習した専門家のロジックを上書きする可能性があります。
- 特徴分布の変化。 提出されたリスクの組み合わせが変化するにつれて (例: 市場拡大による沿岸不動産の増加など)、モデル自体は変わっていなくても、新しい分布ではエージェントの決定が異なる動作をする可能性があります。
- 専門知識の進化。 元の専門家 (またはその後継者) は、新たな損失経験、規制の変更、または市場の状況に基づいて判断を更新する可能性があります。エージェントの継承ロジックが古くなります。
- 敵対的適応。 ブローカーはエージェントの意思決定パターンを学習し、エージェントのロジックの弱点を突くリスクを選択的に提出する可能性があります (エージェントに対する逆選択の一種)。
7.2 ドリフト検出フレームワーク
継承関数 I(f_expert, f_agent) を定期的に計算し、スコアが低下したときにアラートをトリガーする継続的な監視システムを定義します。
定義 7 (ドリフト スコア)。 時間 t でのドリフト スコアは次のとおりです。
ここで、 f_agent,0 はエージェントの初期決定関数 (展開時)、 f_agent,t は現在の決定関数です。正のドリフトは、論理の劣化を示します (エージェントがエキスパートに対して忠実でなくなりつつある)。負のドリフトはロジックの改善を示します (おそらくターゲットを絞った修正により、エージェントはより忠実になってきています)。
ドリフト スコアは、最近の決定のスライディング ウィンドウを使用して計算されます。私たちは、展開時に評価された送信の参照データセット D_ref (既知の専門家の決定とともに) を維持し、D_ref でエージェントを定期的に再評価して、エージェントの決定機能の変化を検出します。
7.3 統計的ドリフトの検出
生のドリフト スコアはサンプリング ノイズにより変動します。逐次仮説検証フレームワークを使用して、本物のドリフトとランダムな変動を区別します。
帰無仮説 H_0: エージェントのロジックの保存は、展開以来変更されていません。観測されたドリフト ΔI(t) は、サンプリング ノイズによるものです。
対立仮説 H_1: エージェントの論理保持が低下しました。観察されたドリフトは統計的に有意です。
ページ ヒンクリー テストを適用します。これは、ドリフト スコアの累積合計を監視し、合計がしきい値を超えたときにアラートをトリガーする逐次変化検出アルゴリズムです。
ここで、δ は許容誤差パラメータ (意味があると考えられる最小ドリフト、デフォルト: 0.02)、λ は検出閾値 (感度と誤報率の間のトレードオフを制御、デフォルト: 5.0) です。
ページ ヒンクリー テストには、固定の評価ウィンドウを待たずに、統計的に可能な限り早くドリフトを検出できるという利点があります。私たちの実験では、四半期あたり 1 件未満の誤報率で、48 時間以内に継承関数の 5 ポイントの低下を検出しました。
7.4 ドリフト応答プロトコル
ドリフトが検出されると、システムは段階的な応答を実行します。
レベル 1 (黄色の警告、ΔI < 0.05)。 ドリフトはログに記録され、引受管理者に通知されます。エージェントは自律的に動作し続けますが、その決定には遡及レビュー用のタグが付けられます。述語レベルの分解により、どの特定の述語がドリフトしているのかが特定され、的を絞った調査が可能になります。
レベル 2 (オレンジ色の警告、0.05 ≤ ΔI < 0.10)。 エージェントの自律性は低下します。設定可能な影響しきい値を超えるすべての決定には、実行前に人間の承認が必要です。 MARIA OS 責任ゲート フレームワークは、このエージェントからのすべての意思決定のリスク層を引き上げることにより、この制約を自動的に強制します。
レベル 3 (赤色警報、ΔI ≥ 0.10)。 エージェントは自律動作を一時停止されています。すべての決定には人間によるレビューが必要です。根本原因分析が開始され、ドリフトの原因がモデルの劣化、分布の変化、または専門知識の進化によるものであるかどうかが判断されます。根本原因に応じて、修復にはモデルの再トレーニング、述語語彙の更新、または専門家の再誘発が含まれる場合があります。
段階的な応答により、軽微なドリフトによって業務が中断されることはありませんが、重大なドリフトが発生した場合には人間による即時の監視が引き起こされます。しきい値 (0.05、0.10) は製品ラインごとに設定可能で、高リスクのポートフォリオに対してより積極的に設定できます。
7.5 ドリフトの根本原因の帰属
ドリフトが検出された場合、正しい修復方法を選択するには、根本原因を特定することが不可欠です。ドリフトを 3 つの要素に分解します。
- モデル ドリフト (ΔI_model): 元の参照データセット D_ref で現在のエージェント モデルを評価することによって測定されます。 D_ref に対するエージェントの決定が変更された場合、(再トレーニング、勾配減衰、またはその他のモデル内部の変更により) モデル自体がドリフトしています。
- 分布ドリフト (ΔI_distribution): 最近の送信の特徴分布を D_ref と比較することによって測定されます。分布が変化した場合、モデルが変更されていない場合でも、エージェントは新しいデータに対して異なる動作をする可能性があります。
- エキスパートドリフト (ΔI_expert): 最近の提出物のサブセットについてエキスパートを再評価することによって測定されます。専門家自身の決定が変更された場合 (更新された判断を反映して)、継承されたロジックは破損しているのではなく、古くなっている可能性があります。
この分解により、対象を絞った修正が可能になります。モデルのドリフトには再トレーニングが必要で、分布のドリフトにはモニタリング (場合によってはポートフォリオの調整) が必要で、エキスパートのドリフトには述語語彙の再引き出しが必要です。
8. MARIA OS 責任ゲートとの統合
8.1 アーキテクチャの概要
引受責任継承フレームワークは、意思決定パイプライン、責任ゲート システム、ガバナンス ダッシュボードという 3 つのアーキテクチャ タッチポイントを通じて MARIA OS と統合されます。
意思決定パイプラインの統合。 各引受決定は、MARIA OS の 6 段階のパイプラインを通過します: 提案 → 検証 → [approval_required | approval_required]承認されました] → 実行されました → [完了 |失敗した]。継承フレームワークは、提案された決定のチェーン強度を計算し、それを展開しきい値と比較することにより、「検証」段階を拡張します。 ChainStrength < 閾値の場合、決定は「承認済み」ではなく「承認必須」に移行し、審査のために人間の保険会社にルーティングされます。
責任ゲートの統合。 6 つのロジック保存メトリック (PC、BF、IP、MC、EHC、CC) が MARIA OS 責任ゲート条件にマッピングされます。各メトリクスには構成可能なしきい値があり、しきい値に違反すると、対応するゲートがトリガーされます。
| Metric | Gate Trigger | Gate Action |
|---|---|---|
| PC < 0.90 | Missing predicate gate | Log + tag for review |
| BF < 0.95 | Boundary violation gate | Escalate to senior underwriter |
| IP < 0.70 | Interaction gap gate | Escalate + require evidence bundle |
| MC < 1.00 | Monotonicity violation gate | Hard block — must be corrected |
| EHC < 1.00 | Exception miss gate | Hard block — route to manual processing |
| CC < 0.80 | Calibration drift gate | Reduce autonomy level |
ゲート アクションは累積的です。境界違反ゲートとインタラクション ギャップ ゲートの両方をトリガーする決定には、エスカレーションと証拠バンドルの両方の要件が適用されます。
8.2 座標系のマッピング
MARIA OS 座標系 (G.U.P.Z.A) は、保険の組織構造に自然にマッピングされます。
継承フレームワークは、階層の各レベルからリスク ポリシーを継承します。
- Galaxy レベルは、企業内で動作する AI エージェントの最小 LPS を設定します。
- ユニバース レベル は、ドメイン固有のしきい値を設定します (商用回線には個人回線よりも高い IP が必要になる場合があります)。
- プラネット レベルは、製品固有の述語語彙と例外ルールを定義します。
- ゾーン レベルは、特定の業務簿のドリフト検出パラメータを構成します。
- エージェント レベル には、エージェントの現在の継承スコアと来歴グラフが保存されます。
8.3 証拠バンドルの拡張
責任ゲートをトリガーする引受決定については、MARIA OS 証拠バンドルが継承固有のフィールドで拡張されています。
{
"decision": {
"submission_id": "SUB-2026-00847",
"recommendation": "decline",
"confidence": 0.89
},
"inheritance": {
"chain_strength": 0.82,
"activated_predicates": [
{
"predicate_id": "P_047",
"description": "Building age > 40 years",
"source_expert": "J. Morrison (Senior UW, retired 2025)",
"preservation_score": 0.91
},
{
"predicate_id": "P_112",
"description": "Fire protection class >= 7 AND building age > 40",
"source_expert": "J. Morrison (Senior UW, retired 2025)",
"preservation_score": 0.73,
"flag": "interaction_degradation"
}
],
"logic_preservation_score": 0.87,
"drift_status": "stable",
"last_drift_check": "2026-02-12T08:00:00Z"
},
"audit": {
"agent_coordinate": "G1.U1.P1.Z1.A1",
"decision_pipeline_id": "DEC-2026-04291",
"gate_triggered": "interaction_gap_gate",
"escalated_to": "G1.U1.P1.Z1.HUMAN_UW_03"
}
}この証拠バンドルは、人間のレビュー担当者に完全なコンテキスト、つまりどの専門家ルールが決定を下したか、それらのルールがどの程度保存されているか、エージェントのロジックがどこで劣化している可能性があるかを提供します。レビュー担当者は、エージェントをオーバーライドするか、エージェントの推奨を確認するか、ケースにモデル改善のフラグを立てるかについて、情報に基づいた決定を下すことができます。
8.4 監査証跡と規制遵守
継承関数のすべての計算、すべてのドリフト検出結果、およびすべての来歴チェーンは、不変の監査レコードとして MARIA OS 決定ログに記録されます。これにより、保険規制要件を満たす包括的な監査証跡が作成されます。
- NAIC モデル監査ルールへの準拠: AI 支援によるすべての引受決定は、出所グラフを通じて、提出されたレートとルールまで追跡可能です。
- 状態検査の準備状況: 継承フレームワークは、ドリフトを継続的に監視しながら、AI エージェントのロジックが専門家の判断に対して正式に検証されていることを示す文書を作成します。
- 再保険契約の遵守: 境界忠実度の検証により、代理店が再保険契約の条件 (補償範囲の制限、除外される危険、地域制限) を遵守していることが保証されます。
- 公正な融資/不当な差別の監視: 述語語彙分析により、エージェントが保護された特性と相関するプロキシ機能を学習したかどうかを特定できるため、事前のバイアス検出が可能になります。
9. ケーススタディ: 商業不動産の引受業務
9.1 セットアップ
中堅専業キャリアの商業不動産引受部門に相続フレームワークを適用しました。この部門は年間約 12,000 件の申請を処理し、平均在職年数 18 年の引受会社 6 名のチームによって管理されています。この航空会社は、申請量の約 65% に相当する総額 1,000 万ドル未満の保険金額 (TIV) 未満の申請に対する初期トリアージと推奨を処理するために、AI 引受エージェントを導入していました。
専門家の選択 最上級の引受会社 (経験 28 年、大規模商業用不動産部門の主任引受会社) が、述語語彙抽出の主要専門家として役割を果たしました。さらに 2 名の上級保険会社が検証プロセスに参加しました。
述語の抽出結果 構造化された引き出しプロセス (40 の歴史的事例にわたる 16 時間の CDM インタビュー) により、68 の明示的な述語が特定されました。 5 年間の過去の決定 (7,200 データ ポイント) に対するデシジョン ツリー誘導により、さらに 47 の暗黙的な述語が特定されました。反事実調査 (200 の合成提出ペア) により、38 の暗黙述語が確認され、12 の新しい境界条件が特定されました。重複排除と統合の後、最終的な述語ボキャブラリには K = 127 の述語が含まれていました。
エージェント アーキテクチャ AI エージェントは、同じ 5 年間の履歴データセットでトレーニングされた勾配ブースト ツリー アンサンブル (XGBoost) を使用し、標準 ACORD アプリケーション フィールドに対応する 43 の入力特徴と独自のリスク スコアリング機能を備えています。エージェントは、信頼度スコアを含む 3 方向の推奨事項 (承諾、上級保険会社への照会、辞退) を作成します。
9.2 継承関数の結果
最初の継承関数の計算では I(f_expert, f_agent) = 0.947 が生成され、次のように分解されます。
| Predicate Group | Count | Avg Preservation | Min Preservation |
|---|---|---|---|
| Construction quality | 18 | 0.96 | 0.88 |
| Fire protection | 15 | 0.97 | 0.91 |
| Occupancy hazard | 22 | 0.95 | 0.79 |
| Loss history | 14 | 0.93 | 0.71 |
| Geographic exposure | 19 | 0.94 | 0.82 |
| Coverage structure | 12 | 0.98 | 0.94 |
| Management quality | 8 | 0.78 | 0.52 |
| Market conditions | 6 | 0.91 | 0.83 |
| Interactions | 13 | 0.88 | 0.61 |
管理品質述語のスコアが最も低かったが、これは予想通りでした。これらの述語は、数値的にエンコードすることが難しい定性的なシグナル (被保険者の応答性、保守プログラムの文書化、保険金請求管理履歴) に依存しています。相互作用述語のスコアも平均を下回っており、多要素エキスパート ロジックを保持するのが最も難しいという一般的な結果が裏付けられています。
9.3 ロジック保存メトリクス
| Metric | Score | Threshold | Status |
|---|---|---|---|
| Predicate Coverage (PC) | 0.953 (121/127) | 0.90 | Pass |
| Boundary Fidelity (BF) | 0.978 | 0.95 | Pass |
| Interaction Preservation (IP) | 0.841 | 0.70 | Pass (marginal) |
| Monotonicity Consistency (MC) | 0.985 | 1.00 | Fail |
| Exception Handling (EHC) | 1.000 (34/34) | 1.00 | Pass |
| Confidence Calibration (CC) | 0.912 | 0.80 | Pass |
| **Composite LPS** | **0.944** | **0.85** | **Pass** |
注目すべき発見:
6 つの述語が失敗しました。 エージェントは 127 の述語のうち 6 つをキャプチャできませんでした (PC = 0.953)。 6 件のうち 4 件は管理品質のシグナルであり、2 件は地理的な微気候の影響 (特定の産業施設への近接性) でした。これらの述語には監視対象のフラグが付けられ、決定論的に処理するために補助ルール エンジンが追加されました。
単調性違反。 エージェントは、狭い年齢範囲 (35 ~ 42 歳) で、築年数とリスクとの間に非単調な関係を示しました。調査により、トレーニング データには、異常に良好な損失履歴を持つこの築年数の最近改装された建物のコホートが含まれていることが明らかになり、モデルはこの築年数をより低いリスクと関連付けました。これは、モデルのトレーニングに単調性制約を追加することで修正されました。
相互作用の保存。 最も低い個別相互作用スコア (0.61) は、喪失頻度と喪失重大度パターンの間でした。専門家は、高頻度/低重大度の損失を低頻度/高重大度の損失とは異なる扱い (損耗とショック損失のプロファイル) を行い、エージェントはこの区別を部分的に崩しました。対象を絞った特徴エンジニアリングの取り組みにより、後続のモデル バージョンではインタラクション スコアが 0.78 に改善されました。
9.4 デシジョンツリーの等価性
正規決定木比較では、構造等価性スコア 0.972 (NTED = 0.028) が得られました。サブツリー保存分析により、保存スコアが 0.80 未満の 3 つのサブツリーが特定されました。
1. 水害のサブリミット サブツリー (0.74): 水害のサブリミットを評価するための専門家のロジックには、築年数、配管条件、請求履歴、および控除対象構造の間の 4 方向の相互作用が含まれます。エージェントのサロゲート ツリーはこれを双方向の相互作用に分解し、配管条件と控除可能な構造要素を失いました。
2. 保護措置サブツリー (0.77): 専門家は、防火システム、盗難警報システム、およびスプリンクラーの種類を相互に関連するクラスターとして評価します。エージェントは彼らをより独立して扱い、高価値コンテンツの建物における不適切なスプリンクラーと盗難警報器の設置の組み合わせによる影響を見逃しました。
3. 管理品質サブツリー (0.68): 述語レベルの分析と一致して、管理品質シグナルのエージェント表現は最も弱い構造要素でした。
これら 3 つのサブツリーは、ツリー編集距離の合計の 83% を占めました。専門家の決定木の残りの 96% は、高い忠実度で保存されていました。
9.5 責任連鎖分析
チェーンの完全性は 100% で検証されました。1,200 件の提出テスト セットに関するすべてのエージェントの決定は、来歴グラフ内の少なくとも 1 つの専門家ルールに追跡可能でした。チェーンの強度の分布は次のとおりです。
- ChainStrength > 0.90: 決定の 78% (専門家の強力な導出)
- ChainStrength 0.70 ~ 0.90: 決定の 17% (中程度の導出、許容可能)
- ChainStrength 0.50–0.70: 意思決定の 4% (弱い導出、レビューのフラグが立てられている)
- ChainStrength < 0.50: 意思決定の 1% (非常に弱い、人間にルーティングされる)
ChainStrength が 0.70 未満の決定の 5% が個別に分析されました。そのほとんどは、珍しい特徴 (複合用途の占有、独特な構造を持つ歴史的建造物、またはトレーニング データがまばらな地理的領域のリスク) を持つ提出物に関係していました。これらはまさに専門家が最も多くの時間を費やして検討したであろう提案であり、チェーン強度測定基準が専門家の判断が最も必要なケースを正確に特定していることを確認しました。
9.6 本番環境でのドリフト検出
エージェントは、ドリフト検出フレームワークがアクティブな状態で運用環境にデプロイされました。運用開始から最初の 90 日間:
- 1 ~ 45 日目: ドリフトは検出されませんでした。 I(t) は、サンプリング ノイズと一致して、予想範囲 (0.94 ~ 0.96) 内で変動しました。アラートはトリガーされません。
- 46 ~ 52 日目: レベル 1 (黄色) のアラートがトリガーされました。調査の結果、新しい地理的領域 (この航空会社はテキサス州沿岸部に進出していた) からの提出の波により、エージェントが訓練分布外のリスク プロファイルに遭遇していることが明らかになりました。 ΔI は 0.03 で、地理的エクスポージャーの述語に集中していました。このアラートは、テキサス州沿岸特有のリスク要因を機能セットに追加し、モデルを再トレーニングすることで解決されました。
- 53 ~ 90 日目: 修正後、継承関数は 0.95 で安定し、展開ベースラインをわずかに上回りました。ドリフト検出システムは、修正によってロジックの保存が復元されただけでなく、改善されたことを確認しました。
48 時間の漂流検出遅延が確認されました。46 日目の黄色警報は、最初の重要なテキサス沿岸の提出物がパイプラインに入ってから 36 時間以内にトリガーされました。
10. ベンチマーク
10.1 ベンチマーク方法論
すべてのベンチマークは、セクション 9 で説明した商業不動産引受ケーススタディに基づいて実施されました。テスト セットは、トレーニング データから抽出された 1,200 件の提出物で構成され、専門家の決定は主専門家によって提供され、追加の上級引受会社 2 名によって検証されました (評価者間合意 κ = 0.87)。
10.2 ロジック保存ベンチマーク
| Measurement | Value | Methodology |
|---|---|---|
| Inheritance Function I(f_expert, f_agent) | 0.947 | Weighted sum of 127 predicate preservation scores |
| Predicate Coverage (PC) | 95.3% (121/127) | Activation threshold θ = 0.05 |
| Boundary Fidelity (BF) | 97.8% | Averaged over 89 threshold predicates |
| Interaction Preservation (IP) | 84.1% | Averaged over 47 identified expert interactions |
| Monotonicity Consistency (MC) | 98.5% | 2 of 134 monotonic relationships violated (pre-correction) |
| Exception Handling Completeness (EHC) | 100% (34/34) | All hard exception rules correctly enforced |
| Confidence Calibration (CC) | 91.2% | ECE = 0.088 across 10 calibration bins |
比較のために、同じテストセットに対する標準的な精度のみの評価では、専門家の決定と全体的に 93.8% の一致が示されました。継承関数は、この 93.8% の一致により、経営品質評価 (最低保存 52%) および多要素相互作用 (最低保存 61%) における重大な論理ギャップが隠蔽されていることを明らかにしています。正確さのみに依存している組織は、これらのギャップを認識せずにエージェントを導入した可能性があります。
10.3 デシジョンツリーの等価性ベンチマーク
| Measurement | Value | Methodology |
|---|---|---|
| Structural Equivalence (1 - NTED) | 97.2% | Normalized tree edit distance on canonical trees |
| Subtrees Fully Preserved (score > 0.90) | 89% (31/35 major subtrees) | Subtree-level TED comparison |
| Subtrees Partially Preserved (0.70–0.90) | 8.6% (3/35) | Including water damage, safeguards, management |
| Subtrees Lost (< 0.70) | 2.9% (1/35) | Management quality subtree only |
| Surrogate Fidelity | 96.1% | Agreement between surrogate tree and full XGBoost model |
10.4 ドリフト検出ベンチマーク
| Measurement | Value | Methodology |
|---|---|---|
| Detection Latency (5-point drop) | < 48 hours | Page-Hinkley test with δ = 0.02, λ = 5.0 |
| False Alarm Rate | < 1 per quarter | Over 90-day observation period |
| True Positive Rate | 100% (2/2 genuine drift events) | Including geographic expansion event at Day 46 |
| Root Cause Attribution Accuracy | 100% | Both events correctly attributed (distribution shift) |
| Mean Time to Remediation | 6 days | From alert to corrected model deployment |
10.5 責任連鎖のベンチマーク
| Measurement | Value | Methodology |
|---|---|---|
| Chain Completeness | 100% (1,200/1,200) | Every decision traceable to ≥ 1 expert rule |
| Strong Chains (strength > 0.90) | 78% | 936 of 1,200 decisions |
| Moderate Chains (0.70–0.90) | 17% | 204 of 1,200 decisions |
| Weak Chains (< 0.70) | 5% | 60 of 1,200 decisions (flagged for review) |
| Avg Expert Rules per Decision | 4.3 | Average number of activated expert predicates |
| Provenance Graph Query Latency | < 50ms | P99 for backward traceability query |
11. 今後の方向性
11.1 マルチエキスパートの継承
現在のフレームワークは、単一の主要専門家を想定しています。実際には、引受チームは重複するものの同一ではない判断パターンを持つ複数の専門家で構成されます。将来の作業では、複数の専門ソースを処理できるように継承関数を拡張する必要があります。
専門家の意見が異なる場合、この単純な平均は適切ではない可能性があります。より洗練された定式化では、コンセンサス述語 (すべての専門家が同意する場合) と争点となる述語 (専門家が同意しない場合) を識別し、エージェントがコンセンサスのロジックを保持しながら、争点となっている領域に人間の審議のためにフラグを立てる必要があります。コンセンサスで争われた分解は、MARIA OS 責任ゲート システムと統合され、争われた決定を適切なレビュー パネルに転送します。
11.2 クロスライン継承
保険会社は多くの場合、商品ラインを横断する引受業務の専門知識を持っています。商業用不動産保険会社の防火システムに関する知識は、内陸海事、建設業者のリスク、さらには一部の賠償責任のリスクにも関連します。継承フレームワークは、行をまたがる述語の再利用の機会を特定するために拡張できます。
V_shared の述語は、製品ライン全体に一貫して適用する必要がある保険引受業務の核となる知識を表します。継承フレームワークは、さまざまな製品ラインの AI エージェントが共有述語の一貫した処理を維持し、専門知識がサイロ化されたモデルに断片化することを防ぐことを検証します。
11.3 継承されたロジックの敵対的堅牢性
現在のフレームワークは、継承メカニズムに対する敵対的攻撃に特に対処していません。高度な敵対者 (例: エージェントのロジックのギャップを悪用するように設計されたリスクを組織的に提出するブローカー) は、エージェントのロジックの保持が最も弱い領域で決定境界を移動することにより、実効継承スコアを低下させる可能性があります。今後の作業では、敵対的送信パターンの下でエージェントのロジック保存を調査し、標的を絞った悪用に対して継承メカニズムを強化する敵対的テスト プロトコルを開発する必要があります。
11.4 自動述語検出
述語語彙の抽出プロセスは労働集約的です (ケーススタディでは 16 時間以上の専門家インタビューが必要でした)。今後の研究では、記号回帰、プログラム合成、または概念ボトルネック モデルを使用して、専門家の意思決定データから自動的に述語を検出する方法を検討する必要があります。目標は、歴史的決定から述語語彙を自動的に抽出し、継承の検証に必要な形式的な構造を維持しながら、明示的な専門家の引き出しへの依存を減らすことです。
11.5 エキスパートとエージェントの継続的な共進化
専門家の知識を保存すべき静的な成果物として扱うのではなく、より動的なフレームワークでは、専門家とエージェントを共進化するシステムとしてモデル化します。エージェントは専門家のロジックから学習し、専門家はエージェントが発見したパターンに基づいて判断を更新できます。継承フレームワークは、正当な知識の更新 (専門家が新しい証拠に基づいて判断を修正する場合) と望ましくない汚染 (専門家がエージェントのバイアスを無意識に採用する場合) を区別しながら、この共進化を追跡する必要があります。
この共進化モデルは、段階的自律性というより広範な MARIA OS のビジョンにつながります。時間の経過とともにエージェントの継承スコアが増加し、ドリフトが減少するにつれて、システムはより多くの自律性を付与できるようになります。エージェントが新しい有効なパターン (バックテストと専門家のレビューによって確認された) を開発すると、これらを述語語彙に正式に組み込むことができ、人間と AI のコラボレーションを通じて専門家の効果的な知識ベースが拡張されます。
12. 結論
このペーパーでは、AI エージェントにおける専門家引受ロジックの保存を検証および維持するための正式なフレームワークを紹介しました。主な貢献は次のとおりです。
- 意思決定述語分解。3 つの方法プロトコル (構造化された引き出し、意思決定ツリーの誘導、反事実の調査) を通じて抽出された、原子的な論理条件の構造化された語彙として専門家の推論を表します。
- 継承関数 I(f_expert, f_agent) は、論理の保存を述語レベルの保存スコアの加重合計として測定し、活性化、境界、相互作用の各コンポーネントに分解されます。この関数は、出力の精度とは根本的に異なり、それよりも有益な知識伝達の忠実度の構造的な尺度を提供します。
- デシジョン ツリー等価性テスト (正規表現上の正規化されたツリー編集距離による)。どの推論部分構造が保存され、どの部分構造が劣化しているかを正確に特定するサブツリー保存分析によって補足されます。
- 6 つのロジック保存メトリクス (PC、BF、IP、MC、EHC、CC)。展開の自律性レベルを管理する複合ロジック保存スコアを使用して、ロジック保存のさまざまな側面について個別に測定可能で診断的に実行可能な評価を提供します。
- 責任起源グラフ は、一時的なバージョニングを使用して、すべてのエージェントの決定を元の専門家ルールまで追跡し、保険規制の遵守に必要な完全な監査証跡を提供します。
- 継続的ドリフト検出フレームワークは、逐次仮説テスト (Page-Hinkley) に基づいており、48 時間以内に論理劣化を検出します。また、保存スコアが低下した場合にエージェントの自律性を自動的に調整する段階的応答プロトコルを備えています。
このフレームワークを商業用不動産の引受業務に適用したところ、94.7% のロジック保存スコア、97.2% のデシジョン ツリー構造的等価性、および 100% の責任連鎖カバレッジを達成しました。これらの結果は、専門家の知識の保存が単なるモデルの精度の問題ではなく、正式な検証、継続的な監視、および構造化された人間の監視を必要とするガバナンスの問題であることを示しています。
このフレームワークは、意思決定パイプライン、責任ゲート システム、ガバナンス ダッシュボードを通じて MARIA OS と統合されており、専門引受会社の蓄積された判断を犠牲にすることなく保険引受ガバナンスを自動化できることを実証しています。重要な洞察は、引受業務の自動化は専門家の判断を置き換えることを意味するものではなく、それを正式に継承し、継続的に検証し、元の専門家からすべての代理店の決定までの明確な責任の連鎖を維持することを意味するということです。
保険引受業務における AI の将来は、人間の専門家よりも賢い代理店を構築することではありません。それは、マシン スケールで動作しながら、人間の専門知識に「明らかに忠実」なエージェントを構築することです。引受責任継承フレームワークは、その未来への私たちの貢献です。
参考文献
[1] クライン、G. (1998)。力の源: 人々がどのように意思決定を行うか。 MITプレス。
[2] Hoffman, R.R.、Crandall, B.、および Shadbolt, N. (1998)。専門知識を引き出すための重要な決定方法の使用: 認知タスク分析の方法論におけるケーススタディ。 ヒューマンファクター、40(2)、254–276。
[3] Zhang, K.、Shasha, D. (1989)。木の間の距離を編集するためのシンプルで高速なアルゴリズムと関連する問題。 SIAM ジャーナル オン コンピューティング、18(6)、1245–1262。
[4] Ribeiro, M.T.、Singh, S.、Guestrin, C. (2016)。 「なぜあなたを信頼しなければならないのですか?」任意の分類子の予測について説明します。 KDD の議事録、1135 ~ 1144。
[5] モルナー、C. (2022)。解釈可能な機械学習: ブラック ボックス モデルを説明可能にするためのガイド。第2版christophm.github.io/interpretable-ml-book。
[6] Koh、P.W.、Liang、P. (2017)。影響関数によるブラックボックス予測を理解する。 ICML の議事録、1885 ~ 1894 年。
[7] Lundberg, S.M. & Lee, S.-I. (2017年)。モデル予測を解釈するための統合アプローチ。 神経情報処理システムの進歩、30.
[8] ページ、E.S. (1954)。継続的検査スキーム。 バイオメトリカ、41(1–2)、100–115。
[9] 全国保険委員協会 (NAIC)。 (2024年)。モデル監査ルール: 保険会社のガバナンスの要件。 NAIC モデル法。
[10] 欧州保険・職業年金庁 (EIOPA)。 (2025年)。保険における人工知能のガバナンスとリスク管理。 EIOPA ディスカッションペーパー。
[11] アクチュアリー協会。 (2024年)。保険引受業務における予測分析と機械学習: 実践基準。 SOA 調査レポート。
[12] Chen, T.、Guestrin, C. (2016)。 XGBoost: スケーラブルなツリー ブースティング システム。 KDD の議事録、785 ~ 794。
[13] Kim, B.、Wattenberg, M.、Gilmer, J.、Cai, C.、Wexler, J.、Viegas, F.、および Sayres, R. (2018)。機能帰属を超えた解釈可能性: Concept Activation Vectors (TCAV) を使用した定量的テスト。 ICML 議事録、2668 ~ 2677。
[14] フリードマン、J. H.、ポペスク、B.E. (2008)。ルールアンサンブルによる予測学習。 応用統計年報、2(3)、916–954。