ほとんどの住宅ローン審査(モーゲージ・アンダーライティング)のパイプラインが失敗するのは、審査ロジックが原因ではありません。原因は入力データが信頼できないことです。
私は、現在本番稼働している米国の住宅ローン審査企業向けのドキュメント処理システムに取り組んでいました。デモでもベンチマークでもありません。
何をするか
- フィールドの96%を完全に自動で抽出
- 残りの4%は、対象を絞った人手による確認で解決
- 出力層で100%の最終精度
典型的な構成の問題点
多くのチームは Textract、Document AI、Azure などの汎用OCRツールに依存しています。しかし実際には、抽出精度は約70%で頭打ちになります。
その結果、次のようになります:
- 継続的な手作業による修正
- 手戻りと遅延
- 審査ではなくデータ修正のために大規模なオペレーションチームを使うことになる
何が変わったか
すべての書類を同じものとして扱うのではなく、このシステムは審査に特化した書類タイプを中心に構築されています:
- フォーム1003
- W-2
- 給与明細
- 銀行取引明細(バンクステートメント)
- 1040の税申告書
- 雇用・収入の確認書類
各書類タイプには、それぞれ独自の抽出+バリデーションロジックがあります。
システム設計
- プレーンOCRではない、レイアウトを考慮した抽出
- 書類タイプごとのフィールド単位のバリデーションルール
- すべてのフィールドが出所(ソース位置)に追跡可能
- コンフィデンス+上書き(オーバーライド)のログ
- 完全に監査可能なパイプライン
コンプライアンス対応
- SOC 2に整合(アクセス制御、監査ログ、変更追跡)
- 機微な金融/PIIデータを扱う(必要に応じてHIPAAスタイルの保護策)
- GLBA+貸し手(レンダー)側のコンプライアンス要件に対応
- VPC内またはオンプレミス環境で動作
結果
- 手作業による確認の削減: 65〜75%
- 処理時間: 24〜48時間 → ファイルあたり10〜30分
- フィールド精度: 約70% → 約96%(レビュー前)
- 例外(エクセプション)の発生が60%以上減少
- オペレーション要員の人員数が30〜40%減少
- 年間約200万ドルのコスト削減
- 汎用プロバイダと比べて、インフラ+OCRコストが40〜60%低減
- 完全な監査可能性
重要な洞察
これは「AIモデルの精度」の問題ではありません。パイプライン設計の問題です。
抽出が書類を認識し、検証され、監査可能であれば、残りの審査は簡単になります。
ここで質問するか、ダイレクトメッセージで連絡してください。一般的な議論やコンサルティングの問い合わせも歓迎します。
[link] [comments]




