YASUHIRO
RAG 導入の要件定義・システム設計
コンサルティング2025

RAG 導入の要件定義・システム設計

ConsultingFinTech RAG

Overview

多岐にわたる、業務規程集をリアルタイムに検索し正確に回答するシステム導入を支援しました。要件定義から、データベース構築仕様策定、パイプライン設計、精度評価フレームワークの導入まで、エンタープライズAI導入の全フェーズを担当しました。

フェーズ 1 — 課題整理:As-Is分析とペインポイントの構造化

キックオフ段階において、業務の現状(As-Is)を深くヒアリング・分析しました。「検索が遅い」という表層的な課題だけでなく、ナレッジ管理の構造的な欠陥を浮き彫りにし、AI導入の目的を再定義しました。

Pain Point 1

情報のサイロ化と属人化

分散するナレッジソース

金融商品ごとの規程集(PDF)、社内ポータルのFAQ(HTML)、ベテラン社員のローカルExcelメモなど、情報ソースが分散。検索ツールが統一されておらず、「誰に聞くか」が最も早い解決策となっていました。

Pain Point 2

AHT増大と保留率の悪化

平均3〜5分の保留時間

新人オペレーターは顧客を「保留」にしてから正解を探すまでに平均3〜5分を要しており、顧客満足度(CS)の低下とスーパーバイザー(SV)へのエスカレーション負荷が限界に達していました。

フェーズ 2 — 要件定義:ビジネス目標とシステム要件の橋渡し

Req.1

データガバナンスとFAQ DB仕様の策定

メタデータ設計 / データライフサイクル管理

AI導入の前提として、分散したデータをRAGに適した形式に再構成する『FAQ DB構築仕様書』を策定。「いつの、どの商品の、誰向けの規程か」を明示するメタデータ設計(タグ付け)を要件化し、AIが「過去の無効な規程」を誤って参照しないデータガバナンスルールを定義しました。

Req.2

非機能要件と精度評価フレームワークの確立

RAGAs / SLA定義

「AIが正確に答えたか」を人間が目視確認する属人的な評価を脱却するため、RAGAs(Retrieval Augmented Generation Assessment)などの定量評価フレームワーク導入を要件化。「出典の正確性(Faithfulness)99%以上」などの厳密なSLAを経営層と合意しました。

フェーズ 3 — FAQデータベース構築仕様(データエンジニアリング)

RAGの精度は「検索されるデータ(Context)の質」に大きく依存します。既存の非構造化ドキュメント(PDF, HTML, Word)をAIが解釈しやすい構造化データへ変換するETLパイプラインと、精密なメタデータスキーマを設計しました。

変数説明データ型
doc_id / chunk_idドキュメントおよびチャンクの一意な識別子。「【出典】第〇版 業務規程集 P.12」形式での参照元提示に利用。String
product_category対象商品カテゴリ(例: ["住宅ローン", "無担保ローン"])。検索範囲をベクトルDB内でPre-filteringするメタデータフィルター用。List[String]
valid_from / valid_to規程の有効期間。現在日時と照合し、過去の古い規程(廃止済みルール)を検索対象から自動除外する時限フィルター。Date
content_type"text"・"table"・"faq" の区別。表データの場合はVisionモデルによるMarkdown/JSON変換を経由するパース処理分岐に使用。Enum
🗂️

セマンティック・チャンキングと表形式データの構造保持

単純な「500文字ごとの分割」では文脈が切れてしまうため、マニュアルの見出し階層(Heading 1, 2, 3)をメタデータとして保持したまま分割する**セマンティック・チャンキング**を採用。また、金融商品特有の複雑なテーブルデータ(金利表・手数料表・条件分岐テーブル)は、LLM(Visionモデル)を用いて**Markdown形式またはJSON形式に変換してベクトル化**し、行列の意味構造を破壊せずにAIが検索・理解できるよう前処理を実装しました。

フェーズ 4 — Advanced RAGアーキテクチャ設計

オペレーターの「口語的で曖昧なクエリ」から、規程集の「堅い表現」を正確に引き当てるため、複数段階の検索パイプライン(Advanced RAG)を構築しました。

1. Query Transformation
2. Hybrid Search
3. Reranking
4. Grounded Generation
Step 1

Query Transformation

Query Expansion / HyDE

オペレーターの口語的な質問をLLMが「金融専門用語」や「複数キーワード」に拡張・書き換え(Query Expansion)。また仮説的ドキュメント生成(HyDE)により、「こんな回答が書かれた文書があるはず」という仮想文書を生成して検索精度を向上させました。

Step 2

Hybrid Search

Dense + Sparse + Pre-filter

ベクトル検索(意味的類似度)+ BM25(キーワード一致検索)を組み合わせたHybrid Searchで専門用語の取りこぼしを防止。同時に、日付(valid_from/to)・商品カテゴリのメタデータでPre-filteringを実施。

Step 3

Reranking

Cross-Encoder / Cohere Rerank / BGE M3

取得した上位20件のチャンクを、Cross-Encoderベースのリランカー(Cohere Rerank / BGE M3)で質問文との関連性に基づき再スコアリング。真に必要な上位3〜5件のみをLLMコンテキストに渡し、ノイズを除去。

最新アーキテクチャの提案:Agentic RAG × GraphRAG

🤖

Agentic RAG — AIが「何をすべきか」を自律判断する

オペレーターの質問内容に応じ、AIエージェントが自律的に「社内FAQを検索するべきか」「金利計算のAPIを叩くべきか」「情報不足のためオペレーターに追加ヒアリングを促すべきか(Clarification)」を動的に判断する**Tool Calling / Routing アーキテクチャ**を設計しました。2024〜2026年にかけてエンタープライズAI導入で主流となりつつある「ReActエージェント」「Function Calling」の知見を実装し、複雑な条件分岐を伴う金融商品の案内精度が飛躍的に向上しました。

🕸️

GraphRAG — 商品間の複雑な関係性をナレッジグラフで捉える

「商品Aと商品Bの併用条件」といった、複数ドキュメントを跨ぐ複雑な関係性(エンティティ関係)を処理するため、ベクトル検索に加えて**Knowledge Graph(ナレッジグラフ)**を併用する「GraphRAG」を設計しました。Microsoft Research(2024)が提唱したGraphRAGの手法を参考に、金融商品間の依存関係・制約条件・適用除外をグラフ構造で表現することで、多角的な質問に対する回答の網羅性(Recall)と論理的整合性を確保しました。

精度評価フレームワーク(RAGAs)

🎯
RAGAs指標1

Faithfulness(忠実性)

回答 ⊆ 検索コンテキスト

回答がコンテキストにのみ基づいているか(LLMが知識を捏造していないか)を検証。ハルシネーション検出の最重要KPI。目標: 99%以上。

🔍
RAGAs指標2

Context Precision / Recall

必要チャンク ÷ 全検索チャンク

Context Precisionは「検索上位に必要情報が来ているか」、Context Recallは「正解情報が漏れなく検索できているか」を月次トラッキング。

💬
RAGAs指標3

Answer Relevance(関連性)

回答と質問の意味的整合性

質問に対して的確に答えているかを自動スコアリング。無関係な情報を回答に混入させるノイズの度合いを定量化し、月次改善サイクルへ。

コンサルティングの成果とビジネスインパクト

⏱️
AHT削減

平均処理時間 推定30%削減

3〜5分 → 1分以下(検索〜回答)

Advanced RAG(Query Expansion + Hybrid Search + Reranking)により、オペレーターのマニュアル検索時間を最大80%削減。AHT全体の約30%改善を達成。

🛡️
コンプライアンス

重要規程ハルシネーション 0%

Grounded Generation + 出典100%明記

Grounded Generationと厳密なプロンプト制御により、回答不能ケースは「回答不可」と出力してエスカレーション。金融コンプライアンスリスクをゼロに。

📈
データ資産化

構造化FAQデータベースの確立

将来のAI基盤としての再利用性

今回構築したメタデータ付きFAQ DBは、将来の他AIシステム(チャットボット・自動応答等)にも流用可能なデータ資産。RAG精度向上のフライホイールを形成。

プロジェクト情報

カテゴリ

コンサルティング / 生成AI / RAG

年度

2025

分野

コールセンターAI / FinTech

言語

Python / FastAPI

技術スタック

LlamaIndex / LangChainRAGAsHybrid Search

キーワード

Advanced RAGAgentic RAGGraphRAGHybrid SearchRerankingRAGAsハルシネーション対策Semantic ChunkingQuery ExpansionHyDE

ハイライト

  • Query Expansion + Hybrid Search + Cross-Encoder Rerankingの多段階Advanced RAGパイプライン
  • Agentic RAG(Tool Calling)によるAPI・FAQの自律的使い分けアーキテクチャ提案
  • メタデータスキーマ(有効期限・商品カテゴリ)によるFAQ DBデータガバナンス設計