Open SourceRAGLLM
Overview
PrivateGPTは、手元のPDF・TXT・Wordファイルや、Google Drive上の文書をデータソースとして、プライベートな質問応答を実現するStreamlitアプリです。RAG(Retrieval-Augmented Generation)の手法を用いて、社内資料や技術ドキュメントに対する対話形式の検索・回答を可能にします。DockerおよびStreamlit Cloudへのデプロイにも対応しています。
プロジェクト概要
PrivateGPTは、自社データに基づいてOpenAIのLLMと対話できるRAGアプリです。PDFやTXTなどのローカルファイル、またはGoogle Driveのドキュメントをベクトルデータベース(ChromaDB)に取り込み、自然言語で質問するだけで関連情報を抽出・回答します。API keyの漏洩リスクを最小限に抑えながら、組織内での安全な活用を想定して設計しています。
主な機能
- 1ローカルファイル(PDF・TXT・Word)のDrag & Drop一括アップロード
- 2Google OAuth2認証によるGoogle Driveファイルの取り込み
- 3embedchain + ChromaDBによるベクトル検索(RAG)
- 4StreamlitによるWebチャットUI(Markdown対応・スピナー表示)
- 5Docker / Streamlit Cloud へのデプロイ対応
- 6SQLite3バージョン問題の自動修正機能
🔒
RAGとは
Retrieval-Augmented Generation(検索拡張生成)。LLMが学習していない独自データを外部から検索し、その内容を参照して回答を生成する手法。社内文書への応用に最適です。
プロジェクト情報
カテゴリ
ツール / AIアプリ
年度
2024
分野
生成AI・RAG・社内文書検索
言語
Python 3.8+
技術スタック
PythonStreamlitembedchainChromaDBOpenAI APIGoogle Drive APIDockerpysqlite3
キーワード
RAGLLMPrivateGPTStreamlitChromaDB社内文書プライベートAIOpen Source
ハイライト
- ✓PDFやGoogle Driveをそのままデータソースとして利用可能
- ✓RAGによりLLMが学習していない社内情報に回答
- ✓Docker・Streamlit Cloudの両環境にデプロイ対応
- ✓Qiitaで技術解説記事を公開・GitHubでOSS公開
