YASUHIRO
PrivateGPT
Product — 2024

PrivateGPT

Open SourceRAGLLM

Overview

PrivateGPTは、手元のPDF・TXT・Wordファイルや、Google Drive上の文書をデータソースとして、プライベートな質問応答を実現するStreamlitアプリです。RAG(Retrieval-Augmented Generation)の手法を用いて、社内資料や技術ドキュメントに対する対話形式の検索・回答を可能にします。DockerおよびStreamlit Cloudへのデプロイにも対応しています。

プロジェクト概要

PrivateGPTは、自社データに基づいてOpenAIのLLMと対話できるRAGアプリです。PDFやTXTなどのローカルファイル、またはGoogle Driveのドキュメントをベクトルデータベース(ChromaDB)に取り込み、自然言語で質問するだけで関連情報を抽出・回答します。API keyの漏洩リスクを最小限に抑えながら、組織内での安全な活用を想定して設計しています。

主な機能

  1. 1ローカルファイル(PDF・TXT・Word)のDrag & Drop一括アップロード
  2. 2Google OAuth2認証によるGoogle Driveファイルの取り込み
  3. 3embedchain + ChromaDBによるベクトル検索(RAG)
  4. 4StreamlitによるWebチャットUI(Markdown対応・スピナー表示)
  5. 5Docker / Streamlit Cloud へのデプロイ対応
  6. 6SQLite3バージョン問題の自動修正機能
🔒

RAGとは

Retrieval-Augmented Generation(検索拡張生成)。LLMが学習していない独自データを外部から検索し、その内容を参照して回答を生成する手法。社内文書への応用に最適です。

プロジェクト情報

カテゴリ

ツール / AIアプリ

年度

2024

分野

生成AI・RAG・社内文書検索

言語

Python 3.8+

技術スタック

PythonStreamlitembedchainChromaDBOpenAI APIGoogle Drive APIDockerpysqlite3

キーワード

RAGLLMPrivateGPTStreamlitChromaDB社内文書プライベートAIOpen Source

ハイライト

  • PDFやGoogle Driveをそのままデータソースとして利用可能
  • RAGによりLLMが学習していない社内情報に回答
  • Docker・Streamlit Cloudの両環境にデプロイ対応
  • Qiitaで技術解説記事を公開・GitHubでOSS公開
GitHubで見る
Qiitaの記事を読む