Personal Documents AI Assistant

Production-ready RAG system with enterprise-grade architecture

A secure, retrieval-augmented generation system that provides instant, source-backed answers from internal documentation. Built with modern AI infrastructure and optimized for accuracy and performance.

Next.js 15TypeScriptPostgreSQL + pgvectorPrisma ORMOpenAI APIClerk AuthTailwind CSS

See It In Action

Watch how DocAI processes documents and answers questions

Demo video coming soon

Core Capabilities

Enterprise-grade features built for accuracy, security, and performance

🔍

Vector Search

Semantic retrieval using cosine similarity on high-dimensional embeddings stored in PostgreSQL with pgvector extension.

1536-dimensional vectors
Cosine similarity matching
Top-K retrieval with thresholds

📎

Source Attribution

Every answer includes verifiable citations with document titles, content previews, and similarity scores for complete transparency.

Document traceability
Confidence scoring (≥30%)
Content preview snippets

⚡

Real-time Indexing

Instant document processing with intelligent chunking that preserves semantic context at boundaries.

~500 word chunks
50 word overlap
Context preservation

💬

Chat History

Maintains conversational context across messages for coherent multi-turn interactions.

Persistent sessions
Context-aware responses
Conversation threading

🔒

Secure Authentication

Enterprise-grade authentication with Clerk ensuring your data stays private and secure.

User isolation
Session management
Role-based access

📄

Multi-format Support

Upload documents in various formats with automatic parsing and text extraction.

.txt, .md, .csv, .json
Automatic parsing
UTF-8 encoding support

How RAG Works

Retrieval-Augmented Generation combines semantic search with large language models to provide accurate, source-backed answers

Upload Document

Submit documents in supported formats

.txt, .md, .csv, .json

Text Chunking

Split into semantic segments with overlap

500 words, 50 overlap

Generate Embeddings

Convert text to vector representations

1536-dim vectors

Store in pgvector

Save to PostgreSQL with vector support

PostgreSQL + vectors

User Question

Ask natural language queries

"What is...?"

Embed Query

Convert question to same vector space

Same embedding model

Similarity Search

Find most relevant document chunks

Top 5 chunks, ≥30%

LLM + Context

Generate answer with citations

gpt-4o-mini

Technical Architecture

Built on modern AI infrastructure with production-grade components

1Document Ingestion Pipeline

Upload

Multi-format support

Parse

Text extraction

Chunk

~500 words + overlap

Embed

text-embedding-3-small

Store

PostgreSQL + pgvector

2Query & Response Pipeline

Query

Natural language input

Vectorize

Same embedding model

Cosine similarity

Retrieve

Top-K chunks

Generate

GPT-4o-mini + context

Implementation Details

Key technical decisions and optimizations

Document Processing

~500-word chunks with 50-word overlap
Preserves context at boundaries
Handles multiple file formats
UTF-8 encoding support

Vector Operations

1536-dimensional embeddings
OpenAI text-embedding-3-small
Cosine similarity matching
30% similarity threshold

Database & Storage

PostgreSQL with pgvector extension
Prisma ORM for type safety
Efficient vector indexing
User-isolated data stores

Response Generation

GPT-4o-mini for cost efficiency
Top-5 chunk retrieval
Conversational context management
Source attribution in responses