Build:
cmake --preset linux-ninja-release && cmake --build --preset linux-ninja-release
Semantische Dokumentensuche mit Embeddings und RAG (Retrieval Augmented Generation). Demonstriert Vector Search Features.
- ✅ Dokument-Upload - PDF, TXT, DOCX
- ✅ Automatische Embeddings - sentence-transformers
- ✅ Semantische Suche - Ähnlichkeit statt Keywords
- ✅ RAG-Workflow - Context für LLMs
- ✅ Ranking - Relevanz-Scoring
- ✅ Hybrid Search - Vector + Volltext
- ✅ Collection Management - Dokumente organisieren
{
"id": "doc_uuid",
"title": "Dokumenttitel",
"content": "Volltext...",
"embedding": [0.123, -0.456, ...], # 384D Vector
"metadata": {
"author": "Max Mustermann",
"created": "2025-12-22",
"type": "pdf",
"pages": 15
},
"collection": "technical_docs"
}cd examples/07_vector_search_documents
pip install -r requirements.txt
# Modell wird automatisch heruntergeladen
python main.pySiehe HOW_TO.md, VECTOR_SEARCH.md, EMBEDDINGS_GUIDE.md.
- Vector Model - Hochdimensionale Vektoren
- HNSW/FAISS - Effiziente Ähnlichkeitssuche
- Embeddings - Text zu Vektoren
- RAG Pattern - Context Retrieval für LLMs
- Hybrid Search - Kombination mehrerer Ansätze
- Dokumenten-Bibliothek durchsuchen
- Ähnliche Dokumente finden
- Fragen beantworten (Q&A)
- Context für LLMs bereitstellen
Status: Geplant