KI-System
Integriertes System zur Dokumentenverarbeitung, semantischen Analyse und Content-Erstellung mit RAG-Chat.
| Status | In Entwicklung |
|---|---|
| Backend | Python 3.13 |
| Frontend | PHP 8.4 + HTMX |
| LLM | Claude Opus 4.5 + Ollama |
| Datenbank | ki_system (27 Tabellen) |
| Embedding | mxbai-embed-large (1024 dim) |
Infrastruktur
Pipeline
- Document Pipeline - Nextcloud → MariaDB → Qdrant
Semantik
Anwendungen
- RAG-Chat - Semantische Suche + LLM
- Content-Studio - Autorenprofile, Contracts, Kritiker
Datenfluss
Nextcloud (lokal)
↓
Pipeline (Python)
├── Text-Extraktion (OCR, Vision)
├── Semantisches Chunking
└── Metadaten-Anreicherung
↓
MariaDB (ki_system)
├── Dokumente, Chunks
├── Entitäten, Relationen
└── Taxonomie, Ontologie
↓
Qdrant (Embeddings, 1024 dim)
↓
Web-UI (Chat, Content-Studio)
Setup-Status
| Komponente | Status |
|---|---|
| Embedding-Model (mxbai-embed-large) | Installiert |
| Datenbank (ki_system) | Erstellt (27 Tabellen) |
| Initial-Daten | Geladen (Prompts, Profile, Kritiker) |
| Qdrant Collections | Erstellt (documents, mail, entities) |
| Nextcloud-Pfad | /var/www/nextcloud/data/root/files/Documents |
| Pipeline-Scripts | Erstellt (/opt/scripts/pipeline/) |