Entitäten

Automatische Extraktion und Verwaltung von Entitäten aus Dokumenten.

MethodeLLM-Extraktion (prompt-basiert)
TypenDynamisch aus Dokumenten
SpracheDeutsch
KuratierungManuell via Web-UI

Entitätstypen

TypBeschreibungBeispiel
PERSONAutoren, TherapeutenCarl Rogers
ORGANIZATIONInstitute, VerlageCarl Auer Verlag
CONCEPTTheorien, MethodenSystemtheorie
WORKBücher, ArtikelDie Kunst der Psychotherapie
EVENTKonferenzenHeidelberger Symposium
TERMFachbegriffeZirkuläres Fragen

Deduplizierung

Synonyme werden in einer Referenzierungs-Tabelle gespeichert:

entity_synonyms:
  entity_id: 42 (Carl Rogers)
  synonyms:
    - "Rogers"
    - "C. Rogers"
    - "Carl R. Rogers"

Extraktions-Prompt

Analysiere folgenden Text und extrahiere alle Entitäten.
Bestimme den Typ selbstständig basierend auf dem Kontext.

Text: {chunk_content}

Ausgabeformat JSON:
{
  "entities": [
    {
      "name": "Carl Rogers",
      "type": "PERSON",
      "context": "Begründer der klientenzentrierten Therapie",
      "confidence": 0.95
    }
  ]
}

Relationen

RelationBeschreibung
AUTHORED_BYPerson verfasste Werk
INFLUENCEDPerson beeinflusste Person/Konzept
PART_OFKonzept ist Teil von
APPLIESMethode wendet Konzept an
EXTENDSKonzept erweitert Konzept
CITESWerk zitiert Werk

Datenbank-Schema

entities (
    id, name, canonical_name, type,
    description, created_at
)

entity_synonyms (
    entity_id, synonym
)

entity_relations (
    source_entity_id, target_entity_id,
    relation_type, confidence
)

document_entities (
    document_id, entity_id,
    mention_count, relevance_score
)

Web-UI Features