Eine Company Brain Datenbank muss nicht aus einer einzigen Speicherform bestehen. SQL-Datenbanken sind stark bei strukturierten Kernobjekten, Graphdatenbanken bei Beziehungen und Vektordatenbanken bei semantischer Ähnlichkeit. Für mittelständische Unternehmen ist oft die Kombination entscheidend: stabile Stammdaten, verständliche Beziehungen, gute KI-Suche und sichere Ablage der Originaldateien.
Warum ist die Datenbankfrage beim Company Brain so wichtig?
Viele Unternehmen stellen sich ein Company Brain zunächst wie eine intelligente Suche vor. Dokumente werden hochgeladen, eine KI beantwortet Fragen, Mitarbeiter sparen Zeit. Das klingt einfach, greift technisch aber zu kurz.
Ein Company Brain speichert nicht nur Texte. Es muss Kunden, Prozesse, Rollen, Freigaben, Wissensobjekte, Dokumente, Quellen, Versionen, Verantwortlichkeiten, Berechtigungen und Beziehungen verwalten. Gleichzeitig soll es semantisch suchen können: Ein Mitarbeiter fragt nicht nach einem exakten Dateinamen, sondern nach Bedeutung. Zum Beispiel: „Welche Regel gilt bei einem Sonderrabatt für Bestandskunden?“ oder „Was müssen wir bei diesem Auftrag aus früheren Projekten beachten?“
Diese Anforderungen passen nicht sauber in eine einzige Speicherform. Eine relationale Datenbank kann sehr gut sagen, welcher Kunde welchen Vertrag, welchen Status und welche Freigabe hat. Eine Graphdatenbank kann sehr gut zeigen, wie Kunden, Projekte, Entscheidungen, Personen und Risiken zusammenhängen. Eine Vektordatenbank kann sehr gut semantisch ähnliche Inhalte finden. Object Storage kann Originaldateien stabil, günstig und nachvollziehbar speichern.
Die Architekturfrage lautet deshalb nicht: „Welche Datenbank ist die beste?“
Die bessere Frage lautet: „Welche Speicherform löst welchen Teil des Problems?“
Was leisten relationale Datenbanken im Company Brain?
Relationale Datenbanken wie PostgreSQL sind stark, wenn Informationen klar strukturiert sind. Tabellen, Spalten, Schlüssel, Beziehungen und Transaktionen sind nicht altmodisch, sondern genau das, was ein belastbares Company Brain im Kern braucht.
Ein Wissensobjekt hat eine ID, einen Titel, einen Status, einen Eigentümer, eine Quelle, ein Prüfdatum, eine Vertraulichkeitsstufe, eine Version und vielleicht einen Bezug zu Kunden, Prozessen oder Rollen. Das ist klassische Datenbankarbeit.
PostgreSQL ist hier besonders interessant, weil es nicht nur relationale Strukturen kann. Es bietet JSON-Funktionen, Volltextsuche, Row-Level Security und mit pgvector auch Vektorsuche als Erweiterung. Die PostgreSQL-18-Veröffentlichung vom 25. September 2025 zeigt außerdem, dass PostgreSQL aktiv weiterentwickelt wird, unter anderem bei Performance und Suche. Quelle: https://www.postgresql.org/about/news/postgresql-18-released-3142/
Für den Mittelstand ist das wichtig. Eine relationale Datenbank ist kein Spezialexperiment. Sie ist ein stabiler technischer Kern für Daten, Rechte, Status, Auswertungen und Schnittstellen.
Was leisten Vektordatenbanken oder pgvector?
Vektorsuche ist stark, wenn Nutzer nicht exakt wissen, wonach sie suchen. Statt nur nach Stichworten zu suchen, werden Inhalte als Embeddings gespeichert. Texte mit ähnlicher Bedeutung liegen im Vektorraum näher beieinander. Dadurch kann ein System semantisch suchen.
Das hilft bei Fragen wie:
„Welche früheren Projekte hatten ähnliche Probleme?“
„Gibt es eine Regel zu diesem Sonderfall?“
„Welche Dokumentation passt zu dieser Kundenanfrage?“
„Welche internen Hinweise ähneln diesem Ticket?“
pgvector bringt diese Fähigkeit direkt in PostgreSQL. Die offizielle pgvector-Dokumentation beschreibt Unterstützung für exakte und approximative Ähnlichkeitssuche, verschiedene Distanzmaße und Indexarten wie HNSW und IVFFlat. Quelle: https://github.com/pgvector/pgvector
Das ist für viele Company-Brain-Starts attraktiv. Man muss nicht sofort eine separate Vektordatenbank betreiben. Man kann Kernobjekte, Metadaten, Berechtigungen und Embeddings zunächst nah beieinander halten. Für größere Datenmengen, sehr hohe Suchlast oder spezialisierte Retrieval-Anforderungen können später zusätzliche Vektordatenbanken sinnvoll werden.
Wichtig bleibt: Vektorsuche beantwortet nicht automatisch, ob eine Information aktuell, freigegeben oder berechtigt ist. Dafür braucht sie Metadaten und Zugriffskontrolle.
Was leisten Graphdatenbanken?
Graphdatenbanken sind stark, wenn Beziehungen wichtiger werden als einzelne Datensätze. Ein Company Brain besteht genau aus solchen Beziehungen.
Ein Kunde ist mit Projekten verbunden. Projekte enthalten Entscheidungen. Entscheidungen beziehen sich auf Prozesse. Prozesse haben Rollen. Rollen haben Berechtigungen. Dokumente belegen Regeln. Regeln haben Ausnahmen. Ausnahmen betreffen bestimmte Kunden oder Standorte. Ein Risiko aus einem alten Projekt kann für ein neues Angebot relevant sein.
In einer relationalen Datenbank lässt sich das ebenfalls modellieren. Aber bei sehr vielen, wechselnden und tief verschachtelten Beziehungen kann ein Graph anschaulicher und flexibler sein. Neo4j beschreibt Graphdatenbanken als Plattform für stark vernetzte Daten, bei denen Beziehungen direkt modelliert und abgefragt werden können. Quelle: https://neo4j.com/
Für ein mittelständisches Company Brain ist ein Graph nicht zwingend der erste Schritt. Aber er wird interessant, wenn Fragen wie diese wichtig werden:
„Welche Kunden sind indirekt von dieser Regeländerung betroffen?“
„Welche Projekte hatten ähnliche technische Entscheidungen?“
„Welche Personen, Systeme und Prozesse hängen an diesem Risiko?“
„Welche Wissensobjekte widersprechen sich möglicherweise?“
Dann geht es nicht mehr nur um Suche. Dann geht es um Zusammenhänge.
Welche Rolle spielt Object Storage?
Object Storage speichert Originaldateien. Das klingt banal, ist aber wichtig.
Ein Company Brain sollte nicht so tun, als bestehe Unternehmenswissen nur aus bereinigten Texten. Originaldateien bleiben relevant: PDFs, Angebote, Vertragsdokumente, Bilder, Pläne, Protokolle, E-Mails, Anhänge, Scans, technische Dateien oder exports aus Fachsystemen.
Diese Dateien gehören nicht immer direkt in SQL-Tabellen. Häufig ist es sinnvoller, sie in Object Storage zu speichern und in der Datenbank nur Metadaten, Verweise, Status, Prüfinformationen und extrahierte Inhalte zu halten.
So bleibt nachvollziehbar, aus welcher Quelle ein Wissensobjekt entstanden ist. Die KI-Suche kann auf bereinigte Chunks und Metadaten zugreifen, während die Originaldatei als Nachweis erhalten bleibt.
Welche Architektur passt zu welchem Zweck?
| Speicherform | Typischer Einsatz im Company Brain | Stärke | Grenze |
|---|---|---|---|
| PostgreSQL | Kernobjekte, Nutzer, Rollen, Prozesse, Quellen, Status, Metadaten | Stabil, transaktional, auswertbar, gut integrierbar | Komplexe Beziehungsanalysen können unübersichtlich werden |
| pgvector | Semantische Suche über Wissensobjekte, Chunks und Dokumentauszüge | Nähe zu SQL, gute Startarchitektur, weniger Systemkomplexität | Für sehr große Retrieval-Szenarien eventuell begrenzt |
| Graphdatenbank | Kunden-, Projekt-, Prozess- und Entscheidungsbeziehungen | Stark bei komplexen Beziehungen und Pfadabfragen | Zusätzliche Architektur- und Betriebslogik |
| Object Storage | Originaldateien, PDFs, Anhänge, Bilder, Scans, Exporte | Günstig, robust, gut für große Dateien | Keine Wissenslogik ohne Metadaten und Verarbeitung |
| Separate Vektordatenbank | Große semantische Suche, hohe Abfragefrequenz, Spezialretrieval | Skalierung und spezialisierte Suche | Zusätzlicher Betrieb, Synchronisierung, Rechteprüfung |
Diese Tabelle zeigt: Ein Company Brain muss nicht mit der komplexesten Architektur starten. Es sollte aber so entworfen werden, dass spätere Erweiterungen möglich bleiben.
Welche Kennzahlen zeigen, warum PostgreSQL als Kern attraktiv ist?
Die Stack Overflow Developer Survey 2025 umfasst mehr als 49.000 Antworten aus 177 Ländern und behandelt 314 Technologien. Im Datenbankbereich wird PostgreSQL als meist gewünschte und meist bewunderte Datenbanktechnologie hervorgehoben. Quelle: https://survey.stackoverflow.co/2025 und https://survey.stackoverflow.co/2025/technology
PostgreSQL 18 wurde am 25. September 2025 veröffentlicht. Die Veröffentlichung nennt unter anderem Verbesserungen bei Abfrageperformance und Änderungen im Bereich Volltextsuche. Für Company-Brain-Systeme ist das relevant, weil klassische Suche, strukturierte Daten und KI-Suche nicht isoliert betrachtet werden sollten. Quelle: https://www.postgresql.org/about/news/postgresql-18-released-3142/
pgvector unterstützt exakte und approximative Nearest-Neighbor-Suche sowie Indexarten wie HNSW und IVFFlat. Das ist wichtig, weil viele mittelständische Company-Brain-Anwendungen zunächst semantische Suche benötigen, ohne sofort eine separate Vektordatenbank einzuführen. Quelle: https://github.com/pgvector/pgvector
Neo4j positioniert Graphtechnologie für stark vernetzte Daten und komplexe Beziehungsauswertungen. Für Company-Brain-Anwendungsfälle wird das relevant, wenn nicht nur Dokumente gefunden, sondern Beziehungen zwischen Kunden, Projekten, Entscheidungen, Risiken und Prozessen verstanden werden müssen. Quelle: https://neo4j.com/
Warum sollte ein Mittelständler nicht sofort mit drei Datenbanken starten?
Technisch klingt eine Kombination aus SQL, Graph und Vektor überzeugend. Praktisch kann sie zu früh zu viel Komplexität erzeugen.
Jede zusätzliche Datenbank bedeutet Betrieb, Backup, Monitoring, Rechteprüfung, Datenmodellierung, Synchronisierung, Schnittstellen, Fehlerquellen und Know-how. Für viele mittelständische Unternehmen ist der Engpass nicht zuerst die perfekte Datenbankarchitektur. Der Engpass ist die saubere Struktur des Wissens.
Deshalb ist ein pragmatischer Start oft sinnvoller: PostgreSQL als Kern, Object Storage für Originaldateien, pgvector für erste semantische Suche. Graphfunktionen oder eine separate Graphdatenbank können später ergänzt werden, wenn die Beziehungen wirklich komplex werden.
Das Ziel ist nicht technische Eleganz. Das Ziel ist ein Company Brain, dem Mitarbeiter vertrauen.
Wann reicht PostgreSQL mit pgvector?
PostgreSQL mit pgvector reicht häufig aus, wenn das Company Brain überschaubare Datenmengen, klare Wissensobjekte und moderate Suchlast hat. Das betrifft viele erste Anwendungen im Mittelstand: Onboarding, Kundenservice-Wissen, Angebotsprüfung, interne Richtlinien, Prozesswissen oder Projektübergaben.
Der Vorteil ist die Einfachheit. Kernobjekte, Metadaten, Berechtigungen und Embeddings liegen in einer vertrauten Umgebung. SQL-Abfragen, Filter und semantische Suche lassen sich kombinieren. Das ist besonders wertvoll, weil KI-Suche nicht nur Bedeutung, sondern auch Rechte, Status und Aktualität berücksichtigen muss.
Ein Beispiel: Die Suche findet semantisch passende Wissensobjekte. PostgreSQL filtert vorher oder gleichzeitig nach Rolle, Kunde, Prozess, Gültigkeit und Freigabestatus. Erst danach werden Ergebnisse an ein Sprachmodell gegeben. So wird RAG kontrollierter.
Wann wird eine separate Vektordatenbank sinnvoll?
Eine separate Vektordatenbank wird interessant, wenn Datenmenge, Suchfrequenz oder Retrieval-Komplexität stark wachsen. Beispiele sind sehr große Dokumentbestände, viele parallele Nutzer, hohe Anforderungen an Latenz, komplexes Hybrid Retrieval, Multi-Tenant-Architekturen oder spezialisierte Ranking-Strategien.
Dann können Systeme wie Pinecone, Weaviate, Qdrant, Milvus oder andere Vektorplattformen sinnvoll sein. Die Entscheidung sollte aber nicht aus Modegründen fallen, sondern aus messbaren Anforderungen.
Für den Start eines Company Brain ist die wichtigste Frage: Kann das System relevante, erlaubte und aktuelle Inhalte zuverlässig finden? Wenn PostgreSQL mit pgvector das leistet, ist zusätzliche Infrastruktur nicht automatisch besser.
Wann wird ein Graph sinnvoll?
Ein Graph wird sinnvoll, wenn Beziehungen selbst zum Produktivitätshebel werden.
In einfachen Wissenssystemen reicht es, Dokumente, Quellen und Rollen zu verknüpfen. In komplexeren Company-Brain-Szenarien will man wissen, wie Informationen zusammenhängen. Welche Entscheidung beeinflusst welchen Prozess? Welche Kunden teilen ähnliche Sonderregeln? Welche Projekte nutzen dieselbe technische Architektur? Welche Risiken tauchen in verwandten Kontexten erneut auf? Welche Wissensobjekte stehen in Spannung zueinander?
Solche Fragen sind Graphfragen.
Ein Graph kann besonders nützlich werden, wenn ein Unternehmen viele Kundenprojekte, technische Abhängigkeiten, Produktvarianten, Regelsysteme oder Compliance-Bezüge hat. Dann wird das Company Brain nicht nur Suchsystem, sondern Beziehungsmodell des Unternehmens.
Warum ist Object Storage nicht nur Ablage?
Object Storage wird oft unterschätzt. Dabei ist es für Nachvollziehbarkeit wichtig.
Ein Company Brain sollte Antworten nicht aus dem Nichts erzeugen. Es braucht Quellen. Wenn ein Wissensobjekt auf einem Vertrag, einer Richtlinie, einem Angebot oder einem Projektprotokoll basiert, muss das Original auffindbar bleiben. Nicht jeder Nutzer darf es sehen, aber das System muss den Ursprung kennen.
Object Storage hilft, große Dateien sauber zu halten, während die Datenbank die Logik verwaltet. Die Datenbank weiß, welche Datei zu welchem Wissensobjekt gehört, welche Version gilt, wer Zugriff hat und wann die Quelle geprüft wurde.
So werden Originaldateien nicht zur chaotischen Ablage, sondern Teil einer kontrollierten Wissensarchitektur.
Wie sieht eine sinnvolle Reifegradlogik aus?
Ein guter Weg für mittelständische Unternehmen ist ein stufenweiser Aufbau.
Stufe 1: Strukturierte Kernobjekte in PostgreSQL. Dazu gehören Nutzer, Rollen, Quellen, Wissensobjekte, Prozesse, Kundenbezüge und Status.
Stufe 2: Object Storage für Originaldateien. Dokumente bleiben nachvollziehbar und getrennt von der operativen Logik gespeichert.
Stufe 3: pgvector für semantische Suche. Inhalte können nicht nur nach Stichwort, sondern nach Bedeutung gefunden werden.
Stufe 4: Graphmodell für komplexe Beziehungen. Erst wenn Beziehungsfragen wirklich wichtig werden, lohnt sich dieser zusätzliche Baustein.
Stufe 5: Separate Spezialdatenbanken. Diese werden interessant, wenn Skalierung, Multi-Tenant-Betrieb, hohe Last oder sehr spezielle Suchanforderungen entstehen.
Diese Logik vermeidet Überarchitektur. Sie hält spätere Optionen offen.
Warum ist das Berechtigungskonzept datenbankübergreifend entscheidend?
Sobald mehrere Speicherformen zusammenarbeiten, wird Access Control wichtiger. Es reicht nicht, Rechte nur in PostgreSQL zu pflegen, wenn Vektordatenbank, Graphdatenbank und Object Storage andere Regeln verwenden.
Ein Nutzer darf vielleicht ein Wissensobjekt sehen, aber nicht die Originaldatei. Er darf eine allgemeine Prozessregel sehen, aber nicht die interne Kalkulation. Er darf Kundenservice-Wissen sehen, aber keine Geschäftsführungsnotizen.
Deshalb muss das Berechtigungskonzept als Querschnittslogik entworfen werden. Retrieval darf nur erlaubte Inhalte liefern. Graphabfragen dürfen keine vertraulichen Beziehungen offenlegen. Object Storage darf Originaldateien nur berechtigten Nutzern zeigen.
Eine gute Architektur ist nicht nur schnell. Sie ist kontrollierbar.
Welche Rolle spielen APIs?
Ein Company Brain wird erst richtig nützlich, wenn es nicht nur in einer Oberfläche existiert. CRM, Ticketsystem, Angebotsprozess, Kundenportal und Projektmanagement brauchen Zugriff auf Wissen.
Dafür sind APIs entscheidend. PostgreSQL, Graph, Vektor und Object Storage sind interne Bausteine. Die Anwendungsschicht muss daraus sichere, verständliche und kontrollierte Dienste machen: Suche, Wissensobjekt abrufen, Quelle prüfen, Kundenkontext anzeigen, Entscheidungshistorie anzeigen, ähnliche Fälle finden, Freigabestatus prüfen.
Für Nutzer ist egal, welche Datenbank im Hintergrund arbeitet. Entscheidend ist, dass die Antwort richtig, erlaubt und nachvollziehbar ist.
Welche Datenbank braucht ein Company Brain wirklich?
Ein Company Brain braucht nicht „die eine“ Datenbank. Es braucht eine Architektur, die zum Reifegrad passt.
Für viele mittelständische Unternehmen ist ein relationaler Kern mit PostgreSQL ein sehr guter Start. pgvector kann semantische Suche ergänzen. Object Storage hält Originaldateien nachvollziehbar. Ein Graph wird sinnvoll, wenn Beziehungen zwischen Kunden, Projekten, Regeln und Entscheidungen selbst zum zentralen Nutzen werden.
Die richtige Architektur ist deshalb nicht maximal komplex. Sie ist erweiterbar, sicher und verständlich. Ein gutes Company Brain speichert Wissen nicht nur irgendwo. Es macht Unternehmenswissen strukturiert, durchsuchbar, verknüpft und nutzbar.
Interessante Links
PostgreSQL Documentation – Full Text Search
https://www.postgresql.org/docs/current/textsearch.html
pgvector GitHub Repository
https://github.com/pgvector/pgvector
Neo4j – What is a Graph Database?
https://neo4j.com/developer/graph-database/
Quellen der verwendeten Kennzahlen und technischen Angaben
Stack Overflow – 2025 Developer Survey
https://survey.stackoverflow.co/2025
Stack Overflow – 2025 Developer Survey: Technology
https://survey.stackoverflow.co/2025/technology
PostgreSQL – PostgreSQL 18 Released
https://www.postgresql.org/about/news/postgresql-18-released-3142/
pgvector – Open-source vector similarity search for Postgres
https://github.com/pgvector/pgvector
Neo4j – Graph Intelligence Platform
https://neo4j.com/
FAQ
Was ist die beste Datenbank für ein Company Brain?
Die beste Datenbank hängt vom Reifegrad und Anwendungsfall ab. Für viele mittelständische Unternehmen ist PostgreSQL ein sinnvoller Kern, weil es strukturierte Daten, Metadaten, Rechte und Auswertungen gut abbildet. Semantische Suche kann mit pgvector ergänzt werden. Graphdatenbanken werden interessant, wenn komplexe Beziehungen zentral werden.
Warum reicht eine relationale Datenbank nicht immer aus?
Eine relationale Datenbank ist stark bei klaren Strukturen, Tabellen und Transaktionen. Sie kann auch viele Beziehungen abbilden. Wenn jedoch sehr komplexe, dynamische Netzwerke zwischen Kunden, Projekten, Entscheidungen, Personen und Risiken analysiert werden sollen, kann ein Graphmodell verständlicher und flexibler sein.
Wofür braucht ein Company Brain Vektorsuche?
Vektorsuche hilft, Inhalte nach Bedeutung statt nur nach Stichworten zu finden. Das ist wichtig, wenn Nutzer Fragen natürlich formulieren oder ähnliche Fälle suchen. Beispiele sind frühere Projekte, ähnliche Tickets, passende Richtlinien oder verwandte Wissensobjekte. Vektorsuche ersetzt aber keine Metadaten, Berechtigungen oder Aktualitätsprüfung.
Was ist pgvector?
pgvector ist eine Erweiterung für PostgreSQL, mit der Vektoren gespeichert und nach Ähnlichkeit durchsucht werden können. Dadurch lassen sich Embeddings direkt in PostgreSQL nutzen. Für viele erste Company-Brain-Anwendungen ist das attraktiv, weil strukturierte Daten, Metadaten, Rechte und semantische Suche nah beieinander bleiben.
Wann braucht man eine Graphdatenbank?
Eine Graphdatenbank wird sinnvoll, wenn Beziehungen selbst zum Kernproblem werden. Das ist der Fall, wenn Kunden, Projekte, Prozesse, Entscheidungen, Risiken, Rollen und Wissensobjekte stark miteinander verbunden sind. Ein Graph hilft, Pfade, Abhängigkeiten und indirekte Zusammenhänge besser zu analysieren.
Warum braucht man Object Storage?
Object Storage speichert Originaldateien wie PDFs, Angebote, Anhänge, Bilder, Scans oder Exporte aus Fachsystemen. Die Datenbank verwaltet dazu Metadaten, Rechte, Quellenbezug und Status. So bleiben Originaldokumente nachvollziehbar erhalten, ohne dass große Dateien direkt in Tabellen gespeichert werden müssen.
Sollte ein Mittelständler sofort SQL, Graph und Vektor einsetzen?
Nicht unbedingt. Ein zu komplexer Start erhöht Betriebsaufwand und Fehlerquellen. Sinnvoll ist oft ein stufenweiser Aufbau: PostgreSQL als Kern, Object Storage für Originaldateien, pgvector für semantische Suche und später ein Graph, wenn Beziehungsanalysen wirklich gebraucht werden. Architektur sollte mit dem Nutzen wachsen.
Wie hängen Datenbankarchitektur und DSGVO zusammen?
Die Datenbankarchitektur beeinflusst, ob Berechtigungen, Löschung, Protokollierung und Datenminimierung sauber umgesetzt werden können. Ein Company Brain muss sicherstellen, dass Nutzer nur erlaubte Inhalte sehen. Das gilt für SQL-Daten, Vektorsuche, Graphbeziehungen und Originaldateien gleichermaßen. Sicherheit muss über alle Speicherformen hinweg gelten.

