Ein Ventagent ist kein einzelner Chat-Prompt, sondern ein Stapel governter Schichten um einen geheimen, geprüften Kern. Jede Antwort ist belegt, jede Aktion auditiert — und sensible Daten verlassen dein Haus nie.
Wer der Agent ist: Fachgebiet, Haltung, Grenzen. Diese Rolle ist das geistige Eigentum hinter dem Facharbeiter — sie bleibt geheim am Kern; der Kunde sieht ausschließlich das Ergebnis.
Jede Antwort ist belegt — aus drei klar getrennten Quellen: dem geprüften Werks-Korpus (eigene fachliche Synthese, schreibgeschützt), dem mandantenisolierten Gedächtnis und deinem eigenen Hausstandard, der mit Vorrang einfließt und ehrlich als „Kundenwissen“ zitiert wird — ohne den geheimen Kern je zu verändern.
Default-deny: der Agent darf nur die Werkzeuge nutzen, die du freischaltest. Wirkung entsteht über einen dünnen Connector direkt an deinem System — die Daten bleiben bei dir, der Connector trägt keinen geheimen Logik-Code.
Optional pro Mandant und Nutzer. Moduliert ausschließlich den Tonfall — niemals Fakten, Methode oder Compliance. Stil ist nie ein Einfallstor für inhaltliche Abweichung.
Die Hülle um jeden einzelnen Lauf: Datenklassen-Routing (souverän), Anonymisierung vor jedem Cloud-Egress, Budget-Metering, lückenloses Audit, Eingangs-Guardrails gegen Prompt-Injection, die Vertrauens-Leiter und die Anti-Halluzinations-Prüfung. Kein Modellaufruf läuft daran vorbei.
Jede Anfrage — egal über welchen Kanal — durchläuft dieselbe Kette. Scheitert eine Stufe (Injektionsversuch, überschrittenes Budget, nicht belegte Aussage), bricht der Lauf sauber ab, statt etwas Falsches auszuliefern.
| Schicht | Wahl | Warum |
|---|---|---|
| Agenten-Runtime | Pydantic AI | modell-agnostisch (kein Lock-in), typsicher, lokal-/Ollama-fähig |
| Sprache | Python 3.14 | reifes KI-Ökosystem, sauberer Fit zur typsicheren Runtime |
| API / Service | FastAPI + Uvicorn | SaaS-tauglich, schnelle Cold-Starts, dünne Fassaden je Kanal |
| Wissen / RAG | PostgreSQL + pgvector | souveräne Vektorsuche in einer DB — keine zweite Datenbank ohne Not |
| Web-Portal | Next.js | serverseitige Auth (BFF), das Token verlässt den Server nie |
| Identität | Zitadel (OIDC) | EU-betreibbar, pro Produkt eigenes Project/Client |
| Modell-Motor | lokales Gemma / BYOK | souverän per Default; eigener Schlüssel ohne Aufschlag; Cloud nur explizit |
Wir bauen einen geheimen, governten Kern und viele dünne Fassaden — keine Graph-Orchestrierung vieler Spezial-Agenten. Pydantic AI ist modell-agnostisch, typsicher und lokal-fähig; eine LangGraph-Topologie würde die Klarheit „ein Kern, viele Fassaden“ aufbrechen und zusätzliche Lock-in- und Komplexitätsfläche schaffen.
Eine Fähigkeit wird genau einmal gebaut und über alle Kanäle (Web, API, MCP) angeboten. Eine Orchestrator-Topologie verteilt Logik und Geheimnis auf viele Knoten — das vergrößert die Angriffs- und Wartungsfläche, statt sie zu bündeln.
PostgreSQL mit pgvector deckt die Vektorsuche souverän in der vorhandenen DB ab. Eine separate Vektor-DB pro Agententyp wäre zusätzliche Betriebs- und Souveränitätsfläche ohne klaren Gewinn.
Souveränität zuerst: sensible und personenbezogene Daten bleiben lokal. Ein Cloud-Modell wird nur auf ausdrücklichen Wunsch und nur nach Anonymisierung genutzt — die Datenklasse entscheidet, nicht die Bequemlichkeit.
Im Primär-Modus arbeitet der Agent über den Connector an deinem System mit deinen Daten — Ventagent sieht und verarbeitet diese Daten gar nicht. Das Modell läuft lokal oder über deinen eigenen Schlüssel; nur governte Steuer- und Audit-Metadaten gehen an den zentralen Kern. Außenwirkung, Zahlungen, Löschungen und rechtlich Verbindliches bleiben auf jeder Vertrauens-Stufe freigabepflichtig.