MÜNCHEN · PRAG · ON-PREMISE-KI-INGENIEURE
KI, die das Gebäude
nie verlässt.
Feinabgestimmte Sprachmodelle auf Ihren GPU-Servern — air-gapped, DSGVO-konform durch Architektur, in Ihrem Eigentum. Für Krankenhäuser, Kanzleien und KI-Anbieter, die an regulierten Deals scheitern.
Im Einsatz in über 10 öffentlichen Krankenhäusern · Rowan Legal · T-Systems · Eurowag
10+
Öffentliche Krankenhäuser mit unserer KI im Produktivbetrieb
0
Externe API-Aufrufe im Air-Gapped-Betrieb
3 Wo.
Schnellste Einführung von Vertrag bis Produktion
100%
Datenhaltung auf Ihrer eigenen Hardware
IM EINSATZ BEI






















WAS WIR GLAUBEN
Cloud-KI ist die falsche Architektur für Ihre Daten.
Wenn es um Patientendaten, M&A-Entwürfe oder behördliche Korrespondenz geht, ist „in die Cloud schicken" keine Beschaffungsentscheidung — es ist eine Haftungsfrage. Jeder API-Aufruf an ein Cloud-LLM hinterlässt Spuren. Jede Abfrage wird zu Trainingsmaterial. Oder zu Beweismitteln vor Gericht. Wir haben die Alternative gebaut: KI, die auf Ihrer Hardware läuft, mit Ihren Daten trainiert, in Ihrem Besitz.
Keine Tokens. Keine Kontingente. Kein Drittanbieter-Zugriff.
Ihre Daten verlassen Ihr Netzwerk nie. Per Architektur.
Sie besitzen das Modell. Die Updates. Die Ergebnisse.
— Krystof Olik, Gründer
FÜR WEN WIR BAUEN
Drei Käufer. Eine Architektur.
Jedes Deployment ist dieselbe These vor einem anderen Regulierer: Das Modell zieht ein, die Daten bleiben.
FÜR KRANKENHÄUSER
Klinische Dokumentation ohne Cloud
Jeder Ambient-Scribe am deutschen Markt schickt Patientenaudio durch eine US-Cloud. Unserer läuft in Ihrem Serverraum und schreibt FHIR-Dokumente in Ihr KIS.
Im Einsatz in 10+ öffentlichen Krankenhäusern · Sprache → FHIR · Medicalc KIS
On-Premise-KI für KrankenhäuserFÜR KANZLEIEN
Air-Gapped-KI für mandatsgeschützte Arbeit
Mandantenakten, M&A-Entwürfe und Prozessstrategie erreichen nie einen Dritten. Agenten laufen in Ihrem Netzwerk — das Berufsgeheimnis bleibt durch Architektur gewahrt.
Rowan Legal betreibt seine Abläufe auf unseren Air-Gapped-Agenten
KI für KanzleienFÜR KI-ANBIETER
Ihr Produkt, on-premise lieferbar
Sie verlieren Deals mit Krankenhäusern, Banken und Behörden an Datenresidenz-Anforderungen. Wir portieren Ihren Stack auf die Hardware Ihres Kunden.
Cloud-zu-On-Prem-Portierung · lokale Inferenz · GPU-Dimensionierung
Deals freischaltenWAS WIR INSTALLIEREN
Vier Systeme. Ein Standort: Ihre Hardware.
Feinabgestimmte Open-Weights-Modelle, lokale Inferenz und Produktivintegrationen in die Systeme, die Sie bereits betreiben.
SPRACHE → DOKUMENTE
Diktat zu strukturierten Dokumenten
Ärzte und Anwälte diktieren; strukturierte Ausgabe landet im führenden System. Sprechertrennung, Fachvokabular, schematreue Ausgabe.
- Olingo Speech
- FHIR / HL7
- OCR — 99,8% Genauigkeit
- Medizinisches & juristisches Vokabular
DOKUMENTE → ANTWORTEN
Wissenssystem über Ihrem Archiv
Jahrzehnte an Verträgen, Akten und Korrespondenz werden zu einem belegten Antwortsystem — mit Quellenangabe bis zum exakten Absatz.
- Lokales RAG
- Vektorsuche
- Quellenzitate
- Integration von Altsystemen
HINTERGRUND-AGENTEN
Air-Gapped-Agenten für den Betrieb
Eingangsklassifizierung, Dokumentenrouting, Compliance-Prüfungen — laufen kontinuierlich in Ihrem Netzwerk, mit vollständigen Audit-Logs.
- Multi-Agent-Orchestrierung
- Lokale Inferenz
- Audit-Logs
- Kein Egress
MODELLE & HARDWARE
Feinabgestimmte Modelle auf dimensionierter Hardware
Wir wählen oder finetunen Open-Weights-Modelle je Domäne und spezifizieren die GPU-Server, auf denen sie laufen. Beides gehört Ihnen.
- Mistral / Llama / Whisper
- Olingo-Modellreihe
- NVIDIA DGX / RTX
- CUDA / ROCm
SO LÄUFT DIE ZUSAMMENARBEIT
Fester Umfang. Festpreis. Nach jeder Phase etwas, das Ihnen gehört.
Drei Phasen. Jede endet mit einem Artefakt in Ihrem Besitz — ein Bauplan, ein laufendes System oder beides.
Souveränitäts-Assessment
9.800 € Festpreis
Wir kartieren Ihre Datenflüsse, dimensionieren die Hardware und entwerfen die Deployment-Architektur.
Bei Beauftragung vollständig auf den Bau angerechnet.
Pilot-Deployment
ab 120.000 €
Ein Anwendungsfall produktiv auf Ihrer Hardware — echte Nutzer, echte Daten, gemessene Ergebnisse.
Festpreisangebot vor Beginn. Hardware zum Einkaufspreis.
Rollout & Managed Service
ab 6.000 € / Monat
Standortweiter Rollout, Integrationen, Modell-Updates, Monitoring und SLA — von uns betrieben, in Ihrem Eigentum.
Keine Token-Kosten. Keine Lizenzen pro Arbeitsplatz.
INSTALLIERTE SYSTEME
Laufende Systeme. Echte Ergebnisse.

Healthcare
On-PremiseOlingo Medical
Voice & documents → FHIR records. Live in 10+ public hospitals across the Czech Republic.

Automotive / Telecommunications
On-PremiseT-Systems Connectivity Platform
Fleet connectivity platform with ML-driven predictive analytics — on T-Systems infrastructure.

Fuel & Telematics
On-PremiseEurowag Legislation Monitor
Multi-jurisdiction legislation monitor — daily traffic-light compliance reports for Eurowag.

Legal
On-PremiseRowanAI
Airgapped AI agent infrastructure running law firm operations at Rowan Legal — no data leaves the building.
FAQ
Fragen, die Käufer wirklich stellen
Das KI-Modell und die gesamte Verarbeitung laufen auf Hardware in Ihrem eigenen Rechenzentrum oder Serverraum. Keine Daten gehen an einen externen Cloud-Dienst. Sie besitzen die Hardware, kontrollieren den Zugriff, und das System kann vollständig air-gapped arbeiten — ganz ohne Internetverbindung.
Unser schnellstes Deployment war in 3 Wochen von Vertrag bis Produktion. Ein typischer Pilot dauert 6–12 Wochen, abhängig von Integrationskomplexität und IT-Bereitschaft.
Festpreis je Phase: ein Souveränitäts-Assessment für 9.800 € (auf den Bau angerechnet), Piloten ab 120.000 €, Managed Service ab 6.000 €/Monat. Es gibt keine tokenbasierten laufenden Kosten — nur Infrastruktur und Support.
Das spezifizieren wir im Assessment. Produktionsreife Inferenz für ein Modell der 70B-Klasse liegt typischerweise zwischen 40.000 € und 190.000 € Hardware, je nach Durchsatz. Wir beschaffen zum Einkaufspreis — oder nutzen GPUs, die Sie bereits besitzen.
Oft umstritten — genau das ist das Problem. Die EU-US-Transferrahmen stehen weiter vor Gericht, und ein Cloud-LLM-Prompt mit Patienten- oder Mandantenfakten ist eine Offenlegung an einen Dritten. On-Premise beseitigt die Frage vollständig: Die Daten verlassen Ihr Netzwerk nie.
Open-Weights-Modelle — Mistral, Llama, Whisper und andere — feinabgestimmt auf Ihre Domäne, plus unsere Olingo-Modellreihe für Healthcare- und Legal-Workloads. Die resultierenden Gewichte gehören Ihnen.
Ihre IT, mit unserem Managed Service dahinter: Monitoring, Modell-Updates (offline geliefert für air-gapped Standorte) und ein Incident-SLA. Die vollständige Übergabe an Ihr Team ist eine Option, keine Geiselverhandlung.
Ja. Wir portieren Cloud-KI-Produkte auf Kundenhardware: Lokale Inferenz ersetzt externe API-Aufrufe, der Stack wird containerisiert, Updates funktionieren air-gapped. Fester Umfang, typischerweise vier bis zehn Wochen.
KONTAKT
Sprechen Sie mit Ingenieuren, nicht mit Vertrieb.
Wir arbeiten mit Organisationen, die ihre KI-Infrastruktur besitzen wollen. 30 Minuten: Wir kartieren Ihre Datenflüsse und schlagen eine Deployment-Architektur vor. Wenn wir nicht passen, sagen wir es Ihnen.
WAS DANN PASSIERT
- 01Wir kartieren Ihre Datenflüsse und bestehenden Systeme.
- 02Wir schlagen eine Deployment-Architektur für Ihre Infrastruktur vor.
- 03Sie gehen mit einem konkreten Plan. Ohne Pitch.
Oder senden Sie eine Frage per E-Mail — wir antworten innerhalb von 48 Stunden.