MÜNCHEN · PRAG · ON-PREMISE-KI-INGENIEURE

KI, die das Gebäude
nie verlässt.

Feinabgestimmte Sprachmodelle auf Ihren GPU-Servern — air-gapped, DSGVO-konform durch Architektur, in Ihrem Eigentum. Für Krankenhäuser, Kanzleien und KI-Anbieter, die an regulierten Deals scheitern.

30-Minuten-Assessment buchen Installierte Systeme ansehen

Im Einsatz in über 10 öffentlichen Krankenhäusern · Rowan Legal · T-Systems · Eurowag

10+

Öffentliche Krankenhäuser mit unserer KI im Produktivbetrieb

Externe API-Aufrufe im Air-Gapped-Betrieb

3 Wo.

Schnellste Einführung von Vertrag bis Produktion

100%

Datenhaltung auf Ihrer eigenen Hardware

IM EINSATZ BEI

WAS WIR GLAUBEN

Cloud-KI ist die falsche Architektur für Ihre Daten.

Wenn es um Patientendaten, M&A-Entwürfe oder behördliche Korrespondenz geht, ist „in die Cloud schicken" keine Beschaffungsentscheidung — es ist eine Haftungsfrage. Jeder API-Aufruf an ein Cloud-LLM hinterlässt Spuren. Jede Abfrage wird zu Trainingsmaterial. Oder zu Beweismitteln vor Gericht. Wir haben die Alternative gebaut: KI, die auf Ihrer Hardware läuft, mit Ihren Daten trainiert, in Ihrem Besitz.

Keine Tokens. Keine Kontingente. Kein Drittanbieter-Zugriff.

Ihre Daten verlassen Ihr Netzwerk nie. Per Architektur.

Sie besitzen das Modell. Die Updates. Die Ergebnisse.

— Krystof Olik, Gründer

FÜR WEN WIR BAUEN

Drei Käufer. Eine Architektur.

Jedes Deployment ist dieselbe These vor einem anderen Regulierer: Das Modell zieht ein, die Daten bleiben.

FÜR KRANKENHÄUSER

Klinische Dokumentation ohne Cloud

Jeder Ambient-Scribe am deutschen Markt schickt Patientenaudio durch eine US-Cloud. Unserer läuft in Ihrem Serverraum und schreibt FHIR-Dokumente in Ihr KIS.

Im Einsatz in 10+ öffentlichen Krankenhäusern · Sprache → FHIR · Medicalc KIS

On-Premise-KI für Krankenhäuser

FÜR KANZLEIEN

Air-Gapped-KI für mandatsgeschützte Arbeit

Mandantenakten, M&A-Entwürfe und Prozessstrategie erreichen nie einen Dritten. Agenten laufen in Ihrem Netzwerk — das Berufsgeheimnis bleibt durch Architektur gewahrt.

Rowan Legal betreibt seine Abläufe auf unseren Air-Gapped-Agenten

KI für Kanzleien

FÜR KI-ANBIETER

Ihr Produkt, on-premise lieferbar

Sie verlieren Deals mit Krankenhäusern, Banken und Behörden an Datenresidenz-Anforderungen. Wir portieren Ihren Stack auf die Hardware Ihres Kunden.

Cloud-zu-On-Prem-Portierung · lokale Inferenz · GPU-Dimensionierung

Deals freischalten

WAS WIR INSTALLIEREN

Vier Systeme. Ein Standort: Ihre Hardware.

Feinabgestimmte Open-Weights-Modelle, lokale Inferenz und Produktivintegrationen in die Systeme, die Sie bereits betreiben.

SPRACHE → DOKUMENTE

Diktat zu strukturierten Dokumenten

Ärzte und Anwälte diktieren; strukturierte Ausgabe landet im führenden System. Sprechertrennung, Fachvokabular, schematreue Ausgabe.

Olingo Speech
FHIR / HL7
OCR — 99,8% Genauigkeit
Medizinisches & juristisches Vokabular

DOKUMENTE → ANTWORTEN

Wissenssystem über Ihrem Archiv

Jahrzehnte an Verträgen, Akten und Korrespondenz werden zu einem belegten Antwortsystem — mit Quellenangabe bis zum exakten Absatz.

Lokales RAG
Vektorsuche
Quellenzitate
Integration von Altsystemen

HINTERGRUND-AGENTEN

Air-Gapped-Agenten für den Betrieb

Eingangsklassifizierung, Dokumentenrouting, Compliance-Prüfungen — laufen kontinuierlich in Ihrem Netzwerk, mit vollständigen Audit-Logs.

Multi-Agent-Orchestrierung
Lokale Inferenz
Audit-Logs
Kein Egress

MODELLE & HARDWARE

Feinabgestimmte Modelle auf dimensionierter Hardware

Wir wählen oder finetunen Open-Weights-Modelle je Domäne und spezifizieren die GPU-Server, auf denen sie laufen. Beides gehört Ihnen.

Mistral / Llama / Whisper
Olingo-Modellreihe
NVIDIA DGX / RTX
CUDA / ROCm

SO LÄUFT DIE ZUSAMMENARBEIT

Fester Umfang. Festpreis. Nach jeder Phase etwas, das Ihnen gehört.

Drei Phasen. Jede endet mit einem Artefakt in Ihrem Besitz — ein Bauplan, ein laufendes System oder beides.

012 WOCHEN

Souveränitäts-Assessment

9.800 € Festpreis

Wir kartieren Ihre Datenflüsse, dimensionieren die Hardware und entwerfen die Deployment-Architektur.

Bei Beauftragung vollständig auf den Bau angerechnet.

026–10 WOCHEN

Pilot-Deployment

ab 120.000 €

Ein Anwendungsfall produktiv auf Ihrer Hardware — echte Nutzer, echte Daten, gemessene Ergebnisse.

Festpreisangebot vor Beginn. Hardware zum Einkaufspreis.

03LAUFEND

Rollout & Managed Service

ab 6.000 € / Monat

Standortweiter Rollout, Integrationen, Modell-Updates, Monitoring und SLA — von uns betrieben, in Ihrem Eigentum.

Keine Token-Kosten. Keine Lizenzen pro Arbeitsplatz.

Das vollständige Modell ansehen

INSTALLIERTE SYSTEME

Laufende Systeme. Echte Ergebnisse.

Alle Referenzen ansehen

Healthcare

On-Premise

Olingo Medical

Voice & documents → FHIR records. Live in 10+ public hospitals across the Czech Republic.

Automotive / Telecommunications

On-Premise

T-Systems Connectivity Platform

Fleet connectivity platform with ML-driven predictive analytics — on T-Systems infrastructure.

Fuel & Telematics

On-Premise

Eurowag Legislation Monitor

Multi-jurisdiction legislation monitor — daily traffic-light compliance reports for Eurowag.

Legal

On-Premise

RowanAI

Airgapped AI agent infrastructure running law firm operations at Rowan Legal — no data leaves the building.

FAQ

Fragen, die Käufer wirklich stellen

Das KI-Modell und die gesamte Verarbeitung laufen auf Hardware in Ihrem eigenen Rechenzentrum oder Serverraum. Keine Daten gehen an einen externen Cloud-Dienst. Sie besitzen die Hardware, kontrollieren den Zugriff, und das System kann vollständig air-gapped arbeiten — ganz ohne Internetverbindung.

Unser schnellstes Deployment war in 3 Wochen von Vertrag bis Produktion. Ein typischer Pilot dauert 6–12 Wochen, abhängig von Integrationskomplexität und IT-Bereitschaft.

Festpreis je Phase: ein Souveränitäts-Assessment für 9.800 € (auf den Bau angerechnet), Piloten ab 120.000 €, Managed Service ab 6.000 €/Monat. Es gibt keine tokenbasierten laufenden Kosten — nur Infrastruktur und Support.

Das spezifizieren wir im Assessment. Produktionsreife Inferenz für ein Modell der 70B-Klasse liegt typischerweise zwischen 40.000 € und 190.000 € Hardware, je nach Durchsatz. Wir beschaffen zum Einkaufspreis — oder nutzen GPUs, die Sie bereits besitzen.

Oft umstritten — genau das ist das Problem. Die EU-US-Transferrahmen stehen weiter vor Gericht, und ein Cloud-LLM-Prompt mit Patienten- oder Mandantenfakten ist eine Offenlegung an einen Dritten. On-Premise beseitigt die Frage vollständig: Die Daten verlassen Ihr Netzwerk nie.

Open-Weights-Modelle — Mistral, Llama, Whisper und andere — feinabgestimmt auf Ihre Domäne, plus unsere Olingo-Modellreihe für Healthcare- und Legal-Workloads. Die resultierenden Gewichte gehören Ihnen.

Ihre IT, mit unserem Managed Service dahinter: Monitoring, Modell-Updates (offline geliefert für air-gapped Standorte) und ein Incident-SLA. Die vollständige Übergabe an Ihr Team ist eine Option, keine Geiselverhandlung.

Ja. Wir portieren Cloud-KI-Produkte auf Kundenhardware: Lokale Inferenz ersetzt externe API-Aufrufe, der Stack wird containerisiert, Updates funktionieren air-gapped. Fester Umfang, typischerweise vier bis zehn Wochen.

KONTAKT

Sprechen Sie mit Ingenieuren, nicht mit Vertrieb.

Wir arbeiten mit Organisationen, die ihre KI-Infrastruktur besitzen wollen. 30 Minuten: Wir kartieren Ihre Datenflüsse und schlagen eine Deployment-Architektur vor. Wenn wir nicht passen, sagen wir es Ihnen.

WAS DANN PASSIERT

01Wir kartieren Ihre Datenflüsse und bestehenden Systeme.
02Wir schlagen eine Deployment-Architektur für Ihre Infrastruktur vor.
03Sie gehen mit einem konkreten Plan. Ohne Pitch.

info@ollsoft.com

Oder senden Sie eine Frage per E-Mail — wir antworten innerhalb von 48 Stunden.

.cal-iframe-content{display:none}Wir arbeiten mit Organisationen, die ihre KI-Infrastruktur besitzen wollen. 30 Minuten: Wir kartieren Ihre Datenflüsse und schlagen eine Deployment-Architektur vor. Wenn wir nicht passen, sagen wir es Ihnen. Einbettung blockiert? Buchungsseite direkt öffnen

Einbettung blockiert? Buchungsseite direkt öffnen

KI, die das Gebäudenie verlässt.

Cloud-KI ist die falsche Architektur für Ihre Daten.

Drei Käufer. Eine Architektur.

Klinische Dokumentation ohne Cloud

Air-Gapped-KI für mandatsgeschützte Arbeit

Ihr Produkt, on-premise lieferbar

Vier Systeme. Ein Standort: Ihre Hardware.

Diktat zu strukturierten Dokumenten

Wissenssystem über Ihrem Archiv

Air-Gapped-Agenten für den Betrieb

Feinabgestimmte Modelle auf dimensionierter Hardware

Fester Umfang. Festpreis. Nach jeder Phase etwas, das Ihnen gehört.

Souveränitäts-Assessment

Pilot-Deployment

Rollout & Managed Service

Laufende Systeme. Echte Ergebnisse.

Olingo Medical

T-Systems Connectivity Platform

Eurowag Legislation Monitor

RowanAI

Fragen, die Käufer wirklich stellen

Sprechen Sie mit Ingenieuren, nicht mit Vertrieb.

KI, die das Gebäude
nie verlässt.