MÜNCHEN · PRAG · ON-PREMISE-KI-INGENIEURE

KI, die das Gebäude
nie verlässt.

Feinabgestimmte Sprachmodelle auf Ihren GPU-Servern — air-gapped, DSGVO-konform durch Architektur, in Ihrem Eigentum. Für Krankenhäuser, Kanzleien und KI-Anbieter, die an regulierten Deals scheitern.

Im Einsatz in über 10 öffentlichen Krankenhäusern · Rowan Legal · T-Systems · Eurowag

10+

Öffentliche Krankenhäuser mit unserer KI im Produktivbetrieb

0

Externe API-Aufrufe im Air-Gapped-Betrieb

3 Wo.

Schnellste Einführung von Vertrag bis Produktion

100%

Datenhaltung auf Ihrer eigenen Hardware

IM EINSATZ BEI

Fakultní nemocnice PlzeňFakultní nemocnice Hradec KrálovéPenta HospitalsT-SystemsEurowagRowan LegalEUCMedicalcDie NetzwerkpartnerHeggelAnywhere.LegalFakultní nemocnice PlzeňFakultní nemocnice Hradec KrálovéPenta HospitalsT-SystemsEurowagRowan LegalEUCMedicalcDie NetzwerkpartnerHeggelAnywhere.Legal

WAS WIR GLAUBEN

Cloud-KI ist die falsche Architektur für Ihre Daten.

Wenn es um Patientendaten, M&A-Entwürfe oder behördliche Korrespondenz geht, ist „in die Cloud schicken" keine Beschaffungsentscheidung — es ist eine Haftungsfrage. Jeder API-Aufruf an ein Cloud-LLM hinterlässt Spuren. Jede Abfrage wird zu Trainingsmaterial. Oder zu Beweismitteln vor Gericht. Wir haben die Alternative gebaut: KI, die auf Ihrer Hardware läuft, mit Ihren Daten trainiert, in Ihrem Besitz.
01

Keine Tokens. Keine Kontingente. Kein Drittanbieter-Zugriff.

02

Ihre Daten verlassen Ihr Netzwerk nie. Per Architektur.

03

Sie besitzen das Modell. Die Updates. Die Ergebnisse.

— Krystof Olik, Gründer

WAS WIR INSTALLIEREN

Vier Systeme. Ein Standort: Ihre Hardware.

Feinabgestimmte Open-Weights-Modelle, lokale Inferenz und Produktivintegrationen in die Systeme, die Sie bereits betreiben.

SPRACHE → DOKUMENTE

Diktat zu strukturierten Dokumenten

Ärzte und Anwälte diktieren; strukturierte Ausgabe landet im führenden System. Sprechertrennung, Fachvokabular, schematreue Ausgabe.

  • Olingo Speech
  • FHIR / HL7
  • OCR — 99,8% Genauigkeit
  • Medizinisches & juristisches Vokabular

DOKUMENTE → ANTWORTEN

Wissenssystem über Ihrem Archiv

Jahrzehnte an Verträgen, Akten und Korrespondenz werden zu einem belegten Antwortsystem — mit Quellenangabe bis zum exakten Absatz.

  • Lokales RAG
  • Vektorsuche
  • Quellenzitate
  • Integration von Altsystemen

HINTERGRUND-AGENTEN

Air-Gapped-Agenten für den Betrieb

Eingangsklassifizierung, Dokumentenrouting, Compliance-Prüfungen — laufen kontinuierlich in Ihrem Netzwerk, mit vollständigen Audit-Logs.

  • Multi-Agent-Orchestrierung
  • Lokale Inferenz
  • Audit-Logs
  • Kein Egress

MODELLE & HARDWARE

Feinabgestimmte Modelle auf dimensionierter Hardware

Wir wählen oder finetunen Open-Weights-Modelle je Domäne und spezifizieren die GPU-Server, auf denen sie laufen. Beides gehört Ihnen.

  • Mistral / Llama / Whisper
  • Olingo-Modellreihe
  • NVIDIA DGX / RTX
  • CUDA / ROCm

SO LÄUFT DIE ZUSAMMENARBEIT

Fester Umfang. Festpreis. Nach jeder Phase etwas, das Ihnen gehört.

Drei Phasen. Jede endet mit einem Artefakt in Ihrem Besitz — ein Bauplan, ein laufendes System oder beides.

012 WOCHEN

Souveränitäts-Assessment

9.800 € Festpreis

Wir kartieren Ihre Datenflüsse, dimensionieren die Hardware und entwerfen die Deployment-Architektur.

Bei Beauftragung vollständig auf den Bau angerechnet.

026–10 WOCHEN

Pilot-Deployment

ab 120.000 €

Ein Anwendungsfall produktiv auf Ihrer Hardware — echte Nutzer, echte Daten, gemessene Ergebnisse.

Festpreisangebot vor Beginn. Hardware zum Einkaufspreis.

03LAUFEND

Rollout & Managed Service

ab 6.000 € / Monat

Standortweiter Rollout, Integrationen, Modell-Updates, Monitoring und SLA — von uns betrieben, in Ihrem Eigentum.

Keine Token-Kosten. Keine Lizenzen pro Arbeitsplatz.

Das vollständige Modell ansehen

FAQ

Fragen, die Käufer wirklich stellen

Das KI-Modell und die gesamte Verarbeitung laufen auf Hardware in Ihrem eigenen Rechenzentrum oder Serverraum. Keine Daten gehen an einen externen Cloud-Dienst. Sie besitzen die Hardware, kontrollieren den Zugriff, und das System kann vollständig air-gapped arbeiten — ganz ohne Internetverbindung.

Unser schnellstes Deployment war in 3 Wochen von Vertrag bis Produktion. Ein typischer Pilot dauert 6–12 Wochen, abhängig von Integrationskomplexität und IT-Bereitschaft.

Festpreis je Phase: ein Souveränitäts-Assessment für 9.800 € (auf den Bau angerechnet), Piloten ab 120.000 €, Managed Service ab 6.000 €/Monat. Es gibt keine tokenbasierten laufenden Kosten — nur Infrastruktur und Support.

Das spezifizieren wir im Assessment. Produktionsreife Inferenz für ein Modell der 70B-Klasse liegt typischerweise zwischen 40.000 € und 190.000 € Hardware, je nach Durchsatz. Wir beschaffen zum Einkaufspreis — oder nutzen GPUs, die Sie bereits besitzen.

Oft umstritten — genau das ist das Problem. Die EU-US-Transferrahmen stehen weiter vor Gericht, und ein Cloud-LLM-Prompt mit Patienten- oder Mandantenfakten ist eine Offenlegung an einen Dritten. On-Premise beseitigt die Frage vollständig: Die Daten verlassen Ihr Netzwerk nie.

Open-Weights-Modelle — Mistral, Llama, Whisper und andere — feinabgestimmt auf Ihre Domäne, plus unsere Olingo-Modellreihe für Healthcare- und Legal-Workloads. Die resultierenden Gewichte gehören Ihnen.

Ihre IT, mit unserem Managed Service dahinter: Monitoring, Modell-Updates (offline geliefert für air-gapped Standorte) und ein Incident-SLA. Die vollständige Übergabe an Ihr Team ist eine Option, keine Geiselverhandlung.

Ja. Wir portieren Cloud-KI-Produkte auf Kundenhardware: Lokale Inferenz ersetzt externe API-Aufrufe, der Stack wird containerisiert, Updates funktionieren air-gapped. Fester Umfang, typischerweise vier bis zehn Wochen.

KONTAKT

Sprechen Sie mit Ingenieuren, nicht mit Vertrieb.

Wir arbeiten mit Organisationen, die ihre KI-Infrastruktur besitzen wollen. 30 Minuten: Wir kartieren Ihre Datenflüsse und schlagen eine Deployment-Architektur vor. Wenn wir nicht passen, sagen wir es Ihnen.

WAS DANN PASSIERT

  1. 01Wir kartieren Ihre Datenflüsse und bestehenden Systeme.
  2. 02Wir schlagen eine Deployment-Architektur für Ihre Infrastruktur vor.
  3. 03Sie gehen mit einem konkreten Plan. Ohne Pitch.
info@ollsoft.com

Oder senden Sie eine Frage per E-Mail — wir antworten innerhalb von 48 Stunden.

Einbettung blockiert? Buchungsseite direkt öffnen