ZUSAMMENARBEIT

Was es kostet und wie es abläuft.

Beratungen verstecken Preise, weil ihr Umfang Nebel ist. Unserer ist je Phase fixiert — und jede Phase endet mit etwas, das Sie behalten.

012 WOCHEN

Souveränitäts-Assessment

9.800 € Festpreis

Zwei Wochen in Ihren Datenflüssen, Compliance-Vorgaben und Ihrem Serverraum. Sie erhalten einen Deployment-Bauplan, den IT und Datenschutzbeauftragter beide unterschreiben können — ob Sie mit uns bauen oder nicht.

Datenfluss-Karte des Ziel-Anwendungsfalls
GPU-Hardware-Spezifikation mit Beschaffungsoptionen
Deployment-Architektur (on-premise oder air-gapped)
Dokumentationspaket für den Datenschutzbeauftragten (DSGVO, Datenresidenz)
Festpreisangebot für den Piloten
Ein schriftliches "Bauen Sie das nicht", wenn das die ehrliche Antwort ist

026–10 WOCHEN

Pilot-Deployment

ab 120.000 €

Eine Abteilung, ein Anwendungsfall, Produktivdaten. Wir installieren die Hardware, finetunen die Modelle, integrieren Ihre Systeme und bringen echte Nutzer darauf. Erfolg wird gemessen, nicht behauptet.

GPU-Server in Ihrem Rechenzentrum — beschafft zum Einkaufspreis
Modelle, feinabgestimmt auf Ihren Fachkorpus
Integration mit Ihrem KIS / DMS / CRM
Produktiver Rollout an eine Pilotgruppe
Gemessener Vorher-Nachher-Bericht
Air-Gapped-Betrieb, wo erforderlich

03LAUFEND

Rollout & Managed Service

ab 6.000 € / Monat

Standortweiter Rollout und ein Betriebsvertrag: Monitoring, Modell-Updates, neue Anwendungsfälle. Ihre IT betreibt das Tagesgeschäft; wir halten das System auf dem Stand der Technik. Jede Komponente gehört Ihnen.

Rollout-Plan Abteilung für Abteilung
Modell-Updates mit Offline-Lieferweg (air-gapped)
Monitoring, Performance-Tuning, Incident-SLA
Quartalsweise Modellbewertung gegen neue Open-Weights-Releases
IT-Schulung und Option auf vollständige Betriebsübergabe

BEDINGUNGEN DER ZUSAMMENARBEIT

Vier Regeln. Sie biegen sich nicht.

Wir sagen früh Nein

Das Assessment kann damit enden, dass wir Ihnen vom Bau abraten. Diese Antwort kostet 9.800 € und spart Ihnen den Rest.

Ihnen gehört alles

Modellgewichte, Quellcode, Hardware, Dokumentation. Nichts ist gemietet, nichts ist Geisel.

Keine Token-Ökonomie

Sie zahlen für Engineering und Support, nicht für Nutzung. Die Grenzkosten Ihrer hunderttausendsten Anfrage sind null.

Nur Senior-Ingenieure

Die Leute, die Ihr System konzipieren, bauen Ihr System. Keine Übergabe an ein Delivery-Team, das Sie nie getroffen haben.

30-Minuten-Assessment buchen

FAQ

Fragen, die Käufer wirklich stellen

Das KI-Modell und die gesamte Verarbeitung laufen auf Hardware in Ihrem eigenen Rechenzentrum oder Serverraum. Keine Daten gehen an einen externen Cloud-Dienst. Sie besitzen die Hardware, kontrollieren den Zugriff, und das System kann vollständig air-gapped arbeiten — ganz ohne Internetverbindung.

Unser schnellstes Deployment war in 3 Wochen von Vertrag bis Produktion. Ein typischer Pilot dauert 6–12 Wochen, abhängig von Integrationskomplexität und IT-Bereitschaft.

Festpreis je Phase: ein Souveränitäts-Assessment für 9.800 € (auf den Bau angerechnet), Piloten ab 120.000 €, Managed Service ab 6.000 €/Monat. Es gibt keine tokenbasierten laufenden Kosten — nur Infrastruktur und Support.

Das spezifizieren wir im Assessment. Produktionsreife Inferenz für ein Modell der 70B-Klasse liegt typischerweise zwischen 40.000 € und 190.000 € Hardware, je nach Durchsatz. Wir beschaffen zum Einkaufspreis — oder nutzen GPUs, die Sie bereits besitzen.

Oft umstritten — genau das ist das Problem. Die EU-US-Transferrahmen stehen weiter vor Gericht, und ein Cloud-LLM-Prompt mit Patienten- oder Mandantenfakten ist eine Offenlegung an einen Dritten. On-Premise beseitigt die Frage vollständig: Die Daten verlassen Ihr Netzwerk nie.

Open-Weights-Modelle — Mistral, Llama, Whisper und andere — feinabgestimmt auf Ihre Domäne, plus unsere Olingo-Modellreihe für Healthcare- und Legal-Workloads. Die resultierenden Gewichte gehören Ihnen.

Ihre IT, mit unserem Managed Service dahinter: Monitoring, Modell-Updates (offline geliefert für air-gapped Standorte) und ein Incident-SLA. Die vollständige Übergabe an Ihr Team ist eine Option, keine Geiselverhandlung.

Ja. Wir portieren Cloud-KI-Produkte auf Kundenhardware: Lokale Inferenz ersetzt externe API-Aufrufe, der Stack wird containerisiert, Updates funktionieren air-gapped. Fester Umfang, typischerweise vier bis zehn Wochen.