ZUSAMMENARBEIT
Was es kostet und wie es abläuft.
Beratungen verstecken Preise, weil ihr Umfang Nebel ist. Unserer ist je Phase fixiert — und jede Phase endet mit etwas, das Sie behalten.
Souveränitäts-Assessment
9.800 € Festpreis
Zwei Wochen in Ihren Datenflüssen, Compliance-Vorgaben und Ihrem Serverraum. Sie erhalten einen Deployment-Bauplan, den IT und Datenschutzbeauftragter beide unterschreiben können — ob Sie mit uns bauen oder nicht.
- Datenfluss-Karte des Ziel-Anwendungsfalls
- GPU-Hardware-Spezifikation mit Beschaffungsoptionen
- Deployment-Architektur (on-premise oder air-gapped)
- Dokumentationspaket für den Datenschutzbeauftragten (DSGVO, Datenresidenz)
- Festpreisangebot für den Piloten
- Ein schriftliches "Bauen Sie das nicht", wenn das die ehrliche Antwort ist
Pilot-Deployment
ab 120.000 €
Eine Abteilung, ein Anwendungsfall, Produktivdaten. Wir installieren die Hardware, finetunen die Modelle, integrieren Ihre Systeme und bringen echte Nutzer darauf. Erfolg wird gemessen, nicht behauptet.
- GPU-Server in Ihrem Rechenzentrum — beschafft zum Einkaufspreis
- Modelle, feinabgestimmt auf Ihren Fachkorpus
- Integration mit Ihrem KIS / DMS / CRM
- Produktiver Rollout an eine Pilotgruppe
- Gemessener Vorher-Nachher-Bericht
- Air-Gapped-Betrieb, wo erforderlich
Rollout & Managed Service
ab 6.000 € / Monat
Standortweiter Rollout und ein Betriebsvertrag: Monitoring, Modell-Updates, neue Anwendungsfälle. Ihre IT betreibt das Tagesgeschäft; wir halten das System auf dem Stand der Technik. Jede Komponente gehört Ihnen.
- Rollout-Plan Abteilung für Abteilung
- Modell-Updates mit Offline-Lieferweg (air-gapped)
- Monitoring, Performance-Tuning, Incident-SLA
- Quartalsweise Modellbewertung gegen neue Open-Weights-Releases
- IT-Schulung und Option auf vollständige Betriebsübergabe
BEDINGUNGEN DER ZUSAMMENARBEIT
Vier Regeln. Sie biegen sich nicht.
Wir sagen früh Nein
Das Assessment kann damit enden, dass wir Ihnen vom Bau abraten. Diese Antwort kostet 9.800 € und spart Ihnen den Rest.
Ihnen gehört alles
Modellgewichte, Quellcode, Hardware, Dokumentation. Nichts ist gemietet, nichts ist Geisel.
Keine Token-Ökonomie
Sie zahlen für Engineering und Support, nicht für Nutzung. Die Grenzkosten Ihrer hunderttausendsten Anfrage sind null.
Nur Senior-Ingenieure
Die Leute, die Ihr System konzipieren, bauen Ihr System. Keine Übergabe an ein Delivery-Team, das Sie nie getroffen haben.
FAQ
Fragen, die Käufer wirklich stellen
Das KI-Modell und die gesamte Verarbeitung laufen auf Hardware in Ihrem eigenen Rechenzentrum oder Serverraum. Keine Daten gehen an einen externen Cloud-Dienst. Sie besitzen die Hardware, kontrollieren den Zugriff, und das System kann vollständig air-gapped arbeiten — ganz ohne Internetverbindung.
Unser schnellstes Deployment war in 3 Wochen von Vertrag bis Produktion. Ein typischer Pilot dauert 6–12 Wochen, abhängig von Integrationskomplexität und IT-Bereitschaft.
Festpreis je Phase: ein Souveränitäts-Assessment für 9.800 € (auf den Bau angerechnet), Piloten ab 120.000 €, Managed Service ab 6.000 €/Monat. Es gibt keine tokenbasierten laufenden Kosten — nur Infrastruktur und Support.
Das spezifizieren wir im Assessment. Produktionsreife Inferenz für ein Modell der 70B-Klasse liegt typischerweise zwischen 40.000 € und 190.000 € Hardware, je nach Durchsatz. Wir beschaffen zum Einkaufspreis — oder nutzen GPUs, die Sie bereits besitzen.
Oft umstritten — genau das ist das Problem. Die EU-US-Transferrahmen stehen weiter vor Gericht, und ein Cloud-LLM-Prompt mit Patienten- oder Mandantenfakten ist eine Offenlegung an einen Dritten. On-Premise beseitigt die Frage vollständig: Die Daten verlassen Ihr Netzwerk nie.
Open-Weights-Modelle — Mistral, Llama, Whisper und andere — feinabgestimmt auf Ihre Domäne, plus unsere Olingo-Modellreihe für Healthcare- und Legal-Workloads. Die resultierenden Gewichte gehören Ihnen.
Ihre IT, mit unserem Managed Service dahinter: Monitoring, Modell-Updates (offline geliefert für air-gapped Standorte) und ein Incident-SLA. Die vollständige Übergabe an Ihr Team ist eine Option, keine Geiselverhandlung.
Ja. Wir portieren Cloud-KI-Produkte auf Kundenhardware: Lokale Inferenz ersetzt externe API-Aufrufe, der Stack wird containerisiert, Updates funktionieren air-gapped. Fester Umfang, typischerweise vier bis zehn Wochen.