MNICHOV · PRAHA · ON-PREMISE AI INŽENÝŘI

AI, která nikdy
neopustí budovu.

Doladěné jazykové modely nasazené na vašich GPU serverech — air-gapped, GDPR v souladu už architekturou, ve vašem vlastnictví. Pro nemocnice, advokátní kanceláře a AI firmy, kterým regulace blokuje zakázky.

V provozu ve více než 10 veřejných nemocnicích · Rowan Legal · T-Systems · Eurowag

10+

Veřejných nemocnic s naší AI v produkčním provozu

0

Externích API volání v air-gapped režimu

3 týd.

Nejrychlejší nasazení od smlouvy do produkce

100%

Data zůstávají na vašem vlastním hardwaru

V PROVOZU U

Fakultní nemocnice PlzeňFakultní nemocnice Hradec KrálovéPenta HospitalsT-SystemsEurowagRowan LegalEUCMedicalcDie NetzwerkpartnerHeggelAnywhere.LegalFakultní nemocnice PlzeňFakultní nemocnice Hradec KrálovéPenta HospitalsT-SystemsEurowagRowan LegalEUCMedicalcDie NetzwerkpartnerHeggelAnywhere.Legal

ČEMU VĚŘÍME

Cloudová AI je pro vaše data špatná architektura.

Když jde o zdravotnické záznamy, M&A dokumenty nebo úřední korespondenci, „poslat do cloudu" není nákupní rozhodnutí — je to právní riziko. Každé volání cloudového LLM zanechává stopu. Každý dotaz se stává tréninkovým materiálem. Nebo důkazem u soudu. Postavili jsme alternativu: AI, která běží na vašem hardwaru, trénovaná na vašich datech, ve vašem vlastnictví.
01

Žádné tokeny. Žádné kvóty. Žádný přístup třetích stran.

02

Vaše data nikdy neopustí vaši síť. Architekturou.

03

Vlastníte model. Vlastníte aktualizace. Vlastníte výsledky.

— Kryštof Olík, zakladatel

CO NASAZUJEME

Čtyři systémy. Jedno místo: váš hardware.

Doladěné open-weights modely, lokální inference a produkční integrace do systémů, které už provozujete.

HLAS → ZÁZNAMY

Diktát do strukturovaných záznamů

Lékaři a advokáti diktují; strukturovaný výstup končí v hlavním systému. Oddělení mluvčích, oborový slovník, výstup věrný schématu.

  • Olingo Speech
  • FHIR / HL7
  • OCR — přesnost 99,8 %
  • Lékařský a právní slovník

DOKUMENTY → ODPOVĚDI

Znalostní systém nad vaším archivem

Desetiletí smluv, spisů a korespondence se stanou systémem doložených odpovědí — s citacemi až na konkrétní odstavec.

  • Lokální RAG
  • Vektorové vyhledávání
  • Citace zdrojů
  • Integrace starších systémů

AGENTI NA POZADÍ

Air-gapped agenti pro provoz

Třídění příchozích případů, směrování dokumentů, compliance kontroly — běží nepřetržitě uvnitř vaší sítě s úplnými audit logy.

  • Orchestrace více agentů
  • Lokální inference
  • Audit logy
  • Nulový egress

MODELY & HARDWARE

Doladěné modely na správně dimenzovaném hardwaru

Vybereme nebo doladíme open-weights modely pro vaši doménu a specifikujeme GPU servery, na kterých poběží. Obojí vlastníte vy.

  • Mistral / Llama / Whisper
  • Modelová řada Olingo
  • NVIDIA DGX / RTX
  • CUDA / ROCm

JAK SPOLUPRÁCE FUNGUJE

Pevný rozsah. Pevná cena. Po každém kroku něco, co vám zůstane.

Tři fáze. Každá končí artefaktem ve vašem vlastnictví — plánem, běžícím systémem, nebo obojím.

012 TÝDNY

Posouzení suverenity

9 800 € fixně

Zmapujeme vaše datové toky, nadimenzujeme hardware a navrhneme architekturu nasazení.

Při pokračování plně započteno do ceny realizace.

026–10 TÝDNŮ

Pilotní nasazení

od 120 000 €

Jeden případ užití v produkci na vašem hardwaru — skuteční uživatelé, skutečná data, měřené výsledky.

Nabídka s pevnou cenou před zahájením. Hardware za nákupní cenu.

03PRŮBĚŽNĚ

Rozšíření & managed service

od 6 000 € / měsíc

Nasazení napříč organizací, integrace, aktualizace modelů, monitoring a SLA — provozujeme my, vlastníte vy.

Žádné platby za tokeny. Žádné licence za uživatele.

Zobrazit celý model spolupráce

FAQ

Otázky, které kupující opravdu pokládají

AI model i veškeré zpracování běží na hardwaru ve vašem vlastním datovém centru nebo serverovně. Žádná data se neposílají do externí cloudové služby. Vlastníte hardware, řídíte přístup a systém může běžet plně air-gapped — úplně bez připojení k internetu.

Naše nejrychlejší nasazení trvalo 3 týdny od smlouvy do produkce. Typický pilot zabere 6–12 týdnů podle složitosti integrace a připravenosti vašeho IT.

Fixně za fázi: posouzení suverenity za 9 800 € (započteno do realizace), piloty od 120 000 €, managed service od 6 000 €/měsíc. Žádné průběžné náklady za tokeny — jen infrastruktura a podpora.

Specifikujeme ho během posouzení. Produkční inference pro model třídy 70B obvykle vyjde na 40 000 € až 190 000 € hardwaru podle propustnosti. Pořizujeme za nákupní cenu, nebo nasadíme na GPU, které už vlastníte.

Často sporné — a právě to je problém. Rámce pro přenos dat mezi EU a USA jsou dál napadány u soudů a prompt do cloudového LLM obsahující fakta pacienta či klienta je zpřístupněním třetí straně. On-premise nasazení otázku úplně odstraní: data vaši síť nikdy neopustí.

Open-weights modely — Mistral, Llama, Whisper a další — doladěné na vaši doménu, plus naši modelovou řadu Olingo pro zdravotnictví a právo. Výsledné váhy vlastníte vy.

Vaše IT s naším managed service v zádech: monitoring, aktualizace modelů (pro air-gapped lokality doručované offline) a incident SLA. Úplné předání vašemu týmu je možnost, ne vyjednávání o rukojmích.

Ano. Portujeme cloudové AI produkty na hardware zákazníka: lokální inference nahradí externí API volání, stack se kontejnerizuje a aktualizace fungují air-gapped. Pevný rozsah, obvykle čtyři až deset týdnů.

KONTAKT

Mluvte s inženýry, ne s obchodem.

Pracujeme s organizacemi připravenými vlastnit svou AI infrastrukturu. 30 minut: zmapujeme vaše datové toky a navrhneme architekturu nasazení. Pokud nejsme správná volba, řekneme vám to.

CO BUDE NÁSLEDOVAT

  1. 01Zmapujeme vaše datové toky a stávající systémy.
  2. 02Navrhneme architekturu nasazení pro vaši infrastrukturu.
  3. 03Odejdete s konkrétním plánem. Bez pitche.
info@ollsoft.com

Nebo pošlete dotaz e-mailem — odpovídáme do 48 hodin.

Vložený kalendář blokován? Otevřít rezervaci přímo