Open-Source · On-Premise · Schweiz

    Ollama für Unternehmen
    KI lokal. Daten souverän.

    CNEXT implementiert Ollama für Schweizer Unternehmen: Open-Source-Sprachmodelle sicher auf Ihrer eigenen Infrastruktur betreiben – ohne Cloud-Abhängigkeit, ohne Token-Kosten, vollständig nDSG-konform.

    Warum Ollama?

    Ollama macht den Betrieb grosser Sprachmodelle so einfach wie einen Paketmanager – und das vollständig lokal.

    100% On-Premise

    Ihre Daten verlassen nie Ihre Infrastruktur. Volle Kontrolle, kein Cloud-Risiko.

    Offene Modelle

    Llama 3, Mistral, Phi-3, Qwen, Gemma und viele weitere – frei wählbar.

    Schnelle Inferenz

    Optimiert für CPU und GPU. Lokal schneller als viele Cloud-APIs bei kleinen Modellen.

    nDSG-konform

    Schweizer Datenschutzgesetz einhalten – ohne Cloud-Verarbeitung personenbezogener Daten.

    Technische Fähigkeiten

    Was Ollama kann

    Von der Modell-Bibliothek über OpenAI-kompatible APIs bis zum flexiblen Deployment – Ollama bietet eine vollständige lokale KI-Plattform.

    Lokale Modell-Bibliothek

    Ollama verwaltet Open-Weight-Modelle wie ein Paketmanager: einfaches Pull, Run und Update.

    • Llama 3.1 / 3.3 (8B, 70B)
    • Mistral / Mixtral
    • Phi-4, Qwen 2.5, Gemma 3
    • Code-Modelle: DeepSeek-Coder, CodeLlama

    OpenAI-kompatible API

    Ollama spricht dasselbe API-Format wie OpenAI – bestehende Anwendungen ohne Codeänderung umleiten.

    • Drop-in-Ersatz für OpenAI SDK
    • Chat-Completions-Endpoint
    • Embeddings-Endpoint
    • Streaming-Support

    Flexible Deployment-Optionen

    Von einem einzelnen Server bis hin zu einem Cluster – Ollama lässt sich an Ihre Infrastruktur anpassen.

    • On-Premise (eigene Server)
    • Private Cloud (Azure / Schweizer Rechenzentrum)
    • GPU-Server für grosse Modelle
    • Raspberry Pi / Edge-Devices für kleine Modelle
    Vorteile gegenüber Cloud-KI

    Ollama vs. Cloud-LLMs

    Für datenschutzkritische Szenarien, hohe Volumen oder regulierte Branchen bietet Ollama entscheidende Vorteile gegenüber Cloud-Modellen.

    Datensouveränität

    • Kein Datenabfluss in US-Cloud
    • Erfüllt nDSG und branchenspezifische Anforderungen
    • Ideal für Gesundheitswesen, Banken, Behörden
    • Betrieb im Schweizer Rechenzentrum möglich

    Kosteneffizienz

    • Keine Token-Kosten bei hohem Volumen
    • Einmalige Hardware-Investition statt laufender API-Gebühren
    • Kleinere Modelle laufen auch auf Standard-Hardware
    • Kein Vendor-Lock-in

    Anpassbarkeit

    • Fine-Tuning auf eigenen Daten
    • Custom System-Prompts (Modelfiles)
    • Integration mit eigenen Vektordatenbanken
    • Open-Source – volle Transparenz

    Anwendungsfälle in der Schweiz

    Branchen mit hohen Datenschutzanforderungen profitieren besonders von lokaler KI.

    Gesundheitswesen & Kliniken

    Patientendaten dürfen Ihre Server nie verlassen. Mit Ollama betreiben Schweizer Spitäler KI-Assistenten für Dokumentation, Codierung und Recherche – vollständig lokal.

    KI-gestützte Arztbriefe lokal
    ICD-Codierungs-Assistent
    Medizinische Literaturrecherche offline
    Keine Daten an US-Cloud

    Banken & Versicherungen

    Finanzinstitute mit strengen Compliance-Anforderungen profitieren von lokaler KI ohne externe Datenverarbeitung.

    Vertragsprüfung und -zusammenfassung
    Risiko-Dokumentation lokal
    Kunden-E-Mail-Drafts intern
    Regulator-konform (FINMA)

    Industrie & KMU

    Produktions- und Fertigungsunternehmen nutzen lokale Modelle für technische Dokumentation, Fehleranalyse und interne Wissensdatenbanken.

    Technische Handbücher durchsuchen
    Fehleranalyse und Troubleshooting
    Interne Wissens-Chatbots
    Offline-fähig im Produktionsumfeld

    Behörden & öffentliche Verwaltung

    Bundesnahe Stellen und Kantone, die KI einsetzen wollen, ohne Daten ins Ausland zu schicken – Ollama ist die souveräne Lösung.

    KI-Assistent für interne Dokumente
    Keine US-Cloud-Abhängigkeit
    Open-Source-Transparenz
    Betrieb auf Bundes-Infrastruktur
    CNEXT Leistungen

    Was CNEXT für Sie umsetzt

    Von der ersten Installation bis zum produktiven Betrieb – CNEXT begleitet Sie auf dem gesamten Weg.

    Ollama-Setup & Deployment

    Installation, Konfiguration und Modell-Auswahl – produktionsbereit in wenigen Tagen.

    • Hardware-Sizing (CPU vs. GPU)
    • Modell-Evaluation und -Auswahl
    • API-Konfiguration und Sicherheits-Setup
    • Monitoring & Alerting

    RAG mit lokalen Modellen

    Semantische Suche und Dokumenten-Chat über Ihre internen Wissensdatenbanken – komplett lokal.

    • SharePoint-Inhalte als Wissensbasis
    • Lokale Vektordatenbank (Qdrant, Chroma)
    • Embeddings-Modell lokal betreiben
    • Hybrid-Suche (Keyword + Vektor)

    App-Integration

    Bestehende Microsoft-365-Anwendungen per Drop-in auf lokale Modelle umstellen.

    • Power Automate → Ollama-Endpunkt
    • SharePoint-Bot mit lokalem LLM
    • Custom Chat-Interface (Open WebUI)
    • OpenAI-SDK Drop-in

    Fine-Tuning & Modelfiles

    Modelle mit Ihrer Unternehmenssprache und Ihrem Kontext anpassen.

    • Erstellung von Modelfiles (System-Prompts)
    • LoRA-Fine-Tuning auf eigenen Daten
    • GGUF-Konvertierung eigener Modelle
    • Benchmark-Tests vor Produktions-Release

    Training & Enablement

    Ihr Team lernt, wie es lokale KI-Modelle effektiv nutzt und betreibt.

    • Prompting-Workshops für lokale Modelle
    • Technisches Deep-Dive für IT-Teams
    • Best-Practices für Modell-Auswahl
    • Hands-on-Labs mit eigener Infrastruktur

    Strategische Beratung

    Wann lohnt sich On-Premise KI – und wann ist Cloud die bessere Wahl? CNEXT hilft Ihnen entscheiden.

    • TCO-Analyse (On-Premise vs. Cloud)
    • Modell-Roadmap für Ihr Unternehmen
    • Compliance-Check für regulierte Branchen
    • Hybrid-Strategie (lokal + Azure)

    Lokale KI in Zahlen

    Warum immer mehr Schweizer Unternehmen auf On-Premise-KI setzen.

    100%
    Datenkontrolle
    Alle Daten bleiben auf Ihrer Infrastruktur
    0 CHF
    Token-Kosten
    Keine laufenden API-Gebühren pro Anfrage
    70+
    Open-Source-Modelle
    Sofort verfügbar in der Ollama-Bibliothek
    CH
    Datenresidenz
    Betrieb im Schweizer Rechenzentrum möglich

    Bereit für lokale KI?

    CNEXT analysiert Ihren Use Case und zeigt Ihnen, ob und wie Ollama in Ihrer Umgebung den grössten Mehrwert bringt.