Sprachmodelle direkt auf dem eigenen Rechner — sensible Daten verlassen die Hardware nicht, kein Cloud-Abo nötig, kostenlos nutzbar.
Ollama lädt Sprachmodelle auf den eigenen Rechner herunter und stellt sie lokal bereit — für eigene Anwendungen und andere Programme. Patientendaten, Rezeptinfos und interne Dokumente bleiben dabei auf der eigenen Hardware.
Ein einziger Befehl im Terminal genügt — Ollama lädt das gewählte Sprachmodell herunter und richtet es ein. Kein Konto, kein API-Key nötig.
Ollama stellt eine lokale API zur Verfügung — andere Programme auf demselben Rechner oder im Netzwerk können das Modell wie einen Cloud-Dienst ansprechen.
Keine Anfrage verlässt den Rechner. Ideal für Apothekenalltag: Patienten-Infos, interne Dokumente und Rezepte lassen sich ohne Datenschutzrisiko verarbeiten.
Ollama ist Open Source und kostenlos. Die meisten Modelle (Llama, Mistral, Gemma, Phi) sind ebenfalls frei verfügbar — kein Abo, keine Nutzungsgebühr pro Anfrage.
Installation über die offizielle Website, ein Terminal-Befehl zum Starten — fertig. Kein Serveraufbau, keine Konfigurationsdatei, keine Programmierkenntnisse nötig.
Nach dem Download funktioniert das Modell ohne Internetverbindung — kein Ausfall durch Cloud-Störungen, keine Latenz durch externe Server.
Ollama übernimmt die Rolle eines lokalen API-Servers: Programme wie Claude Cowork, n8n oder Open WebUI schicken ihre Anfragen an Ollama — genau wie sie es bei Cloud-Modellen tun. Ollama kann zusätzlich als Brücke zu Cloud-Modellen dienen, wenn für bestimmte Aufgaben mehr Rechenleistung gebraucht wird.
| Komponente | Minimum | Empfohlen | Hinweis |
|---|---|---|---|
| Betriebssystem | macOS 11, Windows 10, Linux | macOS 13+, Windows 11 | Ollama läuft auf allen gängigen Systemen |
| RAM | 8 GB | 16 GB oder mehr | Mit 8 GB: kleine Modelle (1–4 B). Mit 16 GB: mittlere Modelle (7–8 B) flüssig nutzbar |
| Speicherplatz | 5 GB frei | 20–50 GB frei | Je nach Modellgröße: Llama 3.2 (3 B) ≈ 2 GB, Llama 3.1 (8 B) ≈ 5 GB |
| Prozessor | Moderner CPU (Intel/AMD/Apple Silicon) | Apple Silicon (M1–M4) oder dedizierte GPU | Apple M-Chips: beste Effizienz für lokale KI |
| GPU (optional) | Nicht zwingend nötig | NVIDIA RTX 3060+ oder Apple M-Chip | GPU beschleunigt die Antwortgeschwindigkeit deutlich |
| Internetverbindung | Nur für Download nötig | — | Nach dem Download: vollständig offline nutzbar |
Praxistipp: Ein aktueller Laptop mit Apple Silicon (MacBook Air M2/M3) oder ein Windows-Rechner mit 16 GB RAM genügen für die meisten Alltagsaufgaben in der Apotheke — Texte zusammenfassen, Dokumente analysieren, Fragen beantworten.
ollama pull llama3.2 eingeben. Ollama lädt das Modell herunter und richtet es ein — dauert je nach Verbindung einige Minuten.
ollama run llama3.2 im Terminal — der Chatbot antwortet sofort, vollständig lokal, ohne Internetverbindung.
ollama launch codex-appollama launch codex-app --restoreDatenschutz-Vorteil: Alle Anfragen an das lokale Modell bleiben auf dem eigenen Rechner — kein Drittanbieter sieht die Daten. Patientennamen, Rezeptinhalte und Beratungsnotizen lassen sich bedenkenlos einsetzen. Lokale KI ist damit eine datenschutzkonforme Grundlage für den Einsatz sensibler Daten in der Apotheke.