Stell dir vor, du sitzt im ICE, wiedermal kein Internet, und kannst trotzdem mit einem KI-Coding-Assistenten arbeiten. Lokal auf deinem Laptop. Kostenlos. Kein Abo, keine Token-Kosten, keine Cloud. Das geht jetzt und es ist verrückt einfach einzurichten.
So gehts: Claude Code + Gemma 4 über Ollama. Claude Code ist das Coding-Tool von Anthropic, normalerweise braucht man dafür ein Abo bzw. API-Credits. Aber man kann das Framework auch mit einem lokalen Modell betreiben. Und genau da kommt Googles brandneues Gemma 4 ins Spiel.

Warum Gemma 4?
Gemma 4 ist Googles neues Open-Source KI-Sprachmodell. Es steht aktuell auf Platz 3 unter den offenen KI-Modellen weltweit und hat die Apache 2.0 Lizenz … das ist wichtig, weil es bedeutet: freie kommerzielle Nutzung, keine schwammigen Einschränkungen. Keine rechtlichen Grauzonen wie bei früheren Google-Lizenzen.
Es gibt vier Modellgrößen je nach Gerät: eine für Smartphones, eine für Laptops (E4B), eine für Workstations (26B) und größere Varianten. Außerdem ist es multimodal, versteht also auch Bilder etc..
Der Haken an der Sache
Zu schön um Wahr zu sein? Jap. Aber. Gemma 4 ist nicht so stark wie Claude Opus 4.7 o.ä.. Das muss man klar sagen. In Benchmarks liegt die Raw Intelligence bei 85,2% vs. 90,5% bei Opus. Bei komplexem Multi-Step-Reasoning, bei Tool Use und bei langen Reasoning-Chains ist Claude besser. Vor allem wenn du die schwächeren Modelle lokal benutzt, also wenn du zum Beispiel nicht an einer Workstation oder einem sehr guten MacBook arbeitest, ist der Unterschied natürlich deutlich spürbar
Aber: Für viele Aufgaben reicht es völlig aus. Und der Deal ist: 0 Euro. Keine Rate Limits. Funktioniert offline. Total privat. Also come on.
Die Idee ist nicht, Claude zu ersetzen sondern Claude z.B. für die schweren Sachen zu nutzen und die Routine-Arbeit lokal laufen zu lassen…
… Beziehungsweise eben überhaupt die Möglichkeit, lokal weiterzuarbeiten, auch ohne Internet und auch ohne Budget. Das ist doch der absolute Wahnsinn.
Setup in 10 Minuten
Das Ganze ist sehr einfach einzurichten. Du solltest Claude Code schon installiert haben. Wenn du Claude als Desktop-Anwendung installiert hast, ist Claude Code schon mitinstalliert. Alternativ geht auch Codex von OpenAI. Eins von beiden ist auf jeden Fall die Voraussetzung, um gleich weiterzumachen.
Hier ist, was du brauchst:
1. Ollama installieren: Geh auf ollama.com und lad die App runter (Mac oder Windows). Installieren & einrichten geht fix.
2. Gemma 4 runterladen: Öffne ein Terminal (cmd auf Windows) und gib ein:
ollama pull gemma4:e4bDas lädt das Modell auf deinen Rechner. Bei der E4B-Variante reichen 8 GB RAM — also quasi jeder aktuelle Laptop.
Kleiner Tipp: Wenn du nicht sicher bist, welche Variante für dein Gerät passt — mach einfach einen Screenshot von deinen System-Specs (z.B. Apfel → Über diesen Mac) und frag Claude oder ChatGPT, welches Modell sie empfehlen würden.
Kurz zur Einordnung: Mein Alltagsgerät ist ein MacBook M2 Max mit 64 Gigabyte. Da funktioniert technisch das 26B‑Modell. Allerdings würde ich die Performance als fragwürdig einschätzen. Das E4B funktioniert natürlich absolut ohne Probleme. Auf meiner Workstation benutze ich das 26B, was auf jeden Fall für Coding deutlich stärker funktioniert, natürlich. Aber hier geht es ja um’s mobil weitermachen.
3. Claude Code damit verbinden: Im Terminal:
ollama launch claude --model gemma4Dann Gemma 4 als Modell auswählen und das war's. Du bist jetzt im Claude Code Framework, aber das Modell läuft lokal. Kein API-Call, keine Token-Kosten.
Kleiner Haken: Du brauchst trotzdem einen Anthropic API Key mit ca. 5–10$ Guthaben auf dem Account, damit der Service authentifiziert. Das Geld wird nicht verbraucht, es muss nur da sein.
Kurz eingeworfen: Du kannst natürlich auch Codex benutzen oder OpenClaw. Auch sehr spannend. Aber ich versuche natürlich, den Beitrag hier kondensiert zu halten.

Wofür ich das nutze
Ehrlich gesagt: Aktuell für die täglichen Routine-Aufgaben. Kleine Scripts, weiter coden ohne Internet, schnelle Prototypen, Dateien verwalten. Alles was kein Big-Brain-Thinking braucht, läuft. Für die komplexen Sachen, Multi-Step-Architekturen, größere Projekte, nehme ich weiterhin Claude über die bezahlte Infrastruktur (API).
Fazit
Das Setup dauert 10 Minuten. Das Modell ist kostenlos. Die Lizenz ist offen. Und du kannst damit sofort anfangen zu arbeiten. Wenn du sowieso schon mit Claude Code oder ähnlichen Tools arbeitest, gibt es keinen Grund, das nicht auszuprobieren. Oder wenn du schon immer starten wolltest, lets go.
Liebe Grüße
Georg
