Jan AI: Lokale KI für Windows, Mac und Linux (kostenlos & offline)

Q: Kann ich Jan AI DSGVO‑konform im Unternehmen nutzen?

Ja. Wenn du ein lokales Modell verwendest und keine externe Cloud‑API eingebunden wird, spricht aus Datenschutzsicht nichts dagegen. Ein AVV nach Art. 28 DSGVO ist nicht erforderlich, solange keine Daten an Dritte weitergegeben werden.

Q: Was ist der Unterschied zwischen Jan AI und ChatGPT?

ChatGPT läuft cloudbasiert auf OpenAI‑Servern mit aktuellen Modellen und optionalem Internetzugriff. Jan AI läuft lokal mit Open‑Source‑Modellen. ChatGPT ist insgesamt leistungsfähiger; Jan AI bietet dafür Kostenfreiheit, Datenschutz und Offline‑Nutzung.

Q: Gibt es Jan AI für Android oder iPhone?

Nein. Jan AI ist aktuell nur für Windows, macOS und Linux verfügbar. Mobile Alternativen mit lokalen Modellen sind MLC Chat oder Pocketpal AI, dort jedoch mit eingeschränkter Modellqualität.

Q: Wie viel RAM brauche ich für Jan AI?

Für 3B‑Modelle genügen etwa 8 GB RAM. Für 7B‑Modelle empfehle ich 16 GB. Auf Apple‑Silicon‑Macs teilen sich CPU und GPU den Speicher effizient; auf Windows/Linux ist für GPU‑Beschleunigung separater VRAM notwendig.

Q: Ist Jan AI seriös und sicher?

Ja. Jan AI ist ein etabliertes Open‑Source‑Projekt mit großer Nutzerbasis, aktiver GitHub‑Community und offenem Quellcode. Da alles lokal läuft, gibt es keine serverseitige Datensammlung. Wer sichergehen will, kann den Code prüfen.

Autor:

René LutzZuletzt aktualisiert: 21. Juni 2026Kategorie:

Jan AI ist eine Desktop-App, mit der du leistungsstarke KI-Sprachmodelle vollständig lokal auf deinem Rechner ausführst. Keine Cloud, kein Account, keine Telemetrie. Deine Daten verlassen den eigenen Computer nie.

Dieser Guide zeigt dir alles, was du für den Einstieg brauchst: Installation, Modellauswahl, Hardware-Anforderungen, den Unterschied zu Ollama und was du tun kannst, wenn dein Rechner nur wenig RAM hat.

⚡ Schnellstart: Jan AI in 4 Schritten

Jan AI unter jan.ai kostenlos herunterladen
Installieren und starten (kein Account nötig)
Im Tab „Models“ ein Modell laden (Empfehlung: Llama 3.1 8B Q4_K_M für 16 GB RAM, Llama 3.2 3B für 8 GB RAM)
Chatten, komplett offline

Jan AI Startbildschirm: Sidebar mit Conversations, aktiver Chat und Modell-Auswahlmenü

Jan AI v0.7.9 – der Startbildschirm nach der Installation

Inhaltsverzeichnis

Was ist Jan AI?

Jan AI ist eine Open-Source-Desktop-Anwendung zum lokalen Ausführen von KI-Sprachmodellen (LLMs). Das Projekt wurde von Nguyen Huy Long und dem Team von Menlo Research gegründet und 2023 erstmals veröffentlicht. Der vollständige Quellcode liegt auf GitHub und steht unter der AGPL-3.0-Lizenz kostenlos zur Verfügung. Die Software läuft auf Windows, macOS und Linux und benötigt weder eine Internetverbindung noch ein Nutzerkonto.

Das Besondere an Jan AI gegenüber cloudbasierten Diensten wie ChatGPT ist die vollständige Datenkontrolle. Alle Berechnungen finden lokal statt. Das macht Jan AI interessant für Nutzer, die vertrauliche Dokumente analysieren, ohne diese auf fremde Server zu laden, und für alle, die eine KI ohne monatliche Kosten dauerhaft nutzen möchten.

4 Mio.+

Downloads

v0.7.9

Aktuelle Version

0 €

Kosten (Open Source)

Jan AI unterstützt alle gängigen Open-Source-Modelle im GGUF-Format: Llama 3, Mistral, Qwen, DeepSeek, Gemma und viele weitere. Modelle, die nicht im integrierten Hub sind, lassen sich direkt von Hugging Face herunterladen und importieren. Wer möchte, kann auch externe APIs wie OpenAI, Anthropic oder Groq einbinden. Dann laufen die Anfragen aber wieder über die Cloud.

Was Jan AI nicht kann: Keine Bildgenerierung, keine Websuche in der Basisversion, kein Mobilgerät. Für 70B-Modelle braucht man Profi-Hardware. Als einfacher Cloud-Ersatz für Alltagsaufgaben ist es trotzdem stark.

Jan AI herunterladen und installieren

Die Installation ist auf allen drei Plattformen unkompliziert. Lade die aktuelle Version direkt von jan.ai herunter. Auf der Download-Seite wird automatisch die passende Version für dein Betriebssystem vorgeschlagen.

Windows

Auf jan.ai die .exe-Datei herunterladen
Installer ausführen und den Anweisungen folgen (kein Administratorzugriff nötig)
Jan AI über das Startmenü oder den Desktop-Link öffnen
Im „Model Hub“ ein erstes Modell herunterladen und starten

Jan AI Model Hub: Verfügbare Modelle mit Größenangaben und Download-Button

Der Model Hub in Jan AI zeigt alle verfügbaren Modelle mit Größe und RAM-Bedarf

macOS (inkl. Apple Silicon)

Auf jan.ai die .dmg-Datei herunterladen
DMG öffnen und Jan AI in den Programme-Ordner ziehen
Beim ersten Start unter „Datenschutz und Sicherheit“ bestätigen, falls macOS nachfragt
Jan AI startet und erkennt automatisch Apple Silicon (M1/M2/M3/M4)

Tipp für Apple Silicon: Jan AI nutzt auf M-Chips automatisch das MLX-Backend. Damit laufen Modelle deutlich schneller als auf vergleichbarer Intel-Hardware. Ein M2 MacBook Pro mit 16 GB RAM liefert mit einem 7B-Modell flüssige Antworten.

Linux

Auf jan.ai die .AppImage-Datei herunterladen
Datei ausführbar machen: chmod +x jan-*.AppImage
Starten mit ./jan-*.AppImage
Alternativ: .deb-Paket für Debian/Ubuntu-basierte Systeme verfügbar

Welche Hardware braucht Jan AI?

Jan AI läuft auf fast jedem modernen Rechner. Die Geschwindigkeit hängt jedoch stark davon ab, welches Modell du lädst und ob du eine GPU nutzt. Größere Modelle liefern bessere Ergebnisse, brauchen aber deutlich mehr RAM:

3B–4B Modelle

Min. 4 GB RAM
Empfohlen: 8 GB
Gut auf älteren Laptops
Beispiel: Llama 3.2 3B, Phi-3 Mini

7B–8B Modelle

Min. 8 GB RAM
Empfohlen: 16 GB
Bestes Preis-Leistungs-Verhältnis
Beispiel: Mistral 7B, Llama 3.1 8B

13B+ Modelle

Min. 16 GB RAM
Empfohlen: 32 GB
Nur für leistungsstarke Rechner
Beispiel: Llama 3.1 70B (quantisiert)

CPU oder GPU? Jan AI läuft auf reiner CPU, aber es ist langsam. Bei einem 7B-Modell auf einer normalen CPU kommt man auf etwa 5 bis 15 Token pro Sekunde, was für flüssige Unterhaltungen gerade ausreicht. Mit einer NVIDIA-GPU (CUDA) oder Apple Silicon steigt die Geschwindigkeit auf 30 bis 80 Token pro Sekunde.

Hardware	Geschwindigkeit (7B Modell)	Empfehlung
CPU (modern, 8 Kerne)	5–15 Token/Sek.	Für 3B Modelle okay
Apple Silicon (M2+)	30–60 Token/Sek.	Sehr gut, MLX-Backend
NVIDIA GPU (RTX 3060+)	40–80 Token/Sek.	Beste Performance
NVIDIA GPU (RTX 4090)	80–150 Token/Sek.	Für 70B Modelle geeignet

RAM-Warnung: Wenn das Modell nicht vollständig in den RAM passt, lagert Jan AI Teile in den Systemspeicher aus. Das verlangsamt die App erheblich und kann zu Abstürzen führen. Immer die empfohlene RAM-Größe für das gewählte Modell prüfen.

Welche Modelle laufen gut in Jan AI?

Jan AI bietet im Model Hub Dutzende Modelle zum direkten Download an. Die Qualität unterscheidet sich jedoch erheblich. Hier sind meine Empfehlungen nach Anwendungsfall:

Llama 3.2 3B

Einsteiger

Ideal für schwächere Rechner. Läuft mit 4–8 GB RAM, antwortet schnell. Gut für einfache Texte, Zusammenfassungen und allgemeine Fragen auf Deutsch.

Llama 3.1 8B

Allrounder

Der beste Einstieg für die meisten Nutzer. Gute Deutschkenntnisse, vielseitig einsetzbar. Braucht 8–16 GB RAM, liefert sehr gute Antwortqualität.

Mistral 7B

Schnell

Etwas kleiner als Llama 3.1 8B, aber sehr schnell und effizient. Stark bei strukturierten Aufgaben, Zusammenfassungen und Code. Gutes Deutsch.

Qwen2.5 7B

Mehrsprachig

Alibabas Open-Source-Modell ist besonders stark in mehrsprachigen Kontexten. Sehr gutes Deutsch, empfohlen für Übersetzungen und gemischte Aufgaben.

DeepSeek-R1 7B

Code & Logik

Ausgezeichnet für Programmieraufgaben, mathematische Probleme und strukturiertes Denken. Nicht ideal für kreative Texte, dafür sehr präzise bei Code.

Gemma 2 9B

Google

Googles Open-Source-Modell. Gute Allgemeinleistung, etwas mehr RAM-Bedarf. Empfohlen, wenn andere Modelle bei bestimmten Aufgaben schwächeln.

Meine Empfehlung für den Start: Wer noch nie ein lokales Modell verwendet hat, startet mit Llama 3.1 8B Q4_K_M. Es passt in 8–16 GB RAM, antwortet auf Deutsch gut und ist robust genug für den Alltag. Auf Apple-Silicon-Macs mit 16 GB+ kann man direkt mit Llama 3.1 8B MLX loslegen, das läuft nochmals schneller.

Was bedeuten Q4_K_M und Q8_0? Das ist die Quantisierungsstufe des Modells. Kleinere Werte bedeuten weniger RAM-Bedarf, aber leicht schlechtere Qualität. Höhere Werte sind präziser, aber speicherhungriger. Q4_K_M ist für die meisten Nutzer der beste Kompromiss zwischen Qualität und RAM-Bedarf.

Jan AI vs. Ollama: Was ist der Unterschied?

Ollama ist das bekannteste Alternativsystem für lokale KI-Modelle. Beide Tools erfüllen denselben Grundzweck, sprechen aber unterschiedliche Zielgruppen an.

Kriterium	Jan AI	Ollama
Bedienung	Desktop-App mit grafischer Oberfläche	Terminal / Kommandozeile
Einstiegshürde	Sehr niedrig, kein Terminal nötig	Mittel, Terminal-Kenntnisse hilfreich
Modell-Installation	Ein-Klick im Model Hub	`ollama pull modelname` im Terminal
Lokale API	Ja, OpenAI-kompatibel	Ja, OpenAI-kompatibel
Chat-Interface	Integriert	Nicht enthalten (braucht Open WebUI o.ä.)
Modell-Auswahl	Groß (integrierter Hub)	Sehr groß (Ollama Library)
RAG / Dokumente	Grundlegend integriert	Nur über externe Tools
Ideal für	Einsteiger, tägliche Nutzung	Entwickler, Automatisierung, n8n

Kurz gesagt: Jan AI ist die bessere Wahl, wenn du einfach chatten und Modelle ausprobieren möchtest, ohne viel technisches Vorwissen. Ollama ist besser für Entwickler, die lokale KI in eigene Workflows oder Tools wie n8n integrieren wollen.

Beide Systeme schließen sich nicht aus. Viele Nutzer verwenden Jan AI für den täglichen Chat und Ollama im Hintergrund als API-Server für automatisierte Prozesse.

Jan AI und DSGVO: Lokal bedeutet sicher

Jan AI ist aus Datenschutzsicht die sauberste verfügbare KI-Option. Da alle Berechnungen lokal ablaufen, verlassen keinerlei Eingaben, Gespräche oder Dokumente den eigenen Rechner.

Kein Account erforderlich: Jan AI funktioniert ohne Registrierung oder Login
Keine Telemetrie: Die App sendet standardmäßig keine Nutzungsdaten
Kein Cloud-Transfer: Alle Modellanfragen bleiben auf dem lokalen Gerät
Keine Datenverarbeitung durch Dritte: Volle Kontrolle ohne Auftragsverarbeitungsvertrag nötig
Open Source (AGPL-3.0): Der gesamte Quellcode ist öffentlich einsehbar und prüfbar

Für Unternehmen, die mit sensiblen Kundendaten, Verträgen, PDFs oder internen Dokumenten arbeiten, ist Jan AI daher eine legitime Alternative zu cloudbasierten Diensten. Alle Interaktionen bleiben auf dem eigenen Gerät. Ein formaler Auftragsverarbeitungsvertrag nach Art. 28 DSGVO ist nicht notwendig, da keine Drittpartei die Daten verarbeitet.

Wichtig: Sobald du in Jan AI eine externe API einbindest (OpenAI, Anthropic, Google), verlassen Anfragen den lokalen Rechner. Dann gelten wieder die Datenschutzbedingungen des jeweiligen Anbieters.

Die lokale API in Jan AI nutzen

Jan AI startet automatisch einen lokalen API-Server, der vollständig mit der OpenAI-API kompatibel ist. Das bedeutet: Jedes Tool, das OpenAI unterstützt, kann auch mit Jan AI und einem lokalen Modell verwendet werden.

Der API-Server läuft standardmäßig unter http://localhost:1337/v1. Du kannst ihn direkt über die Einstellungen in Jan AI aktivieren und das Modell wählen.

Jan AI Einstellungen: Lokalen API-Server aktivieren, Port 1337

Jan AI Einstellungen: Lokalen API-Server aktivieren und Port konfigurieren

API per Terminal testen

Ein einfacher curl-Aufruf zum Testen:

curl http://localhost:1337/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "mistral-7b",
    "messages": [{"role": "user", "content": "Hallo, wie geht es dir?"}]
  }'

Die API lässt sich zum Beispiel in n8n als HTTP-Request-Node einbinden, um lokale KI in automatisierte Workflows zu integrieren, ohne externe API-Kosten zu verursachen. Dazu einfach als Basis-URL http://localhost:1337/v1 eintragen und die OpenAI-Credential-Vorlage in n8n verwenden.

MCP-Integration und agentische Funktionen

Jan AI unterstützt das Model Context Protocol (MCP). Damit lassen sich Tools und Datenbankzugriffe direkt an das lokale Modell anbinden. Das Ergebnis sind agentische Workflows, die sonst nur von Cloud-Diensten bekannt sind: Das Modell liest Dateien, fragt externe Systeme ab und arbeitet mehrstufige Aufgaben selbstständig durch, vollständig lokal auf dem eigenen Rechner. Wie du MCP in n8n nutzt, erklärt unser n8n MCP-Server Guide.

Dokumente analysieren und eigene Assistenten erstellen

Neben dem Chat bietet Jan AI zwei Funktionen, die besonders für den beruflichen Einsatz interessant sind.

PDFs und Dokumente lokal analysieren

Jan AI enthält eine RAG-Funktion (Retrieval Augmented Generation), mit der du Dokumente und PDFs direkt in Gespräche einbinden kannst. Das Modell liest das Dokument lokal aus und beantwortet Fragen dazu. Alles bleibt auf dem eigenen Rechner. Praktisch für Anwälte, Steuerberater oder alle, die vertrauliche Unterlagen nicht auf externe Server laden wollen.

Jan AI: PDF-Datei im Chat hochladen und Fragen lokal beantworten lassen

PDFs lassen sich direkt in Jan AI hochladen und lokal auswerten. Hier eine Bedienungsanleitung für einen Geschirrspüler.

Eigene KI-Assistenten mit Systemprompts anlegen

Jan AI erlaubt es, eigene KI-Assistenten mit individuellen Systemprompts anzulegen. Ähnlich wie „Custom GPTs“ in ChatGPT gibst du dem Assistenten einen Namen, eine Rolle und Verhaltensregeln. Ein Assistent für Codereviews, einer für E-Mail-Entwürfe, ein spezialisierter Übersetzer. Die Assistenten sind lokal gespeichert und lassen sich jederzeit wechseln.

Schnellstart-Systemprompt: „Du bist ein erfahrener Texter auf Deutsch. Antworte immer präzise und ohne Füllwörter.“ Dieser einfache Prompt verbessert die Antwortqualität spürbar.

Jan AI auf Android oder iPhone: Geht das?

Nein. Stand Mai 2026 gibt es Jan AI ausschließlich für Desktop-Betriebssysteme: Windows, macOS und Linux. Eine offizielle Android- oder iOS-App existiert nicht, und es gibt keine Roadmap für eine Mobile-Version.

Das ist technisch begründet: Aktuelle Smartphones haben zu wenig RAM und zu schwache NPUs, um 7B-Modelle flüssig auszuführen. Erst ab etwa 8–12 GB Geräte-RAM sind brauchbare Ergebnisse möglich.

Alternativen für Mobile-Geräte:

MLC Chat (Android/iOS): Läuft kleinere Modelle (1B–3B) direkt auf dem Gerät. Kostenlos, Open Source, begrenzte Qualität.
Pocketpal AI (Android): Ähnlich wie MLC Chat, unterstützt GGUF-Modelle, etwas flexibler in der Modellauswahl.
Jan AI über Remote-API: Jan AI auf einem lokalen PC laufen lassen und den API-Server im Heimnetzwerk freigeben. So kann ein Smartphone im WLAN darauf zugreifen.

Tipp: Wer Jan AI unterwegs nutzen möchte, startet es auf dem Heim-PC, gibt den API-Port im Router frei und verbindet sich per VPN mit dem Heimnetzwerk. So läuft die KI auf dem Smartphone, die Rechenarbeit erledigt der PC zuhause.

Häufige Probleme und Lösungen

Jan AI startet nicht oder stürzt sofort ab

Das passiert häufig auf Windows, wenn der GPU-Treiber veraltet ist. NVIDIA-Treiber auf die neueste Version aktualisieren. Alternativ in den Jan AI Einstellungen den CPU-only Modus aktivieren. Auf macOS: Rechtsklick auf Jan.app und „Öffnen“ wählen statt Doppelklick, wenn macOS die Ausführung blockiert.

Modell-Download bricht immer wieder ab

Jan AI speichert teilweise heruntergeladene Dateien. Den Download einfach neu starten, er setzt an der unterbrochenen Stelle fort. Wenn das nicht klappt: im Ordner ~/jan/models/ (Mac/Linux) bzw. C:\Users\[Name]\jan\models\ (Windows) das betreffende Modell-Verzeichnis löschen und neu herunterladen.

Antworten kommen extrem langsam

Das Modell passt wahrscheinlich nicht komplett in den RAM. Eine Stufe kleiner wechseln (z.B. von 7B auf 3B) oder die stärker quantisierte Version des Modells wählen (Q4 statt Q8). Alle anderen RAM-intensiven Programme schließen hilft ebenfalls.

API-Server reagiert nicht

In den Jan AI Einstellungen unter „Local API Server“ prüfen ob der Server aktiv ist. Den Port 1337 in der Firewall freigeben, falls externe Geräte zugreifen sollen. Danach Jan AI neu starten.

Antworten auf Deutsch sind schlecht

Nicht alle Modelle beherrschen Deutsch gleich gut. Wer auf Deutsch schreibt, sollte Llama 3.1 8B, Qwen2.5 7B oder Mistral 7B bevorzugen. Diese Modelle wurden auf mehrsprachigen Datensätzen trainiert. Englischsprachige Nischen-Modelle (z.B. reine Code-Modelle) sind für deutschen Text weniger geeignet.

✓ Vorteile

Vollständig kostenlos und Open Source
Kein Account, keine Telemetrie
Läuft offline, volle Datenkontrolle
Einfache GUI für Einsteiger
Großes Modell-Ökosystem
OpenAI-kompatibler API-Server
Apple Silicon sehr gut unterstützt

✗ Nachteile

Kein Android oder iOS
RAM-intensiv bei größeren Modellen
Lokale Modelle langsamer als Cloud-Dienste
Kein Internetzugriff in der Basisversion
Weniger Funktionen als Open WebUI

Fazit: Für wen lohnt sich Jan AI?

Mein Fazit

Jan AI ist die beste Wahl für Einsteiger, die eine lokale KI ohne technischen Aufwand einrichten wollen. Die grafische Oberfläche, der integrierte Model Hub und die einfache Installation machen den Einstieg deutlich leichter als bei Ollama oder llama.cpp.

Besonders sinnvoll ist Jan AI für Nutzer mit Apple-Silicon-Macs, weil das MLX-Backend dort sehr gute Performance liefert. Datenschutzbewusste Nutzer und Unternehmen mit sensiblen Daten profitieren von der vollständig lokalen Verarbeitung ohne Cloud-Abhängigkeit.

Wer lokale KI in Entwickler-Workflows oder Tools wie n8n integrieren will, greift eher zu Ollama. Und wer einfach die beste Qualität ohne Hardware-Gedanken will, bleibt besser bei ChatGPT Plus oder Claude.

Weiterführende Artikel: n8n mit Ollama verbinden für lokale KI in automatisierten Workflows, einen KI-Agenten in n8n bauen für autonome Prozesse, ChatGPT Alternativen im Vergleich für einen breiteren Überblick.

Häufige Fragen zu Jan AI

Ist Jan AI wirklich kostenlos?

Ja, vollständig. Jan AI ist Open Source unter der AGPL-3.0-Lizenz und kostenlos nutzbar. Es gibt keine Pro‑Version, kein Abo und keine versteckten Kosten. Optional fallen Kosten an, wenn du externe Cloud‑APIs wie OpenAI oder Anthropic einbindest. Das ist freiwillig und nicht nötig für die lokale Nutzung.

Funktioniert Jan AI auf Deutsch?

Ja. Die App ist auf Englisch, aber empfohlene Modelle (Llama 3.1 8B, Mistral 7B, Qwen2.5 7B) beherrschen Deutsch gut. Einfach auf Deutsch schreiben und das Modell antwortet auf Deutsch. Besonders gutes Deutsch liefert Qwen2.5 7B.

Welches Modell soll ich als Anfänger wählen?

Starte mit Llama 3.2 3B (bei < 8 GB RAM) oder Llama 3.1 8B Q4_K_M (bei 8–16 GB RAM). Beide sind gut auf Deutsch, ressourcenschonend und per Klick im Model Hub herunterladbar.

Kann ich Jan AI DSGVO‑konform im Unternehmen nutzen?