Zum Hauptinhalt springen
9 – 17 UHR +49 8031 3508270 LUITPOLDSTR. 9, 83022 ROSENHEIM
DE / EN
LLM xAI USA

xAI Grok

Grok von xAI - LLM-Familie mit 2M Token Context. Grok 4.3 (GA seit Mai 2026) und das neue Coding-Modell Grok Build 0.1 sind die aktuellen Modelle. EU-Verfügbarkeit über Azure AI Foundry.

Lizenz Apache 2.0 (nur Grok-1)
DSGVO-Hosting Verfügbar
Kontext 128k - 2M Tokens Tokens
Modalität Text, Image → Text, Image

Versionen

Verfügbare Modellvarianten im Überblick

ModellReleaseEUStärkenSchwächenStatus
Grok Build 0.1
29. Mai 2026
Spezialisiert auf agentisches Coding (Planung, Ausführung, Debugging) 256K Token Context-Fenster Text- und Bild-Input (Diagramme, Mockups, Fehler-Screenshots) Native MCP-Unterstützung Hohe Geschwindigkeit (100+ Tokens/Sekunde) Kosteneffizient: $1 Input / $2 Output pro 1M Tokens
Auf Coding-Aufgaben fokussiert, kein Allzweck-LLM Public Beta auf der xAI API Keine AWS/GCP Verfügbarkeit
Aktuell
Grok 4.3 Empfohlen
Mai 2026 (GA)
Aktuelles Flaggschiff-Modell, General Availability Native multimodale Video-Verarbeitung Custom Skills: persistente Expertise über Konversationen hinweg Code-Execution-Umgebung integriert Wissensstand Dezember 2025 1M Token Context-Fenster
SuperGrok / Premium+ Subscription für vollen Zugriff Keine AWS/GCP Verfügbarkeit
Aktuell
Grok 4.3 Beta
17. April 2026
Beta-Vorlauf zum finalen Grok 4.3 Native multimodale Video-Verarbeitung Generiert PDFs, Spreadsheets, PowerPoint-Decks aus Konversation Wissensstand Dezember 2025
Beta-Status, durch GA-Version abgelöst Keine AWS/GCP Verfügbarkeit
Veraltet
Grok 4.20 Beta
17. Februar 2026
Multi-Agent-Architektur (4 spezialisierte Agenten parallel) Rapid-Learning – wöchentliche Gewichts-Updates Medizinische Dokumentenanalyse via Foto-Upload 2M Token Context-Fenster
Keine AWS/GCP Verfügbarkeit
Aktuell
Grok 4 Heavy
2025
Höchste Qualität für komplexe Aufgaben
Höhere Latenz und Kosten
Aktuell
Grok Code Fast 1
2025
Spezialisiert auf Code-Generierung Schnelle Inferenz
Nur für Code-Aufgaben optimiert
Aktuell
Grok 4.1
November 2025
Bewährte Generation Breites Einsatzspektrum
Verfügbarkeit variiert
Aktuell
Grok 4.1 Thinking
November 2025
Reasoning-Fokus
Höhere Latenz
Aktuell
Grok 4.1 Fast
November 2025
Schnell und kosteneffizient 2M Token Context-Fenster
Weniger Tiefe
Aktuell
Grok 4
Juli 2025
Starkes Allround-Modell
Kleineres Context-Fenster (128K)
Aktuell
Grok 3
Februar 2025
Bewährt
Aktuell
Grok-2
August 2024
Letzte Generation vor Grok 3
Durch Grok 3 und neuer ersetzt
Veraltet
Grok-1 (Open Weights)
März 2024
Open Weights
Veraltet

Einsatzbereiche

Typische Anwendungsgebiete für dieses Modell

Social Media Analyse
Trend-Monitoring
Content-Erstellung
Bildgenerierung
Open-Source Forschung (Grok-1)

Technische Details

API, Features und Capabilities

API & Verfügbarkeit
Verfügbarkeit Public (EU verfügbar)
Features & Capabilities
Tool Use Function Calling Structured Output Vision Web Browsing Datei-Upload
Training & Wissen
Wissensstand 2025-12
Fine-Tuning Nicht verfügbar
Sprachunterstützung
Beste Qualität Englisch
Unterstützt 50+ Sprachen
Beste Qualität in Englisch

Hosting & Compliance

DSGVO-konforme Hosting-Optionen und Lizenzierung

DSGVO-konforme Hosting-Optionen
Azure
West Europe / Germany
Azure AI Foundry
Lizenz & Hosting
Lizenz Apache 2.0 (nur Grok-1)
Sicherheitsfilter Minimal
Enterprise Support Ja
Nur Cloud On-Premise

Benchmarks

Leistungsvergleich mit standardisierten Tests

MMLU
89.5
LiveCodeBench
79.4
SWE-Bench
75
GPQA
88

innFactory AI Consulting aus Rosenheim berät Unternehmen im DACH-Raum zur DSGVO-konformen Integration von xAI Grok. Mit der General Availability von Grok 4.3 (Mai 2026) und dem neuen Coding-spezialisierten Grok Build 0.1 (29. Mai 2026) hat xAI sein Portfolio im Frühsommer 2026 deutlich erweitert.

Neu im Mai/Juni 2026

Grok 4.3 ist jetzt General Availability

Nach dem Beta-Start im April 2026 hat xAI Grok 4.3 Anfang Mai 2026 in den allgemeinen Rollout überführt. Zusätzlich zur multimodalen Video-Verarbeitung und dem 1M Token Context-Fenster bringt die GA-Version:

  • Custom Skills: persistente Expertise (Formatierungsregeln, Workflow-Schritte, Dokumentstile), die Grok über alle Konversationen hinweg automatisch anwendet
  • Integrierte Code-Execution-Umgebung: Grok kann Code schreiben, ausführen, Abhängigkeiten installieren und echte Dateien produzieren

Grok Build 0.1: Dediziertes Coding-Modell

Am 29. Mai 2026 hat xAI Grok Build 0.1 in Public Beta auf der xAI API veröffentlicht. Das Modell ist speziell für agentisches Coding trainiert:

  • 256K Token Context-Fenster
  • Text- und Bild-Input (z. B. UI-Mockups, Architekturdiagramme, Fehler-Screenshots)
  • Native MCP-Unterstützung und Integration mit Cursor, Kilo Code, OpenCode u. a.
  • Inferenzgeschwindigkeit > 100 Tokens/Sekunde
  • Preis: $1 pro 1M Input-Tokens, $2 pro 1M Output-Tokens, Cache-Read $0,20 pro 1M Tokens

Technische Stärken von Grok 4.3

Erweiterte Kontextverarbeitung

Mit einem Context-Fenster von 1 Million Tokens gehört Grok 4.3 zu den leistungsfähigsten Modellen für die Verarbeitung umfangreicher Dokumente. Für Unternehmen bedeutet dies:

  • Vollständige Analyse kompletter Codebases ohne Aufteilung
  • Verarbeitung umfangreicher Verträge und technischer Dokumentationen in einem Durchgang
  • Konsistente Analyse langer Gesprächsverläufe und Protokolle

Benchmark-Ergebnisse

Die aktuellen Leistungstests zeigen starke Ergebnisse:

  • MMLU (Multitask Understanding): 89,5% - auf Augenhöhe mit führenden Modellen
  • LiveCodeBench: 79,4% mit Tool-Use - übertrifft viele etablierte Konkurrenten
  • SWE-Bench (Software Engineering): 75% - führend bei realen Coding-Aufgaben
  • GPQA (Graduate Science): 88% - herausragend bei wissenschaftlichen Fragestellungen

Agentic Capabilities

Grok 4.3 bietet erweiterte Fähigkeiten für autonome Multi-Step-Aufgaben:

  • Reduzierte Halluzinationsrate um 65% gegenüber Vorgängern
  • Verbesserte Generalisierung von Programmierlogik über Sprachgrenzen hinweg
  • Native Integration von Web- und X-Suche für aktuelle Informationen

EU-Verfügbarkeit und DSGVO-Konformität

Azure AI Foundry

Grok 4 und Grok 4.20 Beta sind über Microsoft Azure AI Foundry in EU-Regionen verfügbar, einschließlich Deutschland (West Europe, Germany). Dies ermöglicht DACH-Unternehmen:

  • Datenverarbeitung innerhalb der EU für DSGVO-Konformität
  • Enterprise-Grade Sicherheitsfeatures durch Azure
  • Integration in bestehende Microsoft-Infrastrukturen

Einschränkungen bei Cloud-Anbietern

Wichtig: Grok-Modelle sind derzeit nicht verfügbar auf:

  • AWS Bedrock (einschließlich Frankfurt/eu-central-1)
  • Google Vertex AI (einschließlich Frankfurt/europe-west3)

Dies schränkt die Flexibilität für Unternehmen ein, die bereits stark auf diese Plattformen setzen.

Preisgestaltung

xAI bietet wettbewerbsfähige Preise über die gesamte Modell-Familie hinweg:

Grok 4.3 (Flaggschiff):

  • Input: $1,25 per 1M Tokens
  • Output: $2,50 per 1M Tokens
  • Context-Fenster: 1M Tokens

Grok Build 0.1 (Coding):

  • Input: $1,00 per 1M Tokens
  • Output: $2,00 per 1M Tokens
  • Cache Read: $0,20 per 1M Tokens
  • Context-Fenster: 256K Tokens

Grok 4.1 Fast / Grok 4.20 Beta:

  • Input: $0,20 per 1M Tokens
  • Output: $0,50 per 1M Tokens
  • Context-Fenster: 2M Tokens

Grok 4 (Standard):

  • Input: $3,00 per 1M Tokens
  • Output: $15,00 per 1M Tokens
  • Context-Fenster: 128K Tokens

Tool-Aufrufe:

  • Web/X-Suche, Code Execution: $5 per 1.000 Aufrufe
  • Batch-API: 50% Rabatt für asynchrone Verarbeitung

Einsatzbereiche für DACH-Unternehmen

Technische Analysen

  • Software-Engineering-Aufgaben mit vollständigem Codebase-Verständnis
  • Automatisierte Code-Reviews und Refactoring-Vorschläge
  • Technische Dokumentationsanalyse

Wissenschaftliche Anwendungen

  • Verarbeitung umfangreicher Forschungsdokumente
  • MINT-bezogene Fragestellungen und Berechnungen
  • Graduate-Level wissenschaftliche Analysen

Social Media und Trend-Monitoring

  • Integration mit X/Twitter für Echtzeit-Datenanalysen
  • Content-Erstellung mit aktuellem Kontext
  • Trend-Identifikation und Marktbeobachtung

Kritische Betrachtung

Ethische und praktische Bedenken

Trotz technischer Stärken bestehen bei Grok weiterhin Bedenken:

  • Kontroversen: Verbindung zu Elon Musk und politischen Positionen
  • Minimale Sicherheitsfilter: Kann für regulierte Branchen problematisch sein
  • Plattform-Abhängigkeit: Nur Azure, keine Multi-Cloud-Strategie möglich
  • Wissenstand: Training bis Dezember 2025, danach nur via Web-Suche aktuell

Bessere Alternativen für Unternehmenseinsatz

Für professionelle Anwendungen im DACH-Raum empfehlen wir häufig:

AnwendungAlternative
Allgemeine LLM-AufgabenAnthropic Claude
Code-GenerierungOpenAI GPT-4
Open Source & FlexibilitätMeta Llama oder Qwen
DSGVO-konforme LösungCompanyGPT

Integration mit CompanyGPT

Unsere CompanyGPT-Lösung bietet eine DSGVO-konforme Alternative, die verschiedene Modelle kombiniert und dabei höchste Datenschutzstandards gewährleistet. Für Unternehmen, die auf der sicheren Seite bleiben möchten, ist dies oft die bessere Wahl.

Ausblick

Nach der GA von Grok 4.3 und dem Launch von Grok Build 0.1 Ende Mai 2026 hat Elon Musk angekündigt, dass weitere Modelle (u. a. Grok V9-Medium mit 1,5 Billionen Parametern) bereits trainiert sind und im Verlauf des Sommers 2026 erscheinen sollen. Grok 5 mit angepeilten 6-10 Billionen Parametern auf dem Colossus-2-Supercluster wird laut xAI im Q2/Q3 2026 erwartet.

Unsere Empfehlung

Grok 4.3 ist technisch beeindruckend, besonders durch das 1M-Token-Context-Fenster, Custom Skills und die integrierte Code-Execution. Für spezifische Anwendungsfälle wie umfangreiche Code-Analysen oder wissenschaftliche Recherchen kann das Modell sinnvoll sein. Für reines Coding ist das deutlich günstigere Grok Build 0.1 die bessere Wahl.

Allerdings: Die ethischen Bedenken, minimalen Sicherheitsfilter und die Beschränkung auf Azure machen Grok für viele Unternehmen im regulierten Umfeld zu einer riskanten Wahl. Für geschäftskritische Anwendungen empfehlen wir etablierte Alternativen mit strengeren Governance-Standards.

Für eine individuelle Beratung zur passenden KI-Strategie und DSGVO-konformen Implementierung kontaktieren Sie innFactory AI Consulting.

Kostenkalkulation für dieses Modell

Eine aktuelle Übersicht über Token-Preise, Modellvarianten und EU-Verfügbarkeit finden Sie auf unserem Schwesterprojekt ai-prices.eu. Dort lassen sich die laufenden Betriebskosten für Ihren konkreten Anwendungsfall vergleichen und abschätzen.

Preise auf ai-prices.eu vergleichen

ai-prices.eu ist ein Projekt der innFactory AI Consulting GmbH und hilft bei der transparenten Preisabschätzung führender KI-Modelle.

Beratung zu diesem Modell?

Wir helfen Ihnen bei der Auswahl und Integration des richtigen KI-Modells für Ihren Anwendungsfall.