Zum Hauptinhalt springen
9 – 17 UHR +49 8031 3508270 LUITPOLDSTR. 9, 83022 ROSENHEIM
DE / EN
LLM Google USA

Google Gemma

Google Gemma 4 - Googles intelligenteste Open-Weights Modellfamilie für Self-Hosting und Finetuning. innFactory AI Rosenheim berät zu DSGVO-konformem Gemma-Deployment im DACH-Raum.

Lizenz Gemma Terms of Use
DSGVO-Hosting Verfügbar
Kontext 128k (4B+), 32k (1B/270M) Tokens
Modalität Text, Image, Audio → Text

Versionen

Verfügbare Modellvarianten im Überblick

ModellReleaseEUStärkenSchwächenStatus
Gemma 4 31B Empfohlen
2026
Neues Flaggschiff – basierend auf Gemini 3 Technologie Thinking-Modus für komplexes Reasoning Audio + Vision Multimodal 85.2% MMMLU, 80% LiveCodeBench
Hardware-intensiv
Aktuell
Gemma 4 26B A4B (MoE)
2026
MoE-Architektur: 26B Parameter, nur 4B aktiv Effizient bei starker Leistung Thinking-Modus verfügbar
Aktuell
Gemma 4 E4B
2026
Edge-optimiert Thinking-Modus verfügbar
Begrenzte Kapazität gegenüber größeren Modellen
Aktuell
Gemma 4 E2B
2026
Ultra-kompakt Ideal für Mobile/IoT
Eingeschränkte Leistung bei komplexen Aufgaben
Aktuell
Gemma 3 27B
2025
Bewährt und breit unterstützt Multimodal (Text + Bild) 128K Kontext
Hardware-intensiv Durch Gemma 4 31B überholt
Aktuell
Gemma 3 12B
2025
Gute Balance Multimodal
Aktuell
Gemma 3 4B
2025
Effizient Edge-tauglich
Aktuell
Gemma 3 1B
2025
Sehr kompakt Mobile/Edge
Begrenzte Fähigkeiten Nur Text
Aktuell
Gemma 3 270M
2025
Ultra-kompakt
Nur Text Begrenzte Fähigkeiten
Aktuell
Gemma 2 27B
2024
Bewährt Breite Unterstützung
Aktuell
Gemma 2 9B
2024
Populär Gute Performance/Größe
Aktuell
Gemma 2 2B
2024
Kompakt On-Device
Aktuell

Einsatzbereiche

Typische Anwendungsgebiete für dieses Modell

DSGVO-konforme Self-Hosting Lösungen
Datensensible Anwendungen
Custom Fine-Tuning
Edge und Mobile Deployment
RAG-Systeme
Code-Generierung
Multilinguale Anwendungen
Agentic Workflows
Forschung und Entwicklung

Technische Details

API, Features und Capabilities

API & Verfügbarkeit
Verfügbarkeit Public (Open Weights)
Latenz (TTFT) Abhängig von Hosting
Durchsatz Abhängig von Hardware Tokens/Sek
Features & Capabilities
Tool Use Function Calling Structured Output Vision Reasoning Mode Datei-Upload
Training & Wissen
Wissensstand 2025
Fine-Tuning Verfügbar (LoRA, QLoRA, Full Fine-Tuning, PEFT)
Sprachunterstützung
Beste Qualität Englisch, Deutsch, Französisch, Spanisch, Italienisch
Unterstützt 140+ Sprachen
Beste Qualität in Englisch, gute Qualität in europäischen Sprachen

Hosting & Compliance

DSGVO-konforme Hosting-Optionen und Lizenzierung

DSGVO-konforme Hosting-Optionen
Self-Hosted
Eigene Infrastruktur
Volle Datenkontrolle - empfohlen für sensible Daten
Google Cloud
Frankfurt (europe-west3)
Vertex AI mit EU-Datenresidenz
AWS
Frankfurt (eu-central-1)
SageMaker
Azure
West Europe
Azure ML
Lizenz & Hosting
Lizenz Gemma Terms of Use
Sicherheitsfilter Anpassbar (eigene Verantwortung)
On-Premise Edge-fähig

Benchmarks

Leistungsvergleich mit standardisierten Tests

MMMLU
85.2%
LiveCodeBench v6
80.0%
AIME 2026
89.2%
GPQA Diamond
84.3%
MMMU Pro
76.9%
Arena AI (Text)
1452

innFactory AI Consulting aus Rosenheim berät Unternehmen im DACH-Raum zum DSGVO-konformen Self-Hosting von Google Gemma. Mit Open Weights haben Sie volle Kontrolle über Ihre Daten - keine Information verlässt Ihre Infrastruktur.

Google Gemma - Open Weights von Google

Gemma ist Googles Open-Weights Modellfamilie, entwickelt auf Basis der gleichen Forschung und Technologie wie Gemini. Anders als das proprietäre Gemini können Gemma-Modelle frei heruntergeladen, lokal betrieben und für kommerzielle Zwecke angepasst werden. Mit Gemma 4 hat Google die bisher intelligentesten offenen Modelle veröffentlicht, die auf der Gemini 3 Technologie basieren und maximale Intelligenz pro Parameter bieten.

Gemma 4 - Die neue Generation (2026)

Die Gemma 4 Familie markiert einen erheblichen Leistungssprung gegenüber der Vorgängergeneration. Aufgebaut auf Gemini 3 Forschung, bieten die neuen Modelle erstmals einen integrierten Thinking-Modus für komplexes Reasoning sowie Audio-Verarbeitung als zusätzliche Eingabemodalität.

Wichtigste Neuerungen in Gemma 4

  • Thinking-Modus: Integriertes Reasoning für mathematische, wissenschaftliche und komplexe Aufgaben
  • Audio-Unterstützung: Neben Text und Bild nun auch Audioverarbeitung
  • Agentic Workflows: Optimiert für autonome, mehrstufige Aufgaben
  • MoE-Architektur: Gemma 4 26B A4B nutzt Mixture-of-Experts mit nur 4B aktiven Parametern
  • Edge-Modelle: Gemma 4 E4B und E2B für mobile und eingebettete Anwendungen

Benchmarks: Gemma 4 31B vs. Gemma 3 27B

BenchmarkGemma 4 31B (Thinking)Gemma 3 27B
Arena AI (Text)14521365
MMMLU85.2%67.6%
AIME 202689.2%20.8%
LiveCodeBench v680.0%29.1%
GPQA Diamond84.3%42.4%
MMMU Pro76.9%
τ2-bench (Retail)86.4%6.6%

Die Verbesserungen sind besonders im Bereich Reasoning und Code-Generierung massiv: LiveCodeBench steigt von 29.1% auf 80.0%, AIME 2026 von 20.8% auf 89.2%.

Besondere Stärken

Open Weights mit Google-Qualität

  • Gemini 3 Technologie: Gemma 4 basiert auf der neuesten Google DeepMind Forschung
  • Volle Kontrolle: Modell läuft in Ihrer eigenen Infrastruktur
  • Keine API-Kosten: Nur Hardware-/Cloud-Kosten
  • Anpassbar: Fine-Tuning auf eigene Daten möglich

Multimodale Fähigkeiten (Gemma 4)

  • Text + Bild + Audio: Dreifach-modale Verarbeitung (neu: Audio)
  • 128K Kontext: Lange Dokumente in einem Durchgang
  • Multilingual: Über 140 Sprachen unterstützt
  • Thinking-Modus: Integriertes Reasoning für komplexe Aufgaben

Flexible Deployment-Optionen

  • On-Premise: Eigene Server oder Private Cloud
  • Edge/Mobile: Gemma 4 E2B und E4B für kompakte Geräte
  • Cloud: Vertex AI, AWS, Azure mit eigener Instanz
  • Verfügbar auf: HuggingFace, Ollama, Kaggle, LM Studio, Docker

Spezialisierte Varianten

Neben den Hauptmodellen bietet Google spezialisierte Gemma-Varianten für spezifische Anwendungsfälle:

TranslateGemma (Januar 2026)

  • Verfügbar in: 4B, 12B und 27B Parametern
  • Fokus: State-of-the-art Übersetzungsqualität
  • Einsatz: Mehrsprachige Unternehmenskommunikation, Dokumentenlokalisierung
  • Vorteil: Optimiert für 140+ Sprachen mit besonderer Stärke in europäischen Sprachen

FunctionGemma (Dezember 2025)

  • Modellgröße: 270M Parameter (ultra-kompakt)
  • Fokus: Function Calling und strukturierte Ausgaben
  • Einsatz: API-Integration, Workflow-Automatisierung, Agentic AI
  • Vorteil: Minimaler Ressourcenbedarf bei hoher Präzision

Gemma Scope 2 (Dezember 2025)

  • Typ: Interpretability Suite
  • Zweck: Transparenz und Debugging von Gemma 3 Modellen
  • Nutzen: Nachvollziehbare KI-Entscheidungen für regulierte Branchen
  • DACH-Relevanz: Unterstützt Compliance-Anforderungen

Modellübersicht

Gemma 4 Familie (2026)

ModellParameterArchitekturEmpfohlene HardwareKontext
Gemma 4 31B31BDenseA100 / H100128K
Gemma 4 26B A4B26B (4B aktiv)MoERTX 4090128K
Gemma 4 E4B4BDenseEdge / Mobile128K
Gemma 4 E2B2BDenseEdge / Mobile128K

Gemma 3 Familie (2025)

ModellParameterVRAMEmpfohlene GPUKontext
Gemma 3 27B27B32+ GBA100 / H100128K
Gemma 3 12B12B16+ GBRTX 4090128K
Gemma 3 4B4B8 GBRTX 4070128K
Gemma 3 1B1B2 GBMobile / Edge32K
Gemma 3 270M0.27B1 GBMobile / Edge32K

Gemma 2 Familie (2024)

ModellParameterVRAMEmpfohlene GPUKontext
Gemma 2 27B27B32+ GBA1008K
Gemma 2 9B9B12+ GBRTX 40808K
Gemma 2 2B2B4 GBRTX 30608K

Vergleich: Gemma vs. Gemini vs. Llama

AspektGemma 4Gemini 3.1Llama 4
LizenzOpen WeightsProprietärCommunity License
Self-HostingJaNeinJa
API-KostenKeine (Self-Hosted)Pay-per-UseKeine (Self-Hosted)
MultimodalText + Bild + AudioUmfassendText + Bild
Thinking-ModusJaJaJa
DSGVO Self-HostIdealCloud-abhängigIdeal
Fine-TuningMöglichBegrenztMöglich
Spezialisierte VariantenTranslateGemma, FunctionGemmaEingeschränktKeine

Einsatzgebiete

DSGVO-konforme Unternehmens-KI

  • Sensible Daten bleiben in Ihrer Infrastruktur
  • Keine Datenübertragung an externe Dienste
  • Volle Kontrolle über Logging und Audit
  • Gemma Scope 2 für nachvollziehbare Entscheidungen

Spezialisierte Anwendungen

  • RAG-Systeme: Unternehmenswissen durchsuchbar machen
  • Code-Assistenten: Interne Entwicklertools
  • Kundenservice: Chatbots ohne Datenweitergabe
  • Mehrsprachigkeit: TranslateGemma für internationale Teams
  • Workflow-Automation: FunctionGemma für API-Integration
  • Agentic Workflows: Gemma 4 für autonome, mehrstufige Aufgaben

Edge und Mobile

  • Gemma 4 E2B/E4B: Neue Edge-optimierte Modelle mit Thinking-Modus
  • Gemma 3 1B/4B: Bewährte kompakte Varianten
  • Offline-fähig: Keine Internetverbindung nötig
  • Niedrige Latenz: Lokale Verarbeitung

Verfügbarkeit in der EU

Google Vertex AI (Empfohlen)

  • Region: Frankfurt (europe-west3)
  • Vorteil: Vollständig verwalteter Service mit EU-Datenresidenz
  • DSGVO: Voll konform bei korrekter Konfiguration

Self-Hosted Optionen

  • AWS SageMaker: Frankfurt (eu-central-1)
  • Azure ML: West Europe
  • On-Premise: Eigene Rechenzentren für maximale Kontrolle

Alle Gemma-Modelle können als Open Weights heruntergeladen und in EU-Infrastruktur betrieben werden, was volle Datensouveränität garantiert. Gemma 4 ist zusätzlich über HuggingFace, Ollama, Kaggle, LM Studio und Docker verfügbar.

Integration mit CompanyGPT

Gemma-Modelle können in CompanyGPT als Self-Hosted-Option integriert werden - ideal für Unternehmen, die Google-Qualität mit vollständiger Datenkontrolle kombinieren möchten. Die spezialisierten Varianten wie TranslateGemma eignen sich besonders für mehrsprachige Unternehmensumgebungen.

Unsere Empfehlung

Gemma 4 31B ist die erste Wahl für Unternehmen, die Google-Qualität mit Self-Hosting kombinieren möchten. Mit 85.2% MMMLU, 80% LiveCodeBench und integriertem Thinking-Modus übertrifft es den Vorgänger Gemma 3 27B in allen relevanten Benchmarks deutlich.

Für spezialisierte Anwendungen empfehlen wir:

  • Gemma 4 26B A4B für effizientes Deployment dank MoE-Architektur (nur 4B aktive Parameter)
  • Gemma 4 E4B/E2B für Edge-Anwendungen und ressourcenbegrenzte Umgebungen
  • TranslateGemma für mehrsprachige Unternehmen mit hohen Qualitätsansprüchen
  • FunctionGemma für Workflow-Automatisierung und API-Integrationen

Wir unterstützen Sie bei der Auswahl, dem Deployment und dem Fine-Tuning von Gemma-Modellen in Ihrer Infrastruktur. Mit Gemma Scope 2 bieten wir zusätzlich Transparenz-Analysen für regulierte Branchen an.

Beratung zu diesem Modell?

Wir helfen Ihnen bei der Auswahl und Integration des richtigen KI-Modells für Ihren Anwendungsfall.