Zum Hauptinhalt springen
9 – 17 UHR +49 8031 3508270 LUITPOLDSTR. 9, 83022 ROSENHEIM
DE / EN
LLM Google USA

Google Gemma

Google Gemma - Open-Weights LLM-Familie für Self-Hosting und Finetuning. innFactory AI Rosenheim beratet zu DSGVO-konformem Gemma-Deployment im DACH-Raum.

Lizenz Gemma Terms of Use
DSGVO-Hosting Verfügbar
Kontext 128k (4B+), 32k (1B/270M) Tokens
Modalität Text, Image → Text

Versionen

Verfügbare Modellvarianten im Überblick

ModellReleaseEUStärkenSchwächenStatus
Gemma 3 27B Empfohlen
2025
Aktuelles Flaggschiff Multimodal (Text + Bild) 128K Kontext
Hardware-intensiv
Aktuell
Gemma 3 12B
2025
Gute Balance Multimodal
Aktuell
Gemma 3 4B
2025
Effizient Edge-tauglich
Aktuell
Gemma 3 1B
2025
Sehr kompakt Mobile/Edge
Begrenzte Fähigkeiten Nur Text
Aktuell
Gemma 3 270M
2025
Ultra-kompakt
Nur Text Begrenzte Fähigkeiten
Aktuell
Gemma 2 27B
2024
Bewährt Breite Unterstützung
Aktuell
Gemma 2 9B
2024
Populär Gute Performance/Groesse
Aktuell
Gemma 2 2B
2024
Kompakt On-Device
Aktuell

Einsatzbereiche

Typische Anwendungsgebiete für dieses Modell

DSGVO-konforme Self-Hosting Lösungen
Datensensible Anwendungen
Custom Fine-Tuning
Edge und Mobile Deployment
RAG-Systeme
Code-Generierung
Multilinguale Anwendungen
Forschung und Entwicklung

Technische Details

API, Features und Capabilities

API & Verfügbarkeit
Verfügbarkeit Public (Open Weights)
Latenz (TTFT) Abhängig von Hosting
Durchsatz Abhängig von Hardware Tokens/Sek
Features & Capabilities
Tool Use Function Calling Structured Output Vision Datei-Upload
Training & Wissen
Wissensstand 2024-08
Fine-Tuning Verfügbar (LoRA, QLoRA, Full Fine-Tuning, PEFT)
Sprachunterstützung
Beste Qualität Englisch, Deutsch, Französisch, Spanisch, Italienisch
Unterstützt 140+ Sprachen
Beste Qualität in Englisch, gute Qualität in europaeischen Sprachen

Hosting & Compliance

DSGVO-konforme Hosting-Optionen und Lizenzierung

DSGVO-konforme Hosting-Optionen
Self-Hosted
Eigene Infrastruktur
Volle Datenkontrolle - empfohlen für sensible Daten
Google Cloud
Frankfurt (europe-west3)
Vertex AI mit EU-Datenresidenz
AWS
Frankfurt (eu-central-1)
SageMaker
Azure
West Europe
Azure ML
Lizenz & Hosting
Lizenz Gemma Terms of Use
Sicherheitsfilter Anpassbar (eigene Verantwortung)
On-Premise Edge-fähig

Benchmarks

Leistungsvergleich mit standardisierten Tests

MMLU
76.9%
HumanEval
74.4%

innFactory AI Consulting aus Rosenheim berät Unternehmen im DACH-Raum zum DSGVO-konformen Self-Hosting von Google Gemma. Mit Open Weights haben Sie volle Kontrolle über Ihre Daten - keine Information verlässt Ihre Infrastruktur.

Google Gemma - Open Weights von Google

Gemma ist Googles Open-Weights Modellfamilie, entwickelt auf Basis der gleichen Forschung und Technologie wie Gemini. Anders als das proprietäre Gemini können Gemma-Modelle frei heruntergeladen, lokal betrieben und für kommerzielle Zwecke angepasst werden. Mit regelmäßigen Updates und spezialisierten Varianten hat sich Gemma zu einer der führenden Open-Source-Optionen für Unternehmen entwickelt.

Besondere Stärken

Open Weights mit Google-Qualität

  • Gemini-Technologie: Basiert auf Google DeepMinds Forschung
  • Volle Kontrolle: Modell läuft in Ihrer eigenen Infrastruktur
  • Keine API-Kosten: Nur Hardware-/Cloud-Kosten
  • Anpassbar: Fine-Tuning auf eigene Daten möglich

Multimodale Fähigkeiten (Gemma 3)

  • Text + Bild (ab 4B): Verarbeitung von Bildern und Text
  • 128K Kontext (ab 4B): Lange Dokumente in einem Durchgang
  • Multilingual: Über 140 Sprachen unterstützt
  • Aktuelle Benchmarks: 76.9% MMLU, 74.4% HumanEval (Gemma 3 27B)

Flexible Deployment-Optionen

  • On-Premise: Eigene Server oder Private Cloud
  • Edge/Mobile: Kompakte Varianten (270M, 1B, 2B, 4B)
  • Cloud: Vertex AI, AWS, Azure mit eigener Instanz

Spezialisierte Varianten

Neben den Hauptmodellen bietet Google spezialisierte Gemma-Varianten für spezifische Anwendungsfälle:

TranslateGemma (Januar 2026)

  • Verfügbar in: 4B, 12B und 27B Parametern
  • Fokus: State-of-the-art Übersetzungsqualität
  • Einsatz: Mehrsprachige Unternehmenskommunikation, Dokumentenlokalisierung
  • Vorteil: Optimiert für 140+ Sprachen mit besonderer Stärke in europäischen Sprachen

FunctionGemma (Dezember 2025)

  • Modellgröße: 270M Parameter (ultra-kompakt)
  • Fokus: Function Calling und strukturierte Ausgaben
  • Einsatz: API-Integration, Workflow-Automatisierung, Agentic AI
  • Vorteil: Minimaler Ressourcenbedarf bei hoher Präzision

Gemma Scope 2 (Dezember 2025)

  • Typ: Interpretability Suite
  • Zweck: Transparenz und Debugging von Gemma 3 Modellen
  • Nutzen: Nachvollziehbare KI-Entscheidungen für regulierte Branchen
  • DACH-Relevanz: Unterstützt Compliance-Anforderungen

Modellübersicht

Gemma 3 Familie (2025)

ModellParameterVRAMEmpfohlene GPUKontext
Gemma 3 27B27B32+ GBA100 / H100128K
Gemma 3 12B12B16+ GBRTX 4090128K
Gemma 3 4B4B8 GBRTX 4070128K
Gemma 3 1B1B2 GBMobile / Edge32K
Gemma 3 270M0.27B1 GBMobile / Edge32K

Gemma 2 Familie (2024)

ModellParameterVRAMEmpfohlene GPUKontext
Gemma 2 27B27B32+ GBA1008K
Gemma 2 9B9B12+ GBRTX 40808K
Gemma 2 2B2B4 GBRTX 30608K

Vergleich: Gemma vs. Gemini vs. Llama

AspektGemma 3Gemini 2.0Llama 4
LizenzOpen WeightsProprietärCommunity License
Self-Hosting✅ Ja❌ Nein✅ Ja
API-KostenKeine (Self-Hosted)Pay-per-UseKeine (Self-Hosted)
Multimodal✅ Text + Bild✅ Umfassend✅ Text + Bild
DSGVO Self-Host✅ Ideal⚠️ Cloud-abhängig✅ Ideal
Fine-Tuning✅ Möglich❌ Begrenzt✅ Möglich
Spezialisierte Varianten✅ TranslateGemma, FunctionGemma⚠️ Eingeschränkt❌ Keine

Einsatzgebiete

DSGVO-konforme Unternehmens-KI

  • Sensible Daten bleiben in Ihrer Infrastruktur
  • Keine Datenübertragung an externe Dienste
  • Volle Kontrolle über Logging und Audit
  • Gemma Scope 2 für nachvollziehbare Entscheidungen

Spezialisierte Anwendungen

  • RAG-Systeme: Unternehmenswissen durchsuchbar machen
  • Code-Assistenten: Interne Entwicklertools
  • Kundenservice: Chatbots ohne Datenweitergabe
  • Mehrsprachigkeit: TranslateGemma für internationale Teams
  • Workflow-Automation: FunctionGemma für API-Integration

Edge und Mobile

  • Gemma 3 1B/4B: Für Smartphones und IoT
  • Offline-fähig: Keine Internetverbindung nötig
  • Niedrige Latenz: Lokale Verarbeitung

Verfügbarkeit in der EU

Google Vertex AI (Empfohlen)

  • Region: Frankfurt (europe-west3)
  • Vorteil: Vollständig verwalteter Service mit EU-Datenresidenz
  • DSGVO: Voll konform bei korrekter Konfiguration

Self-Hosted Optionen

  • AWS SageMaker: Frankfurt (eu-central-1)
  • Azure ML: West Europe
  • On-Premise: Eigene Rechenzentren für maximale Kontrolle

Alle Gemma-Modelle können als Open Weights heruntergeladen und in EU-Infrastruktur betrieben werden, was volle Datensouveränität garantiert.

Integration mit CompanyGPT

Gemma-Modelle können in CompanyGPT als Self-Hosted-Option integriert werden - ideal für Unternehmen, die Google-Qualität mit vollständiger Datenkontrolle kombinieren möchten. Die spezialisierten Varianten wie TranslateGemma eignen sich besonders für mehrsprachige Unternehmensumgebungen.

Unsere Empfehlung

Gemma 3 27B ist die erste Wahl für Unternehmen, die Google-Qualität mit Self-Hosting kombinieren möchten. Die aktualisierten Benchmarks (76.9% MMLU, 74.4% HumanEval) bestätigen die Wettbewerbsfähigkeit gegenüber proprietären Alternativen.

Für spezialisierte Anwendungen empfehlen wir:

  • TranslateGemma für mehrsprachige Unternehmen mit hohen Qualitätsansprüchen
  • FunctionGemma für Workflow-Automatisierung und API-Integrationen
  • Gemma 3 4B oder 1B für Edge-Anwendungen und ressourcenbegrenzte Umgebungen

Wir unterstützen Sie bei der Auswahl, dem Deployment und dem Fine-Tuning von Gemma-Modellen in Ihrer Infrastruktur. Mit Gemma Scope 2 bieten wir zusätzlich Transparenz-Analysen für regulierte Branchen an.

Beratung zu diesem Modell?

Wir helfen Ihnen bei der Auswahl und Integration des richtigen KI-Modells für Ihren Anwendungsfall.