Zum Hauptinhalt springen
9 – 17 UHR +49 8031 3508270 LUITPOLDSTR. 9, 83022 ROSENHEIM
DE / EN
LLM Google USA

Google Gemini

Google Gemini via Vertex AI (Gemini Enterprise Agent Platform) nutzen. Gemini 3.5 Flash (19. Mai 2026, Google I/O) ist global GA und über den EU-Multi-Region-Endpoint DSGVO-konform innerhalb der EU-Geografie nutzbar. Gemini 3.5 Pro ist in limitierter Vertex-Preview – GA weiterhin im Juni 2026 erwartet. Single-Region in europe-west3 / europe-west4 weiterhin nur für Gemini 2.5 Pro und 2.0 Flash. innFactory AI Consulting Rosenheim.

Lizenz Proprietär
DSGVO-Hosting Verfügbar
Kontext Bis zu 2M Tokens
Modalität Text, Image, Audio, Video, PDF, Code → Text, Image, Audio, Code

Versionen

Verfügbare Modellvarianten im Überblick

ModellReleaseEUStärkenSchwächenStatus
Gemini 3.5 Flash (GA) Empfohlen
19. Mai 2026 (Google I/O 2026)
Übertrifft Gemini 3.1 Pro auf Terminal-Bench 2.1, GDPval-AA Elo und MCP Atlas 289 Tokens/Sekunde – ca. 4× schneller als andere Frontier-Modelle Agentic-first: mehrstündige autonome Coding- und Research-Pipelines Standardmodell in Gemini App, AI Mode in Search, Antigravity und Gemini Enterprise EU-Multi-Region-Endpoint für DSGVO-konformes Routing innerhalb der EU-Geografie
Noch kein Single-Region-Endpoint in Frankfurt oder Niederlande — nur EU-Multi-Region
Aktuell
Gemini 3.5 Pro (Limited Preview)
Limited Preview seit Mai 2026, GA im Juni 2026 erwartet
Orchestrator-/Planner-Rolle für Multi-Agent-Workflows Arbeitet mit 3.5 Flash als Sub-Agenten zusammen 2M Token Kontextfenster und Deep-Think-Reasoning-Modus angekündigt
Noch nicht GA – nur limitierte Vertex-Preview EU-Multi-Region-Verfügbarkeit noch nicht bestätigt
Preview
Gemini 3.1 Pro (GA)
Februar 2026
Komplexes Reasoning 2M Token Kontextfenster Multimodal
Auf zentralen Benchmarks von Gemini 3.5 Flash überholt
Aktuell
Gemini 3.1 Flash (GA)
Januar 2026
Starkes Preis-Leistungs-Verhältnis 1M Token Kontextfenster
Abgelöst durch Gemini 3.5 Flash
Aktuell
Gemini 3.1 Flash Thinking
Februar 2026
Erweitertes Reasoning Stark bei STEM-Aufgaben
Höhere Latenz durch Denkprozess
Aktuell
Gemini 3.1 Pro Deep Research
Februar 2026
Multi-Hop-Recherche Lange Analyseaufgaben
Spezialisiert, nicht universell
Aktuell
Gemini 3 Pro (Preview)
Januar 2026
Reasoning-first Multimodal
Abgelöst durch 3.1 Pro GA
Preview
Gemini 3 Flash (Preview)
Januar 2026
Schnell Stark in multimodalen Aufgaben
Abgelöst durch 3.1 Flash GA
Preview
Gemini 2.5 Pro
2025
Bewährt
Abgekündigt
Veraltet
Gemini 2.0 Flash
Dezember 2024
Kosteneffizient
Abgekündigt
Veraltet

Einsatzbereiche

Typische Anwendungsgebiete für dieses Modell

Video-Analyse
Research & Dokumentenanalyse
Multimodale Anwendungen
Vibe Coding
Agentic Workflows
Datenanalyse
Google Workspace Integration

Technische Details

API, Features und Capabilities

API & Verfügbarkeit
Verfügbarkeit Public
Requests/Min 1500
Tokens/Min 4000000
Latenz (TTFT) ~300ms
Durchsatz ~200 Tokens/Sek
Features & Capabilities
Tool Use Function Calling Structured Output Vision Reasoning Mode Code Execution Web Browsing Datei-Upload Realtime API
Training & Wissen
Wissensstand 2026-01
Fine-Tuning Verfügbar (Supervised Fine-Tuning)
Sprachunterstützung
Beste Qualität Englisch, Deutsch, Französisch, Spanisch, Japanisch, Koreanisch, Chinesisch
Unterstützt 100+ Sprachen
Exzellente Mehrsprachigkeit durch multimodales Training

Hosting & Compliance

DSGVO-konforme Hosting-Optionen und Lizenzierung

DSGVO-konforme Hosting-Optionen
Google Cloud
Netherlands (europe-west4)
Vertex AI
Lizenz & Hosting
Lizenz Proprietary
Sicherheitsfilter Anpassbar
Enterprise Support Ja
SLA verfügbar Ja
Nur Cloud

innFactory AI Consulting aus Rosenheim unterstützt Unternehmen in Bayern und dem DACH-Raum bei der Nutzung von Google Gemini. Auf der Google I/O 2026 (19. Mai 2026) hat Google Gemini 3.5 Flash veröffentlicht und Gemini 3.5 Pro für Juni 2026 angekündigt. Gemini 3.5 Pro befindet sich Stand 9. Juni 2026 in limitierter Vertex-Preview für ausgewählte Enterprise-Kunden; die breite GA wird weiterhin im Juni 2026 erwartet. Gemini 3.5 Flash übertrifft das bisherige Flagship Gemini 3.1 Pro auf zentralen Coding- und Agentic-Benchmarks und liefert laut Google rund 289 Tokens/Sekunde – etwa viermal schneller als vergleichbare Frontier-Modelle. Parallel hat Google mit Gemini Spark einen agentischen 24/7-Assistenten angekündigt, der auf Gemini 3.5 und dem Antigravity-Harness basiert.

EU-Verfügbarkeit Gemini 3.5 Flash (Stand 9. Juni 2026): Gemini 3.5 Flash ist über den EU-Multi-Region-Endpoint der Vertex AI / Gemini Enterprise Agent Platform verfügbar — Anfragen werden ausschließlich innerhalb der EU-Geografie geroutet und sind über das Vertex AI Data Processing Addendum DSGVO-abgedeckt. Damit ist das Modell für DSGVO-konforme Workloads in der DACH-Region einsetzbar. Was noch fehlt, ist ein Single-Region-Endpoint in europe-west3 (Frankfurt) oder europe-west4 (Niederlande). Wer striktes Pinning auf eine einzelne EU-Region benötigt, bleibt bei Gemini 2.5 Pro und Gemini 2.0 Flash in europe-west4.

Besondere Stärken

Gemini 3.5 Flash – Agentic-first

Mit Gemini 3.5 Flash positioniert Google sein schnellstes Modell erstmals oberhalb des eigenen Pro-Flagships: 3.5 Flash übertrifft Gemini 3.1 Pro auf Terminal-Bench 2.1 (Coding), GDPval-AA Elo (Real-World Agentic) und MCP Atlas (Tool Use). Das Modell ist auf mehrstündige autonome Workflows ausgelegt – etwa Coding-Pipelines, Research-Projekte oder den Aufbau ganzer Systeme. Es pausiert an Entscheidungspunkten und holt menschlichen Input ein. Eine kommende Variante soll bis zu 12× schneller als andere Frontier-Modelle bei gleichbleibender Qualität liefern.

Gemini 3.5 Pro – Orchestrator (Limited Preview)

Gemini 3.5 Pro befindet sich Stand 9. Juni 2026 in limitierter Vertex-Preview für ausgewählte Enterprise-Kunden; die breite GA wird weiterhin im Juni 2026 erwartet. Das Modell ist als Orchestrator/Planner konzipiert, der Gemini 3.5 Flash als Sub-Agenten dirigiert. Angekündigt sind 2M Token Kontextfenster sowie ein Deep-Think-Reasoning-Modus. Damit zielt Google explizit auf Multi-Agent-Architekturen statt klassischer Chatbots.

Gemini Spark – agentischer 24/7-Assistent

Mit Gemini Spark hat Google auf der I/O 2026 einen agentischen Personal-Assistant vorgestellt, der auf Gemini 3.5 und der Antigravity-Plattform basiert. Spark läuft kontinuierlich in Googles Cloud, lässt sich per dedizierter Gmail-Adresse direkt anschreiben und führt Aufgaben über Chrome und Google Workspace im Hintergrund aus. Spark unterstützt das Model Context Protocol (MCP) für die Anbindung externer Dienste und wird zuerst Google-AI-Ultra-Abonnenten zur Verfügung gestellt.

Branchenführendes Kontextfenster

Gemini 3.1 Pro verarbeitet bis zu 2 Millionen Tokens in einem einzigen Kontext. Damit lassen sich umfangreiche Vertragswerke, technische Dokumentationen oder ganze Codebases in einer Anfrage analysieren. Die Flash-Modelle bieten ein Kontextfenster von 1 Million Tokens bei deutlich geringeren Kosten.

Multimodale Verarbeitung

Die Gemini-3.x-Familie verarbeitet Text, Bilder, Audio, Video und PDF-Dokumente nativ. Das ermöglicht Anwendungsfälle wie automatisierte Videoanalyse, Dokumentenextraktion aus gescannten PDFs oder die Auswertung von Meetings mit Audio- und Bildmaterial.

Google-Ökosystem

  • Vertex AI: Enterprise-Deployment mit SLA (EU-Hosting nur für ältere Modelle)
  • Antigravity 2.0: Agentische Entwicklungsplattform für Gemini 3.5
  • Gemini Enterprise: Enterprise-Frontend mit Zugriff auf 3.5 Flash
  • Google Workspace: Integration in Docs, Sheets, Gmail und weitere Produkte
  • Search Grounding: Zugriff auf aktuelle Webinformationen
  • Google AI Studio: Schneller Einstieg und Prototyping

Spezialisierte Varianten

  • Gemini 3.1 Flash Thinking: Erweitertes Reasoning für komplexe STEM-Aufgaben mit transparentem Denkprozess
  • Gemini 3.1 Pro Deep Research: Spezialisiert auf mehrstufige Recherchen und lange Analyseaufgaben

Verfügbarkeit in der EU

Stand 9. Juni 2026: Gemini 3.5 Flash ist auf dem EU-Multi-Region-Endpoint der Vertex AI / Gemini Enterprise Agent Platform GA. Anfragen werden ausschließlich innerhalb der EU-Geografie geroutet und das Modell ist durch das Vertex AI Data Processing Addendum DSGVO-abgedeckt. Gemini 3.5 Pro ist weiterhin in limitierter Vertex-Preview – noch keine GA und keine bestätigte EU-Multi-Region-Verfügbarkeit.

Was in der EU heute geht

  • Gemini 3.5 Flash über den EU-Multi-Region-Endpoint — DSGVO-konformes Routing innerhalb der EU-Geografie, GA auf Vertex AI / Gemini Enterprise Agent Platform.
  • Gemini 3.5 Flash über den Global-Endpoint — zusätzlich nutzbar für Workloads ohne Residenz-Pflicht.
  • Gemini 2.5 Pro und Gemini 2.0 Flash als Single-Region-Endpoints in europe-west4 (Niederlande), eingeschränkt auch europe-west3 (Frankfurt) — für Kunden mit striktem Pinning auf eine einzelne EU-Region.

Was noch fehlt

  • Single-Region-Endpoint für Gemini 3.5 Flash in europe-west3 (Frankfurt) oder europe-west4 (Niederlande)
  • Bestätigte EU-Multi-Region-Verfügbarkeit der älteren 3.x-Familie (3.1 Pro, 3.1 Flash, 3.1 Flash Thinking, 3.1 Pro Deep Research) — modellweise zu prüfen
  • Gemini 3.5 Pro (Limited Preview, GA im Juni 2026 erwartet) — EU-Multi-Region-Verfügbarkeit wird zum GA-Launch bestätigt

Wir empfehlen, die Google-Cloud-Dokumentation zur regionalen Verfügbarkeit und die Gemini-Enterprise-Agent-Platform-Release-Notes regelmäßig zu prüfen.

Integration mit CompanyGPT

Gemini-Modelle sind in CompanyGPT integriert. Gemini 3.5 Flash ist über den EU-Multi-Region-Endpoint für DSGVO-konformes Frontier-Reasoning und Agentic-Coding-Workloads angebunden. Gemini 2.5 Pro und Gemini 2.0 Flash stehen weiterhin als Single-Region-Endpoints in europe-west4 zur Verfügung, wenn striktes Pinning auf eine einzelne EU-Region erforderlich ist. Sobald Google Single-Region-3.5-Endpoints in Frankfurt oder den Niederlanden freischaltet, ergänzen wir sie als Default-Option.

Unsere Empfehlung

Gemini 3.5 Flash ist seit dem 19. Mai 2026 das technisch leistungsstärkste Gemini-Modell und schlägt auf Coding- und Agentic-Benchmarks sogar Gemini 3.1 Pro. EU-Unternehmen können es heute über den EU-Multi-Region-Endpoint von Vertex AI / Gemini Enterprise Agent Platform DSGVO-konform produktiv einsetzen.

  • Frontier-Reasoning und Agentic Workflows in der EU: Gemini 3.5 Flash über den EU-Multi-Region-Endpoint
  • Strikte Single-Country-EU-Residenz: Gemini 2.5 Pro in europe-west4
  • Kosteneffizient mit Single-Region-Pinning: Gemini 2.0 Flash in europe-west4
  • Cross-Cloud-Alternative: Anthropic Claude Opus 4.8 (Modellseite) oder Claude Sonnet 4.6 über AWS Bedrock (in-region Ireland/Stockholm/Frankfurt) — sinnvoll für Multi-Cloud-Strategien oder wenn der Workload nicht an Google Cloud gebunden ist

Wir beobachten das Rollout der Single-Region-EU-Endpoints für Gemini 3.5 Flash eng und aktualisieren diese Seite, sobald Google sie freischaltet.

Kostenkalkulation für dieses Modell

Eine aktuelle Übersicht über Token-Preise, Modellvarianten und EU-Verfügbarkeit finden Sie auf unserem Schwesterprojekt ai-prices.eu. Dort lassen sich die laufenden Betriebskosten für Ihren konkreten Anwendungsfall vergleichen und abschätzen.

Preise auf ai-prices.eu vergleichen

ai-prices.eu ist ein Projekt der innFactory AI Consulting GmbH und hilft bei der transparenten Preisabschätzung führender KI-Modelle.

Beratung zu diesem Modell?

Wir helfen Ihnen bei der Auswahl und Integration des richtigen KI-Modells für Ihren Anwendungsfall.