innFactory AI Consulting aus Rosenheim unterstützt Unternehmen in Bayern und dem DACH-Raum bei der Nutzung von Google Gemini. Auf der Google I/O 2026 (19. Mai 2026) hat Google Gemini 3.5 Flash veröffentlicht und Gemini 3.5 Pro für Juni 2026 angekündigt. Gemini 3.5 Pro befindet sich Stand 9. Juni 2026 in limitierter Vertex-Preview für ausgewählte Enterprise-Kunden; die breite GA wird weiterhin im Juni 2026 erwartet. Gemini 3.5 Flash übertrifft das bisherige Flagship Gemini 3.1 Pro auf zentralen Coding- und Agentic-Benchmarks und liefert laut Google rund 289 Tokens/Sekunde – etwa viermal schneller als vergleichbare Frontier-Modelle. Parallel hat Google mit Gemini Spark einen agentischen 24/7-Assistenten angekündigt, der auf Gemini 3.5 und dem Antigravity-Harness basiert.
EU-Verfügbarkeit Gemini 3.5 Flash (Stand 9. Juni 2026): Gemini 3.5 Flash ist über den EU-Multi-Region-Endpoint der Vertex AI / Gemini Enterprise Agent Platform verfügbar — Anfragen werden ausschließlich innerhalb der EU-Geografie geroutet und sind über das Vertex AI Data Processing Addendum DSGVO-abgedeckt. Damit ist das Modell für DSGVO-konforme Workloads in der DACH-Region einsetzbar. Was noch fehlt, ist ein Single-Region-Endpoint in
europe-west3(Frankfurt) odereurope-west4(Niederlande). Wer striktes Pinning auf eine einzelne EU-Region benötigt, bleibt bei Gemini 2.5 Pro und Gemini 2.0 Flash ineurope-west4.
Besondere Stärken
Gemini 3.5 Flash – Agentic-first
Mit Gemini 3.5 Flash positioniert Google sein schnellstes Modell erstmals oberhalb des eigenen Pro-Flagships: 3.5 Flash übertrifft Gemini 3.1 Pro auf Terminal-Bench 2.1 (Coding), GDPval-AA Elo (Real-World Agentic) und MCP Atlas (Tool Use). Das Modell ist auf mehrstündige autonome Workflows ausgelegt – etwa Coding-Pipelines, Research-Projekte oder den Aufbau ganzer Systeme. Es pausiert an Entscheidungspunkten und holt menschlichen Input ein. Eine kommende Variante soll bis zu 12× schneller als andere Frontier-Modelle bei gleichbleibender Qualität liefern.
Gemini 3.5 Pro – Orchestrator (Limited Preview)
Gemini 3.5 Pro befindet sich Stand 9. Juni 2026 in limitierter Vertex-Preview für ausgewählte Enterprise-Kunden; die breite GA wird weiterhin im Juni 2026 erwartet. Das Modell ist als Orchestrator/Planner konzipiert, der Gemini 3.5 Flash als Sub-Agenten dirigiert. Angekündigt sind 2M Token Kontextfenster sowie ein Deep-Think-Reasoning-Modus. Damit zielt Google explizit auf Multi-Agent-Architekturen statt klassischer Chatbots.
Gemini Spark – agentischer 24/7-Assistent
Mit Gemini Spark hat Google auf der I/O 2026 einen agentischen Personal-Assistant vorgestellt, der auf Gemini 3.5 und der Antigravity-Plattform basiert. Spark läuft kontinuierlich in Googles Cloud, lässt sich per dedizierter Gmail-Adresse direkt anschreiben und führt Aufgaben über Chrome und Google Workspace im Hintergrund aus. Spark unterstützt das Model Context Protocol (MCP) für die Anbindung externer Dienste und wird zuerst Google-AI-Ultra-Abonnenten zur Verfügung gestellt.
Branchenführendes Kontextfenster
Gemini 3.1 Pro verarbeitet bis zu 2 Millionen Tokens in einem einzigen Kontext. Damit lassen sich umfangreiche Vertragswerke, technische Dokumentationen oder ganze Codebases in einer Anfrage analysieren. Die Flash-Modelle bieten ein Kontextfenster von 1 Million Tokens bei deutlich geringeren Kosten.
Multimodale Verarbeitung
Die Gemini-3.x-Familie verarbeitet Text, Bilder, Audio, Video und PDF-Dokumente nativ. Das ermöglicht Anwendungsfälle wie automatisierte Videoanalyse, Dokumentenextraktion aus gescannten PDFs oder die Auswertung von Meetings mit Audio- und Bildmaterial.
Google-Ökosystem
- Vertex AI: Enterprise-Deployment mit SLA (EU-Hosting nur für ältere Modelle)
- Antigravity 2.0: Agentische Entwicklungsplattform für Gemini 3.5
- Gemini Enterprise: Enterprise-Frontend mit Zugriff auf 3.5 Flash
- Google Workspace: Integration in Docs, Sheets, Gmail und weitere Produkte
- Search Grounding: Zugriff auf aktuelle Webinformationen
- Google AI Studio: Schneller Einstieg und Prototyping
Spezialisierte Varianten
- Gemini 3.1 Flash Thinking: Erweitertes Reasoning für komplexe STEM-Aufgaben mit transparentem Denkprozess
- Gemini 3.1 Pro Deep Research: Spezialisiert auf mehrstufige Recherchen und lange Analyseaufgaben
Verfügbarkeit in der EU
Stand 9. Juni 2026: Gemini 3.5 Flash ist auf dem EU-Multi-Region-Endpoint der Vertex AI / Gemini Enterprise Agent Platform GA. Anfragen werden ausschließlich innerhalb der EU-Geografie geroutet und das Modell ist durch das Vertex AI Data Processing Addendum DSGVO-abgedeckt. Gemini 3.5 Pro ist weiterhin in limitierter Vertex-Preview – noch keine GA und keine bestätigte EU-Multi-Region-Verfügbarkeit.
Was in der EU heute geht
- Gemini 3.5 Flash über den EU-Multi-Region-Endpoint — DSGVO-konformes Routing innerhalb der EU-Geografie, GA auf Vertex AI / Gemini Enterprise Agent Platform.
- Gemini 3.5 Flash über den Global-Endpoint — zusätzlich nutzbar für Workloads ohne Residenz-Pflicht.
- Gemini 2.5 Pro und Gemini 2.0 Flash als Single-Region-Endpoints in
europe-west4(Niederlande), eingeschränkt aucheurope-west3(Frankfurt) — für Kunden mit striktem Pinning auf eine einzelne EU-Region.
Was noch fehlt
- Single-Region-Endpoint für Gemini 3.5 Flash in
europe-west3(Frankfurt) odereurope-west4(Niederlande) - Bestätigte EU-Multi-Region-Verfügbarkeit der älteren 3.x-Familie (3.1 Pro, 3.1 Flash, 3.1 Flash Thinking, 3.1 Pro Deep Research) — modellweise zu prüfen
- Gemini 3.5 Pro (Limited Preview, GA im Juni 2026 erwartet) — EU-Multi-Region-Verfügbarkeit wird zum GA-Launch bestätigt
Wir empfehlen, die Google-Cloud-Dokumentation zur regionalen Verfügbarkeit und die Gemini-Enterprise-Agent-Platform-Release-Notes regelmäßig zu prüfen.
Integration mit CompanyGPT
Gemini-Modelle sind in CompanyGPT integriert. Gemini 3.5 Flash ist über den EU-Multi-Region-Endpoint für DSGVO-konformes Frontier-Reasoning und Agentic-Coding-Workloads angebunden. Gemini 2.5 Pro und Gemini 2.0 Flash stehen weiterhin als Single-Region-Endpoints in europe-west4 zur Verfügung, wenn striktes Pinning auf eine einzelne EU-Region erforderlich ist. Sobald Google Single-Region-3.5-Endpoints in Frankfurt oder den Niederlanden freischaltet, ergänzen wir sie als Default-Option.
Unsere Empfehlung
Gemini 3.5 Flash ist seit dem 19. Mai 2026 das technisch leistungsstärkste Gemini-Modell und schlägt auf Coding- und Agentic-Benchmarks sogar Gemini 3.1 Pro. EU-Unternehmen können es heute über den EU-Multi-Region-Endpoint von Vertex AI / Gemini Enterprise Agent Platform DSGVO-konform produktiv einsetzen.
- Frontier-Reasoning und Agentic Workflows in der EU: Gemini 3.5 Flash über den EU-Multi-Region-Endpoint
- Strikte Single-Country-EU-Residenz: Gemini 2.5 Pro in
europe-west4 - Kosteneffizient mit Single-Region-Pinning: Gemini 2.0 Flash in
europe-west4 - Cross-Cloud-Alternative: Anthropic Claude Opus 4.8 (Modellseite) oder Claude Sonnet 4.6 über AWS Bedrock (in-region Ireland/Stockholm/Frankfurt) — sinnvoll für Multi-Cloud-Strategien oder wenn der Workload nicht an Google Cloud gebunden ist
Wir beobachten das Rollout der Single-Region-EU-Endpoints für Gemini 3.5 Flash eng und aktualisieren diese Seite, sobald Google sie freischaltet.
