Als KI-Beratung aus Rosenheim unterstützen wir Unternehmen im DACH-Raum bei der DSGVO-konformen Integration von OpenAI-Modellen. Mit unserem CompanyGPT können Sie GPT-Modelle sicher in Ihrer eigenen Infrastruktur betreiben.

Was ist GPT?

GPT (Generative Pre-trained Transformer) ist die KI-Modellfamilie von OpenAI. Seit dem 9. Juli 2026 ist die neueste Generation GPT-5.6 (Tiers Sol, Terra, Luna) allgemein verfügbar – in ChatGPT, Codex und der API. Der Start erfolgte gestaffelt: Nach einer staatlich freigegebenen Limited Preview ab dem 26. Juni schloss das US-Handelsministerium seine Prüfung am 8. Juli ab und gab das Modell für den öffentlichen Launch frei. Die wichtigste Neuigkeit für EU-Kunden: GPT-5.6 ist inzwischen auch in Microsoft Foundry angekommen – die Microsoft-Learn-Dokumentation listet gpt-5.6-sol, gpt-5.6-terra und gpt-5.6-luna (Modellversion 2026-07-09) für Global Standard in allen EU-Regionen und für EU Data Zone Standard, bei dem die Daten in der EU bleiben. Damit ist GPT-5.6 erstmals DSGVO-konform in EU-Data-Zones deploybar und löst GPT-5.5 als höchstes EU-verfügbares OpenAI-Modell ab. Auch Amazon Bedrock hat nachgezogen: Seit dem 13. Juli 2026 ist GPT-5.6 dort GA – allerdings ausschließlich in US-Regionen; eine EU-Region listet die AWS-Dokumentation weder für GPT-5.6 noch für GPT-5.5 (Stand 22. Juli 2026). Daneben bleiben GPT-5.5 (April 2026) und GPT-5.4 (März 2026, 1-Million-Token-Kontextfenster, native Computer-Steuerung) als bewährte EU-Optionen über Microsoft Foundry verfügbar, GPT-5.5 Instant steht als gpt-chat-latest bereit. Für spezialisierte Coding-Aufgaben steht weiterhin GPT-5.3 Codex zur Verfügung, während die o-Serie mit o3 und o4-mini komplexe Reasoning-Aufgaben abdeckt.

GPT-5.6 (Sol, Terra, Luna): Seit 9. Juli 2026 allgemein verfügbar

Am 9. Juli 2026 hat OpenAI die GPT-5.6-Familie öffentlich gelauncht – in ChatGPT, Codex und der API. Das neue Namensschema trennt die Generationsnummer (5.6) von dauerhaften Leistungs-Tiers; mini/nano-Varianten gibt es nicht mehr:

GPT-5.6 Sol (gpt-5.6-sol) – Flaggschiff, laut OpenAI das bisher stärkste Modell (Fokus Coding, Knowledge Work, Cybersecurity, Wissenschaft). Terminal-Bench 2.1: 88,8 %, mit der Ultra-Konfiguration (Subagenten) 91,9 % – neuer State of the Art. Preis $5/1M Input, $30/1M Output.
GPT-5.6 Terra (gpt-5.6-terra) – ausgewogenes Tier, etwa GPT-5.5-Qualität zur Hälfte der Kosten ($2,50/1M Input, $15/1M Output). Terra ist das neue Standard-Modell für ChatGPT-Free- und Go-Nutzer.
GPT-5.6 Luna (gpt-5.6-luna) – schnelles, günstiges Tier ($1/1M Input, $6/1M Output).

Alle drei Modelle bieten ein Kontextfenster von 1,05 Millionen Token (128k Output) mit Knowledge Cutoff Februar 2026. Neu in der API sind Programmatic Tool Calling, erweiterte Multi-Agent-Fähigkeiten und Prompt-Cache-Breakpoints. Parallel zum Launch hat OpenAI ChatGPT Work vorgestellt – einen von Sol angetriebenen Arbeits-Agenten mit Codex-Integration, zunächst für Pro-, Enterprise- und Edu-Kunden. Der Rollout von Sol in ChatGPT erfolgt gestaffelt über die Bezahl-Tiers.

Ein ehrlicher Blick auf die Benchmarks gehört dazu: Auf SWE-Bench Pro erreicht Sol laut unabhängiger Auswertung nur 64,6 % gegenüber rund 80 % bei Claude Fable 5 – OpenAI hält allerdings rund 30 % der SWE-Bench-Pro-Aufgaben für fehlerhaft. Bei agentischen Benchmarks wie Terminal-Bench liegt Sol dagegen vorn.

Vom staatlichen Freigabeprozess zum Public Launch

Update – Stand 22. Juli 2026: GPT-5.6 ist jetzt in EU-Data-Zones deploybar. Microsoft Foundry führt alle drei Tiers (Sol, Terra, Luna) als GA – inklusive EU Data Zone Standard und Global Standard in allen EU-Regionen. Amazon Bedrock bietet GPT-5.6 seit dem 13. Juli 2026 ebenfalls GA an, dort jedoch nur in US-Regionen. Für DSGVO-konforme EU-Deployments ist damit GPT-5.6 über Microsoft Foundry die neue Referenz.

Der Weg zum Launch war ungewöhnlich: GPT-5.6 startete am 26. Juni 2026 zunächst nur als staatlich freigegebene Limited Preview für eine kleine Gruppe geprüfter Organisationen. Hintergrund war eine US-Cybersecurity-Anordnung, nach der das US-Handelsministerium (Center for AI Standards and Innovation) das Modell vor dem öffentlichen Release prüfen konnte – ausgelöst durch die „High“-Einstufung in Cybersecurity im OpenAI Preparedness Framework. Am 8. Juli 2026 wurde die Prüfung abgeschlossen und die Beschränkung aufgehoben; einen Tag später folgte der öffentliche Launch. Damit wiederholte sich das Muster von Anthropic (Claude Fable 5 / Mythos 5, Anthropic Claude) nur wenige Tage später – inklusive Aufhebung. Mehr zur Vorgeschichte in unserem Blogbeitrag zu GPT-5.6 und Claude Fable 5.

GPT-5.5 – Das Flaggschiff der Vorgängergeneration

GPT-5.5 (23. April 2026, Codename „Spud”) war bis zum GPT-5.6-Launch das Spitzenmodell von OpenAI. Es ist effizienter als GPT-5.4 und bietet verbesserte Coding-Fähigkeiten. Neben dem Basismodell stehen die Varianten GPT-5.5 Thinking und GPT-5.5 Pro zur Verfügung. Seit dem 24. April 2026 ist GPT-5.5 auch in der API verfügbar ($5/1M Input, $30/1M Output, 1M Kontextfenster).

GPT-5.5 Instant (Mai 2026)

Am 5. Mai 2026 hat OpenAI GPT-5.5 Instant als neues Standard-Chat-Modell in ChatGPT eingeführt – es ersetzt GPT-5.3 Instant. In internen Evaluierungen produziert GPT-5.5 Instant 52,5 Prozent weniger Halluzinationen als GPT-5.3 Instant bei High-Stakes-Prompts (Medizin, Recht, Finanzen). In der API ist es als chat-latest und in Microsoft Foundry als gpt-chat-latest verfügbar – damit ist es auch für DSGVO-konforme Enterprise-Deployments in EU-Regionen erreichbar (je nach Foundry-Region-Konfiguration).

Neue Realtime-Voice-Modelle (Mai 2026)

Am 7. Mai 2026 hat OpenAI drei neue Realtime-Voice-Modelle in der API vorgestellt:

GPT-Realtime-2 – Sprachmodell mit GPT-5-Reasoning, 128k Token Kontextfenster (vorher 32k). Preis: $32/1M Audio-Input, $64/1M Audio-Output.
GPT-Realtime-Translate – Live-Übersetzung in Echtzeit, 70+ Eingabesprachen, 13 Ausgabesprachen. Preis: $0,034/Min.
GPT-Realtime-Whisper – Live-Transkription (Speech-to-Text). Preis: $0,017/Min.

Diese Modelle eignen sich für Voice-Agenten, Konferenz-Übersetzung und Echtzeit-Notizen.

GPT-5.4 – Das bewährte Flaggschiff

GPT-5.4 (5. März 2026) vereint alle wesentlichen Fähigkeiten in einem Modell und setzt neue Maßstäbe in mehreren Bereichen:

Native Computer Use

GPT-5.4 kann Desktop-Anwendungen und Browser nativ steuern – ein Durchbruch für die Automatisierung realer Workflows. Mit 75 Prozent auf dem OSWorld-Verified-Benchmark übertrifft es die menschliche Baseline (72,4 Prozent) bei GUI-Automatisierung.

1 Million Token Kontextfenster

Mit bis zu 1.050.000 Token (922K Input + 128K Output) verarbeitet GPT-5.4 Dokumente, die mehrere tausend Seiten umfassen – ideal für umfangreiche Vertragsanalysen, Code-Reviews oder Forschungsdokumente.

Tool Search

Statt alle Tool-Definitionen vorab zu laden, kann GPT-5.4 Werkzeuge dynamisch suchen und nutzen. Das reduziert Token-Kosten in tool-intensiven Workflows um rund 47 Prozent.

Modellvarianten

Variante	Stärke	Preis (Input/1M Token)
GPT-5.4	Allround-Flaggschiff	$2,50
GPT-5.4 Pro	Tiefstes Reasoning	$30,00
GPT-5.4 mini	Schnelle Aufgaben	Günstig
GPT-5.4 nano	Sub-Agenten & Repetitives	Sehr günstig

GPT-5.3 Codex: Agentic Coding

GPT-5.3 Codex (Februar 2026) bleibt das spezialisierte Modell für agentic coding. Es war das erste OpenAI-Modell, das bei seiner eigenen Entwicklung half, und liefert über 1.000 Token pro Sekunde in der Codex-Spark-Variante.

Weitere APIs

Realtime API

Echtzeit-Konversationen mit niedriger Latenz:

Speech-to-Speech: Natürliche Gespräche
Text, Audio, Bild: Multimodale Eingaben in Echtzeit

Sora 2 (Video API)

Videogenerierung und -bearbeitung:

Text-to-Video: Detaillierte, dynamische Videos
Portrait & Landscape: Verschiedene Formate

GPT Image 2 (Bildgenerierung)

Neuestes Bildgenerierungsmodell von OpenAI:

High-Fidelity: Hochwertige Bildausgabe
Bildbearbeitung: Modifikation bestehender Bilder

DSGVO-konformer Einsatz in der EU

Stand 22. Juli 2026: GPT-5.6 (Sol/Terra/Luna) ist jetzt in Microsoft Foundry generell verfügbar – über Global Standard in allen EU-Regionen und über EU Data Zone Standard, bei dem die Daten in der EU bleiben. Damit ist GPT-5.6 das höchste DSGVO-konform in EU-Data-Zones deploybare OpenAI-Modell. Amazon Bedrock bietet die OpenAI-Modelle (GPT-5.6 seit 13. Juli, GPT-5.5/5.4/Codex seit 1. Juni) dagegen nur in US-Regionen an – für EU-Workloads mit Residenz-Pflicht derzeit keine Option.

Aktuell verfügbar (EU): Microsoft Foundry

GPT-5.6 (Sol, Terra, Luna), GPT-5.5 und GPT-5.4 sind in Microsoft Foundry generell verfügbar. Für DSGVO-konforme Deployments entscheidend ist der Deployment-Typ:

EU Data Zone Standard – Prompts und Responses werden ausschließlich innerhalb der EU verarbeitet. GPT-5.6 Sol/Terra/Luna, GPT-5.5 und GPT-5.4 sind hier verfügbar.
Global Standard in EU-Regionen – alle drei GPT-5.6-Tiers sowie GPT-5.5 und GPT-5.4 Pro stehen laut Microsoft-Learn-Dokumentation in sämtlichen europäischen Foundry-Regionen bereit, darunter Germany West Central (Frankfurt), Sweden Central und Poland Central. Hinweis: Bei Global-Standard-Deployments kann die Inferenz-Verarbeitung global erfolgen – für strikte EU-Datenverarbeitung EU Data Zone Standard wählen.
Provisioned (PTU) – für GPT-5.6 läuft der Rollout noch; die Region-Abdeckung ist hier lückenhaft und Sol/Terra sind auf unterschiedliche EU-Regionen verteilt.

Für GPT-5.6 gilt: Tier-5- und Tier-6-Subscriptions haben Standard-Quota, niedrigere Quota-Tiers müssen einen Quota-Antrag stellen. Daneben steht die klassische GPT-5-Familie weiterhin über den Azure OpenAI Service in West Europe (Niederlande, EU Data Boundary), Germany West Central (Frankfurt) und Sweden Central bereit. Die konkrete Region- und Deployment-Verfügbarkeit prüfen wir projektspezifisch.

Amazon Bedrock: GPT-5.6 GA – aber nur US-Regionen

Seit dem 13. Juli 2026 sind GPT-5.6 Sol, Terra und Luna generell auf Amazon Bedrock verfügbar (Model-IDs openai.gpt-5.6-sol, openai.gpt-5.6-terra, openai.gpt-5.6-luna über den bedrock-mantle-Endpoint mit OpenAI-kompatibler Responses API). Bereits seit dem 1. Juni 2026 stehen GPT-5.5, GPT-5.4 und Codex auf Bedrock bereit. Hintergrund ist die strategische Partnerschaft zwischen Amazon und OpenAI (50 Mrd. USD Investment), mit der AWS exklusiver Third-Party-Cloud-Distributionspartner für OpenAI Frontier wird.

Wichtig für EU-Kunden – hier korrigieren wir unsere frühere Einschätzung: Die AWS-Dokumentation listet für die OpenAI-Modelle auf Bedrock ausschließlich US-Regionen – GPT-5.6 Sol in us-east-1 (N. Virginia) und us-east-2 (Ohio), Terra und Luna zusätzlich in us-west-2 (Oregon); Cross-Region-Inference-Profile (Geo/Global) werden nicht unterstützt. Eine EU-Region (etwa eu-central-1 Frankfurt) ist bislang nicht verfügbar. Zudem ist das Kontextfenster auf Bedrock mit 272k Token deutlich kleiner als die 1,05M Token über OpenAI-API und Foundry. Positiv: Die Preise entsprechen den OpenAI-First-Party-Raten, Prompt Caching wird mit 90 Prozent Rabatt auf gecachte Inputs unterstützt. Für DSGVO-Workloads mit EU-Residenz-Pflicht bleibt Bedrock bei OpenAI-Modellen damit vorerst außen vor – wir prüfen die EU-Region-Verfügbarkeit laufend.

Integration mit CompanyGPT

Mit CompanyGPT können Sie GPT-Modelle DSGVO-konform in Ihrem Unternehmen einsetzen – ohne dass Ihre Daten zum Training verwendet werden.

Unsere Empfehlung

Mit der Foundry-Verfügbarkeit von GPT-5.6 hat sich unsere EU-Empfehlung geändert:

GPT-5.6 Sol über Microsoft Foundry (EU Data Zone Standard) – die neue Top-Empfehlung: das stärkste OpenAI-Modell, DSGVO-konform deploybar, Daten bleiben in der EU. Quota-Hinweis: Tier 5/6 haben Standard-Quota, darunter ist ein Quota-Antrag nötig.
GPT-5.6 Terra über Microsoft Foundry – bestes Preis-Leistungs-Verhältnis: etwa GPT-5.5-Qualität zur Hälfte der Kosten ($2,50/1M Input); GPT-5.6 Luna für Sub-Agenten und kostensensitive Workloads.
GPT-5.5 / GPT-5.4 über Microsoft Foundry (EU Data Zone Standard) – bewährte Optionen für Bestandsprojekte; ein Wechsel auf GPT-5.6 lohnt sich wegen des identischen Kontextfensters (1,05M Token) und der besseren Benchmarks meist kurzfristig.
GPT-5.5 Instant in Microsoft Foundry (gpt-chat-latest) – weiterhin gute Wahl für Chat-Workloads in EU-Regionen.
Amazon Bedrock – GPT-5.6/5.5/5.4 sind dort GA, aber nur in US-Regionen und mit reduziertem 272k-Kontextfenster. Für EU-Workloads mit Residenz-Pflicht derzeit keine Option; als Multi-Cloud-Pfad für US-Workloads aber interessant.

Die Plattformlandschaft bewegt sich derzeit schnell: Microsoft Foundry und AWS Bedrock erweitern Modell- und Region-Abdeckung laufend. Wir prüfen die jeweils aktuelle EU-Verfügbarkeit projektspezifisch. Für spezialisierte Coding-Aufgaben eignet sich GPT-5.3 Codex (ebenfalls GA auf Bedrock), für schnelle, kostensensitive Anwendungen GPT-5.6 Luna oder GPT-5.4 mini.

Modell	Release	Stärken	Schwächen	Status
GPT-5.6 Sol Empfohlen	9. Juli 2026 (GA, Preview seit 26. Juni)	Flaggschiff (Tier 'Sol' im Sol/Terra/Luna-Namensschema) – laut OpenAI das bisher stärkste Modell (Coding, Knowledge Work, Cybersecurity, Wissenschaft) Terminal-Bench 2.1: 88,8 %, mit 'Ultra'-Konfiguration (Subagenten) 91,9 % – neuer State of the Art 1,05M Token Kontextfenster, 128k Output, Knowledge Cutoff Februar 2026 Neue API-Features: Programmatic Tool Calling, Multi-Agent-Support, Prompt-Cache-Breakpoints Preis $5/1M Input, $30/1M Output In Microsoft Foundry inkl. EU Data Zone Standard deploybar – Daten bleiben in der EU	SWE-Bench Pro nur 64,6 % vs. 80 % bei Claude Fable 5 – OpenAI hält den Benchmark allerdings für teilweise fehlerhaft 'High'-Einstufung in Cybersecurity und Bio/Chem im OpenAI Preparedness Framework Foundry-Deployment erfordert bei niedrigeren Quota-Tiers einen Quota-Antrag (Tier 5/6 haben Standard-Quota) Auf Bedrock nur US-Regionen und reduziertes Kontextfenster (272k)	Aktuell
GPT-5.6 Terra	9. Juli 2026 (GA, Preview seit 26. Juni)	Ausgewogenes Tier: etwa GPT-5.5-Niveau zur Hälfte der Kosten Preis $2,50/1M Input, $15/1M Output Standard-Modell für ChatGPT Free- und Go-Nutzer 1,05M Token Kontextfenster In Microsoft Foundry inkl. EU Data Zone Standard deploybar	Auf Bedrock nur US-Regionen und reduziertes Kontextfenster (272k)	Aktuell
GPT-5.6 Luna	9. Juli 2026 (GA, Preview seit 26. Juni)	Schnelles, günstiges Tier ($1/1M Input, $6/1M Output) 1,05M Token Kontextfenster Ideal für Sub-Agenten und kostensensitive Workloads In Microsoft Foundry inkl. EU Data Zone Standard deploybar	Auf Bedrock nur US-Regionen und reduziertes Kontextfenster (272k)	Aktuell
GPT-5.5 Instant	Mai 2026	Neuer Standard-Chat-Modell für ChatGPT (ersetzt GPT-5.3 Instant) 52,5% weniger Halluzinationen als GPT-5.3 Instant Stärkere Faktentreue und Tool-Calls In Microsoft Foundry als 'gpt-chat-latest' verfügbar	Kein dediziertes Reasoning-Modell	Aktuell
GPT-Realtime-2	Mai 2026	Neue Realtime-Voice-API mit GPT-5-Reasoning 128k Token Kontextfenster (vorher 32k) Natürlichere Sprachsynthese	Hohe Token-Preise ($32/1M Audio-In, $64/1M Audio-Out)	Aktuell
GPT-Realtime-Translate	Mai 2026	Live-Übersetzung in Echtzeit 70+ Eingabesprachen, 13 Ausgabesprachen Pro Minute abgerechnet ($0,034/Min.)	Begrenzte Ausgabesprachen	Aktuell
GPT-Realtime-Whisper	Mai 2026	Live Speech-to-Text in der Realtime-API Pro Minute abgerechnet ($0,017/Min.)	Spezialisiert auf Transkription	Aktuell
GPT-5.5	April 2026	Flaggschiff (Codename 'Spud') Effizienter als GPT-5.4 Verbesserte Coding-Fähigkeiten Varianten: GPT-5.5 Thinking, GPT-5.5 Pro EU-verfügbar über Microsoft Foundry (EU Data Zone) und AWS Bedrock	Hohe Kosten bei großem Kontext	Aktuell
GPT-5.4	März 2026	Flaggschiff – 1M Token Kontextfenster Native Computer Use (Desktop & Browser) 33% weniger Halluzinationen als GPT-5.2 GDPval 83%, OSWorld-Verified 75% EU-verfügbar über Microsoft Foundry (EU Data Zone)	Premium-Preis ($2,50/1M Input, $15/1M Output) Von GPT-5.6 als Empfehlung abgelöst	Aktuell
GPT-5.4 Pro	März 2026	Tiefstes Reasoning aller OpenAI-Modelle Maximale Präzision für komplexe Aufgaben	Deutlich höhere Kosten ($30/1M Input, $180/1M Output) Langsamste Variante	Aktuell
GPT-5.4 mini	März 2026	2x schneller als Vorgänger Ideal für schnelle Code-Edits und Klassifikation	Geringere Kapazität als GPT-5.4	Aktuell
GPT-5.4 nano	März 2026	Niedrigste Latenz Ideal für Sub-Agenten und repetitive Tasks	Eingeschränkter Funktionsumfang	Aktuell
GPT-5.3 Codex	Februar 2026	Agentic Coding Modell 25% schneller als GPT-5.2 Selbstoptimierend	Spezialmodell für Entwicklung	Aktuell
o3	2025	Reasoning-Fokus	Langsamer	Aktuell
o4-mini	2025	Reasoning-Fokus Kompaktes Reasoning-Modell	Spezialisiert auf Reasoning	Aktuell
GPT-5.2	Dezember 2025	Bewährtes Modell 400k Token Kontextfenster	Wird durch GPT-5.4 abgelöst	Veraltet
GPT-5.2 pro	Januar 2026	Höhere Präzision	Durch GPT-5.4 Pro ersetzt	Veraltet
GPT-4.1	2025	Starkes Allround-Modell	—	Veraltet
GPT-4o	Mai 2024	Multimodal	—	Veraltet

OpenAI GPT

Versionen

Einsatzbereiche

Technische Details

Hosting & Compliance

Benchmarks