Als KI-Beratungsunternehmen aus Rosenheim helfen wir Unternehmen in Deutschland, Österreich und der Schweiz bei der DSGVO-konformen Integration von Anthropic Claude. Über CompanyGPT lässt sich das neue Top-Modell Claude Opus 5 (claude-opus-5, 24. Juli 2026) ebenso wie Claude Sonnet 5 (claude-sonnet-5, 30. Juni 2026), Opus 4.8 und Haiku 4.5 sicher in der eigenen Cloud betreiben — wahlweise über AWS Bedrock (Ireland und Stockholm in-region für Opus 5 und Opus 4.8, Frankfurt über das EU-Geo-Inference-Profil) oder die Gemini Enterprise Agent Platform (vormals Vertex AI); Microsoft Foundry bietet Claude ebenfalls an, bislang aber ohne EU Data Zone. Hinweis: Die im Juni 2026 vorgestellten Modelle Claude Fable 5 und Mythos 5 wurden drei Tage nach dem Launch auf Anordnung der US-Regierung weltweit deaktiviert – am 30. Juni 2026 wurde die Anordnung vollständig aufgehoben. Claude Fable 5 (claude-fable-5) ist seit dem 1. Juli 2026 weltweit wieder verfügbar, auch über Bedrock, Vertex AI und Microsoft Foundry; wegen der verpflichtenden 30-Tage-Datenspeicherung ohne Zero-Data-Retention-Option ist es für strikte DSGVO-Workflows aber nur eingeschränkt geeignet. Mythos 5 bleibt auf geprüfte Organisationen beschränkt (siehe Abschnitt unten).

Claude 3P: Anthropic als Multi-Cloud-Modell

Anthropic verfolgt seit der Sonnet-3-Generation eine konsequente Multi-Cloud-Strategie. Claude-Modelle werden nicht nur über die hauseigene Anthropic-API ausgeliefert, sondern parallel über die drei großen Hyperscaler. Anthropic bezeichnet diese Drittanbieter-Bereitstellung intern und in der Dokumentation als Claude 3P (Third Party). Für Unternehmen ist das die regelmäßig wichtigere Variante, weil sie die DSGVO-konforme Nutzung über bekannte EU-Cloud-Regionen erlaubt.

Die drei Claude-3P-Pfade sind:

AWS Bedrock, die Claude-Plattform bei Amazon. Anthropic ist seit 2023 strategischer AWS-Partner, Claude-Modelle sind in Bedrock erste Wahl. Frankfurt (eu-central-1) ist Source-Region für EU-Geo-Inference (Routing innerhalb der EU-Geografie), Single-Region-Hosting ist je nach Modell in Ireland (eu-west-1), Stockholm (eu-north-1) oder Frankfurt verfügbar.
Gemini Enterprise Agent Platform (vormals Vertex AI), die Google-Cloud-Plattform für Modelle und Agenten. Google hat Vertex AI im Rahmen von Cloud Next 2026 am 22. April 2026 in Gemini Enterprise Agent Platform umbenannt, der bisherige Vertex-AI-Funktionsumfang ist vollständig enthalten. Claude-Modelle laufen dort über den Model Garden, EU-Hosting über Frankfurt (europe-west3) oder den EU-Multi-Region-Endpoint.
Microsoft Foundry (vormals Azure AI Foundry), die Microsoft-Plattform für Modelle und Agenten. Anthropic-Modelle sind dort seit Anfang Juli 2026 als Claude 3P GA im Modellkatalog. Wichtige Einschränkung: Claude läuft in Foundry bislang nur als Global-Standard-Deployment (Hosting u. a. Sweden Central) — ein EU-Data-Zone-Deployment gibt es nicht, die Verarbeitung ist also nicht auf die EU beschränkt und Anthropic bleibt eigenständiger Datenverarbeiter. Microsoft kündigt „Foundry in Europe" für 2026 an.

Für DSGVO-konforme Deployments im DACH-Raum hat sich faktisch durchgesetzt, Claude bevorzugt über AWS Bedrock (EU-Regionen) oder die Agent Platform (Frankfurt bzw. EU-Multi-Region) zu beziehen. Microsoft Foundry ist wegen der fehlenden EU Data Zone für Claude aktuell nur eine Option, wenn keine strikte EU-Residenz gefordert ist.

Besondere Stärken

Constitutional AI

Claude basiert auf Constitutional AI, einem Sicherheitsansatz, der ethische Prinzipien direkt im Training verankert. Statt ausschließlich auf menschliches Feedback angewiesen zu sein, lernt das Modell anhand definierter Verfassungsprinzipien selbstständig, schädliche oder unangemessene Ausgaben zu vermeiden. Für Unternehmen bedeutet das geringeres Risiko bei der Interaktion mit sensiblen Daten und höhere Vorhersagbarkeit im produktiven Einsatz. Besonders in regulierten Branchen wie Finanzwesen, Gesundheitswesen oder öffentlicher Verwaltung ist dieser Ansatz von Vorteil, da er die Einhaltung von Compliance-Vorgaben erleichtert.

Extended Context (1M Token GA)

Claude bietet ein Kontextfenster von einer Million Token, allgemein verfügbar (GA) ohne Aufpreis für Opus 5, Sonnet 5, Sonnet 4.6, Opus 4.6, Opus 4.7 und Opus 4.8. Das entspricht etwa 700.000 Wörtern oder mehreren hundert Seiten Dokumentation. Für Enterprise-Anwendungen eröffnet das neue Möglichkeiten. Komplette Vertragswerke, technische Dokumentationen oder umfangreiche Projektunterlagen lassen sich in einer einzelnen Anfrage verarbeiten. Hinweis zu API-Kosten: Der 1M-Token-Kontext erhöht die Kosten pro Anfrage erheblich. Für kostenoptimierte Setups empfehlen wir, den Kontext nur so groß wie nötig zu halten und Haiku 4.5 für einfachere Aufgaben einzusetzen.

Claude Fable 5 & Mythos 5: Rückzug im Juni, Rückkehr von Fable 5 im Juli 2026

Am 9. Juni 2026 hatte Anthropic mit Claude Fable 5 (claude-fable-5) das erste öffentlich verfügbare Mythos-Klasse-Modell veröffentlicht, zusammen mit dem zugangsbeschränkten Claude Mythos 5 (claude-mythos-5, Project Glasswing). Nach einem dreiwöchigen Rückzug ist Fable 5 seit dem 1. Juli 2026 wieder verfügbar; Mythos 5 bleibt zugangsbeschränkt.

Am 12. Juni 2026 (17:21 Uhr ET) erließ die US-Regierung eine Export-Control- bzw. National-Security-Anordnung, die den Zugang zu Fable 5 und Mythos 5 für jeden ausländischen Staatsangehörigen (innerhalb wie außerhalb der USA, einschließlich ausländischer Anthropic-Mitarbeiter) mit sofortiger Wirkung untersagte. Da sich die Staatsangehörigkeit auf API-Ebene nicht in Echtzeit prüfen lässt, hat Anthropic Fable 5 und Mythos 5 für alle Kunden weltweit deaktiviert — nur drei Tage nach dem Launch.

Hintergrund ist ein eskalierender Konflikt zwischen Anthropic und der US-Regierung: Das Pentagon hatte uneingeschränkten Zugang zu Claude verlangt, Anthropic verweigerte zwei Einsatzzwecke (vollständig autonome Waffensysteme und die Massenüberwachung US-amerikanischer Bürger). Als formaler Auslöser nannte die Regierung einen möglichen „eng begrenzten, nicht universellen Jailbreak" von Fable 5. Anthropic erhielt nach eigenen Angaben nur eine mündliche Mitteilung und widersprach öffentlich der Einschätzung, dass dies einen Rückruf rechtfertige.

Update vom 26. Juni 2026 – Mythos 5 teilweise wieder freigegeben (nur USA): US-Handelsminister Howard Lutnick hat die Anordnung teilweise gelockert und Mythos 5 (die Variante ohne Safety Classifier) für eine definierte Liste von über 100 geprüften US-Organisationen aus dem Bereich kritischer Infrastruktur (Behörden und Privatunternehmen) wieder freigegeben. Fable 5 blieb zu diesem Zeitpunkt zunächst für alle Nutzer weltweit offline, und für allgemeine Nutzer, ausländische Staatsangehörige sowie EU-/Nicht-US-Kunden bestand weder für Fable 5 noch für Mythos 5 Zugang.

Update vom 30. Juni / 1. Juli 2026 – Anordnung vollständig aufgehoben, Fable 5 weltweit zurück: Am 30. Juni 2026 hat das US-Handelsministerium die Export-Beschränkungen für beide Modelle vollständig aufgehoben (Anthropic: „Redeploying Fable 5“). Seit dem 1. Juli 2026 ist Claude Fable 5 wieder global verfügbar – auf Claude.ai, über die Claude-API, in Claude Code und Claude Cowork sowie laut Anthropic-Doku auch über Amazon Bedrock, Vertex AI und Microsoft Foundry. Der Preis liegt bei 10 $/MTok Input und 50 $/MTok Output; ein neuer Safety Classifier blockiert den beanstandeten Jailbreak laut Anthropic in über 99 % der Fälle, blockierte Anfragen fallen auf Opus 4.8 zurück. Die Aufhebung ist an Auflagen geknüpft (proaktive Risiko-Erkennung, Mitarbeit an Standards, Meldung missbräuchlicher Nutzung). Mythos 5 bleibt dagegen zugangsbeschränkt – Zugang nur auf Einladung über Project Glasswing für geprüfte Organisationen.

Was das für EU-Unternehmen bedeutet: Fable 5 ist seit dem 1. Juli 2026 auch für EU-Kunden nutzbar – allerdings mit einem gewichtigen Compliance-Vorbehalt: Laut Anthropic werden Prompts und Outputs von Mythos-Klasse-Modellen auf allen Plattformen 30 Tage gespeichert – auch auf Bedrock-, Vertex- und Foundry-Endpunkten in der EU; bestehende Zero-Data-Retention-Vereinbarungen gelten für Fable-5-Traffic nicht. Seit dem 24. Juli 2026 ist für strikte DSGVO-Workflows (etwa §203-Szenarien) deshalb Claude Opus 5 (claude-opus-5) die Empfehlung: Es kommt laut Anthropic nahe an Fable 5 heran (und übertrifft es auf einzelnen Benchmarks) — zum halben Preis, ohne 30-Tage-Speicherpflicht und mit Zero-Data-Retention-Option (auf Bedrock sogar Default). Fable 5 kommt für Workloads in Frage, bei denen die 30-Tage-Speicherung vertretbar und dokumentiert ist.

Nur wenige Tage später folgte OpenAI einem ähnlichen Muster: GPT-5.6 (Sol/Terra/Luna) startete am 26. Juni 2026 ebenfalls nur in einer staatlich freigegebenen Limited Preview (siehe OpenAI GPT). Der Fall unterstreicht, warum für EU-Unternehmen ein anbieter- und modellagnostisches, datensouveränes Setup wichtig ist. Wenn ein einzelnes Modell über Nacht zurückgezogen werden kann, darf das nicht den Geschäftsbetrieb gefährden. Über CompanyGPT lässt sich genau das absichern, indem Anfragen flexibel über Opus 5, Sonnet 5 oder Modelle anderer Anbieter geroutet werden. Mehr dazu in unserem Blogbeitrag zu GPT-5.6 und Claude Fable 5.

Claude Sonnet 5: Neues Mid-Tier-Flaggschiff (30. Juni 2026)

Mit Claude Sonnet 5 (claude-sonnet-5) hat Anthropic am 30. Juni 2026 sein bisher leistungsstärkstes Sonnet-Modell veröffentlicht. Es löst Sonnet 4.6 als Standardempfehlung im Mid-Tier ab und verkleinert laut Anthropic den Abstand zur Opus-Klasse (Opus 4.8) deutlich — bei einem Bruchteil der Kosten. Anthropic nennt unter anderem 34,6 % auf Humanity’s Last Exam (ohne Tools) bzw. 46,8 % (mit Tools) sowie spürbare Fortschritte bei Coding, agentischer Websuche (BrowseComp) und Computer Use (OSWorld-Verified).

Pricing: Zum Launch gilt ein Einführungspreis von 2 USD pro 1M Input-Token und 10 USD pro 1M Output-Token bis zum 31. August 2026; danach 3 USD / 15 USD. Damit liegt Sonnet 5 zunächst sogar unter dem Preis von Sonnet 4.6 und ist besonders für größere Rollouts attraktiv.

EU-Verfügbarkeit: Sonnet 5 ist über AWS Bedrock verfügbar (Bedrock-Invoke über Inference-Profil; die unterstützten EU-Regionen bzw. das EU-Geo-Inference-Profil listet die Bedrock-Doku). Die zum Launch nur als „coming soon" angekündigte Gemini Enterprise Agent Platform (vormals Vertex AI) ist inzwischen nachgezogen: Sonnet 5 (claude-sonnet-5) läuft dort mit 1M Token Kontextfenster über den Global- und den EU-Multi-Region-Endpoint — das Routing bleibt innerhalb der EU-Geografie. Microsoft Foundry bietet Sonnet 5 ebenfalls an, bislang jedoch ohne EU Data Zone (siehe Foundry-Hinweis oben). Über CompanyGPT lässt sich Sonnet 5 damit DSGVO-konform in der eigenen Cloud betreiben.

Claude Opus 5: Neues Flaggschiff der Claude-Familie (24. Juli 2026)

Mit Claude Opus 5 (claude-opus-5) hat Anthropic am 24. Juli 2026 das erste Opus-Modell der fünften Claude-Generation veröffentlicht — das vierte neue Modell in unter zwei Monaten (nach Mythos 5, Fable 5 und Sonnet 5). Die Positionierung ist bemerkenswert: Opus 5 kommt laut Anthropic nahe an die Frontier-Leistung von Fable 5 heran — zum halben Preis — und übertrifft Fable 5 auf einzelnen Benchmarks sogar. Auf Frontier-Bench v0.1 und GDPval-AA (Knowledge Work) ist Opus 5 laut Anthropic der neue State of the Art, auf Frontier-Bench mit etwa doppelter Leistung gegenüber Opus 4.8. Auf CursorBench 3.2 liegt es innerhalb von 0,5 % von Fable 5 bei etwa halben Kosten pro Task, auf ARC-AGI 3 nach Anthropic-Angaben rund 3× über dem nächstbesten Modell, und auf OSWorld 2.0 (Computer Use) erreicht es den Bestwert zu einem Drittel der Fable-5-Kosten. In Fachdomänen meldet Anthropic +10,2 Prozentpunkte bei organischer Chemie und +7,7 Prozentpunkte bei Protein-Aufgaben gegenüber Opus 4.8. Nur bei Cybersecurity-Exploitation und Biologie-Research bleibt Mythos 5 vorn. Anthropic beschreibt Opus 5 als deutlich stärker darin, die eigene Arbeit zu verifizieren und sorgfältig zu iterieren, bis sie tatsächlich funktioniert; im automatisierten Behavioral Audit erzielt es mit 2,3 den niedrigsten Misalignment-Score der jüngsten Claude-Modelle.

Pricing: 5 USD pro 1M Input-Token, 25 USD pro 1M Output-Token — identisch zu Opus 4.8. Der Kapazitätssprung kommt also ohne Preiserhöhung. Neu ist ein optionaler Fast Mode zum doppelten Preis, der etwa 2,5× schneller antwortet. Die Leistung skaliert über das Effort-Setting, mit dem sich pro Use-Case zwischen maximaler Intelligenz und Token-/Latenz-Ersparnis abwägen lässt. Adaptive Thinking ist standardmäßig aktiv. Auf Claude Max ist Opus 5 das neue Default-Modell, auf Claude Pro das stärkste verfügbare Modell.

Neue Plattform-Features: Opus 5 bringt Tool-Wechsel mitten in der Konversation (Beta) sowie Automatic Fallbacks (Beta): Schlägt ein Safety Classifier an, wird die Anfrage automatisch an ein anderes Modell weitergereicht und liefert eine funktionale Antwort statt eines Fehlers. Für Unternehmen gibt es zudem Zugang zum Cyber Verification Program. Die Cybersecurity-Schutzmechanismen bleiben bestehen, sollen laut Anthropic aber rund 85 % seltener anspringen als bei Fable 5.

DSGVO-relevant — keine 30-Tage-Speicherpflicht: Anders als Fable 5 unterliegt Opus 5 im allgemeinen Zugang keiner verpflichtenden Datenspeicherung; auf AWS Bedrock ist Zero Data Retention sogar standardmäßig aktiv. Damit löst Opus 5 Opus 4.8 als unsere Empfehlung für anspruchsvollste Workloads in DSGVO-sensiblen Umgebungen ab.

EU-Verfügbarkeit Opus 5 (Stand 24. Juli 2026): Auf AWS Bedrock ist Opus 5 ab Tag 1 in-region in eu-west-1 (Ireland) und eu-north-1 (Stockholm) verfügbar; Frankfurt (eu-central-1), Zürich (eu-central-2), Paris (eu-west-3), Madrid (eu-south-2), Mailand (eu-south-1) und London (eu-west-2) sind Source-Regionen für das EU-Geo-Inference-Profil (eu.anthropic.claude-opus-5) — Anfragen werden ausschließlich innerhalb der EU-Geografie geroutet. Auf der Gemini Enterprise Agent Platform läuft Opus 5 über den Global- und den EU-Multi-Region-Endpoint (1M Token Kontext). Microsoft Foundry bietet Opus 5 ab Tag 1 an, allerdings bislang ohne EU Data Zone (Global-Standard-Routing, siehe oben). Wie bei Opus 4.8 gilt: kein In-Region-Endpoint in Frankfurt — wer striktes Single-Region-Frankfurt-Hosting auf Bedrock benötigt, bleibt für die Opus-Klasse bei 4.6.

Claude Opus 4.8: Vorgänger-Flaggschiff (28. Mai 2026)

Claude Opus 4.8 (claude-opus-4-8) war von Ende Mai bis zum 24. Juli 2026 Anthropics leistungsstärkstes Modell mit Zero-Data-Retention-Option und bleibt GA; seit dem 24. Juli 2026 ist Claude Opus 5 zum identischen Preis das neue Top-Modell (siehe oben). Der Abstand zu Opus 4.7 ist nicht kosmetisch, sondern messbar: Anthropic gibt 69,2 % auf Terminal-Bench 2 (Agentic Coding, vs. 64,3 % bei Opus 4.7), 57,9 % auf HCAST mit Tools (Multi-Discipline Reasoning, vs. 54,7 %) und einen Sprung auf 1890 Elo im internen Knowledge-Work-Eval (vs. 1753) an. Anthropic beschreibt das Modell als “sharper judgement, more honesty about its progress, and the ability to work independently for longer than its predecessors” — early Tester berichten, dass Opus 4.8 Unsicherheiten häufiger explizit kennzeichnet statt zu konfabulieren.

Mit dem Release kommen zwei neue Plattform-Features:

Dynamic Workflow: Opus 4.8 kann mehrere spezialisierte Subagenten parallel in einer einzigen Anfrage orchestrieren. Damit löst sich Anthropic vom seriellen Single-Agent-Modell und konkurriert direkter mit Multi-Agent-Architekturen.
Effort-Control-Panel: Nutzer steuern, wie viel “Effort” (Reasoning-Tiefe, Tool-Aufrufe, Token-Budget) Claude in eine Antwort investieren darf. Für CompanyGPT-Deployments lässt sich das pro Use-Case fest verdrahten und damit Kosten und Latenz vorhersagbar machen.

Wichtig: Das Pricing bleibt identisch zu Opus 4.7 — 5 USD pro 1M Input-Token, 25 USD pro 1M Output-Token. Da auch Opus 5 (24. Juli 2026) zum gleichen Preis angeboten wird, empfiehlt sich für Neuprojekte inzwischen der direkte Einstieg mit Opus 5; bestehende 4.7/4.8-Deployments migrieren in der Regel per Model-ID-Swap.

EU-Verfügbarkeit Opus 4.8 (Stand 30. Mai 2026): Auf AWS Bedrock ist Opus 4.8 in-region in eu-west-1 (Ireland) und eu-north-1 (Stockholm) verfügbar. Frankfurt (eu-central-1), Zürich (eu-central-2), Paris (eu-west-3), Madrid (eu-south-2), Mailand (eu-south-1) und London (eu-west-2) sind als Source-Region für das EU-Geo-Inference-Profil (eu.anthropic.claude-opus-4-8) freigeschaltet — Anfragen werden ausschließlich innerhalb der EU-Geografie geroutet. Auf der Gemini Enterprise Agent Platform ist Opus 4.8 über den EU-Multi-Region-Endpoint nutzbar, Microsoft Foundry bietet Opus 4.8 in Sweden Central ab Tag 1. Hinweis: Anders als Opus 4.6 ist Opus 4.8 auf Bedrock nicht als In-Region-Modell in Frankfurt bereitgestellt. Wer striktes Single-Region-Frankfurt-Hosting auf Bedrock benötigt, bleibt für die Opus-Klasse bei 4.6.

Claude Opus 4.7: Vorgänger-Flaggschiff (16. April 2026)

Claude Opus 4.7 war von April bis Ende Mai 2026 das Top-Modell und ist weiterhin GA. Da Opus 4.8 zum gleichen Preis spürbar bessere Werte in Coding, Reasoning mit Tools und Knowledge Work liefert, hat 4.7 für Neuprojekte keinen klaren Anwendungsfall mehr. Bestehende Deployments können in der Regel ohne Code-Änderung durch einen Model-ID-Swap auf 4.8 migrieren. EU-Verfügbarkeit: Bedrock, Gemini Enterprise Agent Platform (EU-Multi-Region) und Microsoft Foundry Sweden Central.

Claude Sonnet 4.6: Bewährtes Vorgängermodell (seit Juni 2026 von Sonnet 5 abgelöst)

Mit Claude Sonnet 4.6 (claude-sonnet-4-6) hat Anthropic die Kostenstruktur für leistungsstarke KI grundlegend verschoben. Das Modell erreicht in Benchmarks wie SWE-bench (79,6 %) und HumanEval (94,2 %) Werte auf Opus-Niveau, bei deutlich geringeren Kosten als Opus. Sonnet 4.6 ist über AWS Bedrock Frankfurt und die Gemini Enterprise Agent Platform Frankfurt EU-konform verfügbar — inklusive striktem Single-Region-Hosting in Frankfurt. Seit dem 30. Juni 2026 ist Claude Sonnet 5 das neue Mid-Tier-Flaggschiff (siehe oben); Sonnet 4.6 bleibt aber eine valide Wahl, wenn Single-Region-Frankfurt-Hosting auf Bedrock zwingend ist (für Sonnet 5 sind die unterstützten EU-Regionen der Bedrock-Doku zu entnehmen).

Für mittelständische Unternehmen in der DACH-Region bedeutet das Enterprise-grade KI-Leistung zu Kosten, die auch größere Rollouts wirtschaftlich tragfähig machen. Mit 89,1 % im MMLU-Pro-Benchmark zeigt Sonnet 4.6 exzellente Leistung bei komplexen Reasoning-Aufgaben, ideal für Anwendungen wie automatisierte Kundenberatung, technischer Support oder Analyse von Geschäftsprozessen.

Agent Teams (Claude Opus 4.6)

Claude Opus 4.6 (claude-opus-4-6) führte das Agent-Teams-Feature ein, bei dem mehrere spezialisierte KI-Agenten orchestriert zusammenarbeiten. Ein Agent übernimmt beispielsweise die Datenanalyse, ein zweiter die Berichterstellung und ein dritter die Qualitätssicherung. Diese Arbeitsteilung ermöglicht die Bearbeitung hochkomplexer Workflows, die einzelne Modelle überfordern würden.

Mit 80,8 % im SWE-bench-Verified und 68,8 % im ARC-AGI-2-Benchmark zeigt Opus 4.6 besondere Stärken bei anspruchsvollen Coding- und Reasoning-Aufgaben. Opus 4.6 ist über AWS Bedrock Frankfurt und die Agent Platform Frankfurt single-region EU-verfügbar. Kostenhinweis: Opus-Modelle sind deutlich teurer als Sonnet, nur für Aufgaben einsetzen, die tatsächlich Opus-Niveau erfordern.

Project Glasswing: Mythos in der Cybersecurity-Forschung

Mythos-Klasse-Modelle stammen ursprünglich aus Project Glasswing, Anthropics Cybersecurity-Initiative. Der Vorgänger Mythos Preview hat tausende bisher unbekannte Zero-Day-Schwachstellen in allen großen Betriebssystemen und Web-Browsern gefunden, darunter eine 27 Jahre alte Lücke in OpenBSD und eine 16 Jahre alte Lücke in FFmpeg. Die im Juni 2026 vorgestellten Modelle Mythos 5 (ohne Safety Classifier, nur für freigegebene Partner) und Fable 5 (mit Safety-Guardrails für produktive Szenarien) wurden allerdings bereits drei Tage nach dem Launch auf Anordnung der US-Regierung weltweit zurückgezogen (siehe Abschnitt „Claude Fable 5 & Mythos 5: Auf Anordnung der US-Regierung zurückgezogen"). Am 30. Juni 2026 wurde die Anordnung vollständig aufgehoben: Fable 5 ist seit dem 1. Juli 2026 wieder allgemein verfügbar (mit verpflichtender 30-Tage-Datenspeicherung), Mythos 5 bleibt zugangsbeschränkt – Zugang nur auf Einladung über Project Glasswing für geprüfte Organisationen.

Hinweis zu API-Kosten

Claude-Modelle sind im Vergleich zu anderen Anbietern teuer. Für produktive Deployments mit vielen Nutzern empfehlen wir eine durchdachte Modellstrategie. Aktuelle Token-Preise lassen sich übersichtlich auf ai-prices.eu vergleichen.

Aufgabe	Empfohlenes Modell	Begründung
Einfache Klassifikation, Extraktion	Claude Haiku 4.5	Niedrigste Kosten, ausreichend für einfache Tasks
Dokumentenanalyse, Support-Chatbot	Claude Sonnet 5	Mid-Tier-Flaggschiff (30. Juni 2026), bestes Preis-Leistungs-Verhältnis; Einführungspreis 2/10 USD bis 31.8.2026. Sonnet 4.6 weiter nutzbar, v. a. für Single-Region-Frankfurt
Komplexes Coding, Agentic Workflows (Single-Region Frankfurt)	Claude Opus 4.6	Nur wenn striktes In-Region-Hosting in Frankfurt zwingend ist
Anspruchsvollste Workloads, Software Engineering, Long-Horizon-Agenten, Multi-Agent	Claude Opus 5	Neues Top-Modell (24. Juli 2026) zum gleichen Preis wie Opus 4.8; EU via Bedrock in-region (Ireland, Stockholm) + EU-Geo aus Frankfurt, Zero Data Retention Default

Mit CompanyGPT können Administratoren pro Use-Case das passende Modell konfigurieren, so lassen sich typische Einsparungen von 60 bis 80 Prozent gegenüber einem reinen Opus-Deployment realisieren.

Verfügbarkeit in der EU

Die EU-Verfügbarkeit der Claude-Familie ist 2026 deutlich besser als noch ein Jahr zuvor. Anthropic hat Opus 4.7 (April 2026), Opus 4.8 (Mai 2026) und Opus 5 (24. Juli 2026) jeweils am Release-Tag auf allen drei Drittanbieter-Plattformen verfügbar gemacht. Hinweis: Fable 5 ist nach dem vorübergehenden Rückzug seit dem 1. Juli 2026 wieder global verfügbar (mit verpflichtender 30-Tage-Datenspeicherung); Mythos 5 bleibt auf geprüfte Organisationen beschränkt (siehe Abschnitt oben).

AWS Bedrock:

Opus 5 (24. Juli 2026): In-Region in eu-west-1 (Ireland) und eu-north-1 (Stockholm). Frankfurt (eu-central-1), Zürich (eu-central-2), Paris (eu-west-3), Madrid (eu-south-2), Mailand (eu-south-1) und London (eu-west-2) als Source für das EU-Geo-Inference-Profil eu.anthropic.claude-opus-5. Routing bleibt innerhalb der EU-Geografie; Zero Data Retention ist standardmäßig aktiv.
Opus 4.8: In-Region in eu-west-1 (Ireland) und eu-north-1 (Stockholm), gleiche EU-Geo-Source-Regionen über das Profil eu.anthropic.claude-opus-4-8.
Sonnet 5 (30. Juni 2026): Auf Bedrock verfügbar (Invoke über Inference-Profil). Die konkreten unterstützten EU-Regionen bzw. das EU-Geo-Inference-Profil sind der Bedrock-Doku zu entnehmen.
Opus 4.7, Opus 4.6, Sonnet 4.6, 4.5-Familie: Single-Region in Frankfurt (eu-central-1). Cross-Region-Inferenz innerhalb der EU verfügbar, was für lastintensive Workloads die Verfügbarkeit erhöht.

Gemini Enterprise Agent Platform (vormals Vertex AI, Frankfurt europe-west3 und EU-Multi-Region): Claude 4.5-Familie und Claude 4.6 in Frankfurt single-region. Opus 5, Sonnet 5, Opus 4.8 und Opus 4.7 über den EU-Multi-Region-Endpoint (aiplatform.eu.rep.googleapis.com), der ausschließlich innerhalb der EU-Geografie routet (10 % Aufpreis gegenüber dem Global-Endpoint). Single-Region-Endpoints unterstützen laut Anthropic-Doku nur Sonnet 4.6 und älter.

Microsoft Foundry: Claude-Modelle als Claude 3P im Modellkatalog, GA seit Anfang Juli 2026, einschließlich Opus 5 und Sonnet 5 ab Tag 1. Wichtig für die DSGVO-Bewertung: Es gibt bislang kein EU-Data-Zone-Deployment für Claude in Foundry — die Modelle laufen als Global Standard (Hosting u. a. Sweden Central), die Verarbeitung ist nicht auf die EU beschränkt und Anthropic bleibt eigenständiger Datenverarbeiter. Microsoft stellt „Foundry in Europe" für 2026 in Aussicht. Für strikte EU-Residenz empfehlen wir bis dahin Bedrock oder die Agent Platform.

Für DSGVO-konforme Deployments empfehlen wir: Opus 5 → AWS Bedrock eu-west-1 (Ireland) oder eu-north-1 (Stockholm) in-region, alternativ EU-Geo-Inference aus Frankfurt, als leistungsstärkstes verfügbares Modell mit Zero Data Retention; Sonnet 5 → AWS Bedrock oder Agent Platform EU-Multi-Region als kosteneffizientes Default-Modell mit günstigem Einführungspreis; Sonnet 4.6 → AWS Bedrock Frankfurt single-region, wenn striktes In-Region-Frankfurt-Hosting Pflicht ist; Opus 4.6 → AWS Bedrock Frankfurt single-region, falls Opus-Niveau bei striktem In-Region-Frankfurt-Hosting gefordert ist.

Integration mit CompanyGPT

Claude-Modelle sind in CompanyGPT integriert und können DSGVO-konform in Ihrer Infrastruktur betrieben werden. CompanyGPT ermöglicht die Bereitstellung über Ihre eigene Cloud-Umgebung (AWS, Google Cloud oder Microsoft Azure) ohne Datenweitergabe an Drittanbieter. Durch intelligente Modellrouting-Logik lassen sich Kosten optimieren. Einfache Anfragen gehen automatisch an Haiku 4.5, komplexe an Sonnet 5 (bzw. Sonnet 4.6 bei striktem Single-Region-Frankfurt-Bedarf) und anspruchsvolle Reasoning- sowie agentische Workloads (Software-Engineering, Long-Horizon-Agenten) an Opus 5. Genau diese Flexibilität schützt vor Abhängigkeit von einem einzelnen Modell — fällt ein Modell wie zuletzt Fable 5 kurzfristig weg, kann CompanyGPT nahtlos auf ein anderes Claude-Modell oder einen anderen Anbieter umschalten.

Typische Deployment-Szenarien umfassen die Integration in bestehende Wissensmanagementsysteme, die Anbindung an ERP-Systeme oder die Bereitstellung als interner Chatbot für Mitarbeitende. Mit CompanyGPT behalten Sie die vollständige Kontrolle über Zugriffsrechte, Audit-Logs und Datenflüsse, essentiell für Branchen mit hohen Compliance-Anforderungen wie Banken, Versicherungen oder Gesundheitswesen.

Unsere Empfehlung

Für die anspruchsvollsten Workloads und maximale Reasoning-Leistung (EU): Claude Opus 5 (claude-opus-5). Neues Flaggschiff seit dem 24. Juli 2026 — laut Anthropic nahe an Fable 5, zum halben Preis und ohne dessen 30-Tage-Speicherpflicht (Zero Data Retention auf Bedrock Default). Gleicher Preis wie Opus 4.8 (5/25 USD pro 1M Token), EU-Hosting in-region auf AWS Bedrock in Ireland und Stockholm, aus Frankfurt über das EU-Geo-Inference-Profil, zusätzlich über den EU-Multi-Region-Endpoint der Gemini Enterprise Agent Platform. Empfohlen für Software Engineering, Long-Horizon-Agenten, Multi-Agent-Workflows und hochwertiges Reasoning. Bestehende Opus-4.8-Deployments migrieren per Model-ID-Swap ohne Mehrkosten.

Für die meisten Unternehmensanwendungen: Claude Sonnet 5 (claude-sonnet-5). Seit dem 30. Juni 2026 das Mid-Tier-Flaggschiff: Anthropics stärkstes Sonnet-Modell, das laut Anthropic den Abstand zur Opus-Klasse deutlich verkleinert — bei einem Einführungspreis von 2/10 USD pro 1M Token (bis 31.8.2026, danach 3/15 USD). EU-verfügbar über AWS Bedrock und inzwischen auch über die Gemini Enterprise Agent Platform (EU-Multi-Region, 1M Token Kontext). Claude Sonnet 4.6 (claude-sonnet-4-6) bleibt die Wahl, wenn striktes Single-Region-Frankfurt-Hosting auf Bedrock zwingend ist.

Für In-Region-Frankfurt-Bindung mit Opus-Niveau: Claude Opus 4.6 (claude-opus-4-6). Opus 4.8 ist auf Bedrock nicht als In-Region-Modell in Frankfurt deployed. Wer Opus-Leistung mit striktem Single-Region-Frankfurt-Hosting auf Bedrock braucht, bleibt bei Opus 4.6.

Für kostenoptimierte Anwendungen: Claude Haiku 4.5 (claude-haiku-4-5). Bei hohen Volumen und weniger komplexen Aufgaben (etwa Kategorisierung, einfache Extraktion, Content-Moderation) bietet Haiku 4.5 das beste Preis-Leistungs-Verhältnis. EU-verfügbar auf allen drei Drittanbieter-Plattformen.

Als innFactory AI Consulting unterstützen wir Sie bei der Auswahl des passenden Modells, der DSGVO-konformen Integration und der Kostenoptimierung für Ihre spezifischen Anwendungsfälle. Kontaktieren Sie uns für eine unverbindliche Erstberatung.

Modell	Release	Stärken	Schwächen	Status
Claude Opus 5 Empfohlen	24. Juli 2026	Neues Flaggschiff (24. Juli 2026): laut Anthropic State of the Art auf Frontier-Bench v0.1 und GDPval-AA CursorBench 3.2: innerhalb von 0,5 % von Fable 5 — bei etwa halben Kosten pro Task ARC-AGI 3 laut Anthropic 3× über dem nächstbesten Modell, OSWorld 2.0 Bestwert Keine 30-Tage-Datenspeicherung wie bei Fable 5 — Zero Data Retention möglich (auf Bedrock Default) Adaptive Thinking standardmäßig aktiv, Effort-Steuerung zwischen Leistung und Token-Verbrauch Automatic Fallbacks (Beta): bei Safety-Classifier-Triggern Antwort über ein anderes Modell statt Fehler 1M Token Context Window, 128K Output-Token, Knowledge Cutoff Mai 2026 EU-Hosting auf Bedrock in-region (Ireland, Stockholm) und via EU-Geo aus Frankfurt	Auf Bedrock kein In-Region-Endpoint in Frankfurt — wie Opus 4.8 nur über EU-Geo-Inference Hinter Mythos 5 bei Cybersecurity-Exploitation und Biologie-Research	Aktuell
Claude Opus 4.8	28. Mai 2026	Flaggschiff der Claude-Familie von Mai bis Juli 2026 Agentic Coding 69,2 % (Terminal-Bench 2, vs. 64,3 % bei Opus 4.7) Knowledge Work Elo 1890 (vs. 1753 bei Opus 4.7) HCAST (Multi-Discipline mit Tools) 57,9 % (vs. 54,7 % bei Opus 4.7) Dynamic Workflow: parallele Subagenten in einer Anfrage Effort-Control-Panel zur Steuerung von Denktiefe und Token-Budget 1M Token Context Window, 128K Output-Token EU-Hosting auf Bedrock in-region (Ireland, Stockholm) und via EU-Geo aus Frankfurt	Auf Bedrock kein In-Region-Endpoint in Frankfurt — Frankfurt nur als Source-Region für EU-Geo-Inference Von Claude Opus 5 (24. Juli 2026) bei identischem Pricing abgelöst	Aktuell
Claude Opus 4.7	16. April 2026	Solide Reasoning- und Coding-Leistung EU-Hosting über Bedrock, Agent Platform und Foundry ab Tag 1 1M Token Context Window	Von Opus 4.8 in Agentic Coding, Knowledge Work und HCAST übertroffen Hohe API-Kosten ohne Performance-Vorsprung gegenüber Opus 4.8 (gleiches Pricing)	Aktuell
Claude Opus 4.6	5. Februar 2026	Agent Teams für parallele Workflows SWE-bench Verified 80,8 %, ARC-AGI-2 68,8 % 1M Token Context Window EU-Hosting in Frankfurt verfügbar (Bedrock und Agent Platform)	Hohe Kosten, nicht für Massenanfragen geeignet Von Claude Opus 4.7 in Reasoning- und Coding-Benchmarks übertroffen	Aktuell
Claude Sonnet 5 Empfohlen	30. Juni 2026	Anthropics bisher stärkstes Sonnet-Modell (30. Juni 2026) Schließt laut Anthropic die Lücke zu Opus 4.8 bei deutlich niedrigerem Preis Humanity's Last Exam 34,6 % (ohne Tools) / 46,8 % (mit Tools) Starke Leistung bei Coding, agentischer Websuche (BrowseComp) und Computer Use (OSWorld-Verified) Günstiger Einführungspreis (2 / 10 USD bis 31.8.2026) 1M Token Context Window (Agent Platform) EU-verfügbar über AWS Bedrock und die Gemini Enterprise Agent Platform (EU-Multi-Region)	Kein Single-Region-EU-Endpoint — für striktes Frankfurt-Hosting auf Bedrock bleibt Sonnet 4.6 die Option	Aktuell
Claude Sonnet 4.6	17. Februar 2026	Opus-Klasse Performance zum Sonnet-Preis 1M Token Context Window (GA) SWE-bench Verified 79,6 %, HumanEval 94,2 % EU-verfügbar über Bedrock und Agent Platform (inkl. Frankfurt single-region)	Höherer Preis als Haiku Von Claude Sonnet 5 (30. Juni 2026) abgelöst	Aktuell
Claude Opus 4.5	November 2025	Starke Reasoning-Leistung EU-verfügbar über Bedrock und Agent Platform	Von Opus 4.6 und 4.7 übertroffen Hohe Kosten	Aktuell
Claude Sonnet 4.5	September 2025	Solide Balance aus Leistung und Preis 1M Token Context Window (GA seit 2025) EU-verfügbar	Von Sonnet 4.6 übertroffen	Veraltet
Claude Haiku 4.5	Oktober 2025	Sehr schnell Kosteneffizient, ideal für Massenanfragen Gut für einfache Aufgaben EU-verfügbar auf allen drei Drittanbieter-Plattformen	Weniger Reasoning-Tiefe als Sonnet/Opus	Aktuell

Anthropic Claude

Versionen

Einsatzbereiche

Technische Details

Hosting & Compliance

Benchmarks