Update Juni 2026: Seit Mai 2026 sind DeepSeek V4-Flash und V4-Pro auch in Microsoft Foundry verfügbar – damit ist die V4-Generation erstmals über einen Hyperscaler mit EU-Datenresidenz nutzbar. Auf AWS Bedrock sind in EU-Regionen weiterhin V3.1, V3.2 und R1 verfügbar; V4-Pro startet typischerweise zuerst in US-Regionen. innFactory AI Consulting aus Rosenheim berät zu allen Deployment-Optionen.
Update April 2026: DeepSeek hat am 24. April 2026 die V4-Generation veröffentlicht. V4-Flash (284B) und V4-Pro (1,6T Parameter) bieten 1M Token Kontext durch eine neue hybride Attention (Compressed Sparse Attention + Heavily Compressed Attention). Beide Modelle sind als Open Weights auf HuggingFace verfügbar.
DeepSeek V4 - Die neue Generation (April 2026)
DeepSeek hat mit der V4-Generation einen bedeutenden Sprung gemacht:
V4-Flash
- 284B Parameter total, ca. 13B aktiv (MoE)
- 1M Token Kontextfenster
- Thinking- und Non-Thinking-Modus
- API:
deepseek-v4-flash - Open Weights auf HuggingFace
V4-Pro
- 1,6 Billionen Parameter total, ca. 49B aktiv (MoE)
- 1M Token Kontextfenster – nur 27 % der FLOPs und 10 % des KV-Caches gegenüber V3.2
- Thinking- und Non-Thinking-Modus
- API:
deepseek-v4-pro - 80,6 % SWE-Bench (laut DeepSeek)
Hinweis: Die bisherigen API-Namen
deepseek-chatunddeepseek-reasonerwerden am 24. Juli 2026 eingestellt und auf V4-Flash umgeleitet.
Besondere Stärken
Open Source & Lizenzierung
DeepSeek bietet volle Transparenz:
- Öffentliche Gewichte: Vollständig auf GitHub/Hugging Face verfügbar
- Lizenzierung: R1 unter MIT, V3 unter separatem Model Agreement
- Community: Aktive Weiterentwicklung
- Anpassbar: Fine-Tuning und Modifikationen möglich
MoE-Architektur
DeepSeek nutzt innovative Mixture-of-Experts:
- 671B Parameter gesamt, aber nur 37B aktiv pro Anfrage
- Effizient: Hohe Leistung bei reduziertem Ressourcenbedarf
- Multihead Latent Attention: Neuer Attention-Mechanismus
Reasoning-Fähigkeiten (R1)
DeepSeek-R1 zeigt transparente Denkprozesse:
- Chain-of-Thought wird sichtbar gemacht
- Besonders stark bei Mathematik und Logik
- Vergleichbar mit OpenAI o1
EU-Verfügbarkeit (Update Februar 2026)
DeepSeek ist nun über alle drei großen Cloud-Anbieter in EU-Regionen verfügbar:
AWS Bedrock
- Regionen: Frankfurt (eu-central-1), Ireland (eu-west-1)
- Modelle: DeepSeek-V3.1, V3.2
- Vorteil: Serverless, sofortige Verfügbarkeit
Microsoft Foundry (vormals Azure AI Foundry)
- Regionen: West Europe, Sweden Central
- Modelle: V3, R1, V4-Flash und V4-Pro (seit Mai 2026)
- Vorteil: Integration in Azure-Ökosystem, jetzt mit V4-Generation
Google Vertex AI
- Regionen: Frankfurt (europe-west3), Netherlands (europe-west4)
- Modelle: V3.2, R1
- Vorteil: Vertex AI Model Garden
Self-Hosting
Weiterhin möglich für maximale Kontrolle und vollständige DSGVO-Konformität.
Wichtige Hinweise
Datenschutz-Überlegungen
Update Februar 2026: Mit der Verfügbarkeit auf AWS Bedrock, Azure AI und Google Vertex AI in EU-Regionen können Unternehmen DeepSeek nun DSGVO-konform in der Cloud nutzen!
- Cloud-Hosting (EU): Daten bleiben in EU-Regionen bei AWS/Azure/Google
- Direkte API: DeepSeek-Server in China (Vorsicht bei sensiblen Daten)
- Self-Hosting: Weiterhin die Option mit maximaler Kontrolle
Für Unternehmen: Die Cloud-Provider bieten EU-Datenresidenz mit vollständiger Compliance. Self-Hosting bleibt eine Alternative für höchste Sicherheitsanforderungen.
Self-Hosting als Lösung
Das Open-Source-Modell kann in der eigenen Infrastruktur betrieben werden:
- Alle Daten bleiben unter Ihrer Kontrolle
- Keine Abhängigkeit von externen APIs
- Volle DSGVO-Konformität möglich
- Hardware-Anforderungen: Mehrere High-End GPUs (A100/H100)
Preis-Leistung
DeepSeek bietet exzellente Preis-Leistung:
- API: Sehr günstige Preise (ca. 90% günstiger als GPT-4)
- Self-Hosting: Kostenlos nutzbar (nur Hardware-Kosten)
- Keine Lizenzgebühren: R1 unter MIT, V3 unter Model Agreement
Unsere Empfehlung
DeepSeek ist technisch beeindruckend und erreicht Frontier-Niveau bei Reasoning und Coding. Mit der neuen EU-Verfügbarkeit auf AWS, Azure und Google können Unternehmen DeepSeek nun DSGVO-konform nutzen.
Für die meisten Unternehmen empfehlen wir:
- Cloud-Option: DeepSeek-V4-Flash über die API oder EU-Cloud-Provider - günstig, leistungsstark, 1M Kontext
- Self-Hosting: DeepSeek-V4-Flash oder V3.2 für maximale Kontrolle und Anpassbarkeit
Die Wahl hängt von Ihren Anforderungen an Kontrolle, Compliance und technische Ressourcen ab.
