Versionen

Verfügbare Modellvarianten im Überblick

Modell	Release	Stärken	Schwächen	Status
DeepSeek-V4-Pro	24. April 2026	1,6 Billionen Parameter (ca. 49B aktiv – MoE) 1M Token Kontextfenster (Compressed Sparse Attention + Heavily Compressed Attention) Thinking und Non-Thinking Modus Open Weights auf HuggingFace Seit Mai 2026 in Microsoft Foundry verfügbar	Extrem hoher Ressourcenbedarf für Self-Hosting EU-Region auf AWS Bedrock noch nicht bestätigt (US-first Rollout)	Aktuell
DeepSeek-V4-Flash Empfohlen	April 2026	284B Parameter (ca. 13B aktiv – MoE) 1M Token Kontextfenster Open Weights auf HuggingFace Kosteneffiziente Alternative zu V4-Pro Seit Mai 2026 in Microsoft Foundry verfügbar	EU-Region auf AWS Bedrock noch nicht bestätigt	Aktuell
DeepSeek-V3.2	Dezember 2025	Aktuelle Generation Open Source (Model Agreement) Jetzt auf AWS, Azure, Vertex AI verfügbar	Ressourcenintensiv	Aktuell
DeepSeek-V3.1	2025	Stabil Auf AWS Bedrock EU verfügbar	—	Aktuell
DeepSeek-R1	Januar 2025	Reasoning-Fokus MIT-Lizenz	—	Aktuell

Technische Details

API, Features und Capabilities

API & Verfügbarkeit

Verfügbarkeit Public

Latenz (TTFT) ~800ms

Features & Capabilities

Tool Use Function Calling Structured Output Vision Reasoning Mode Datei-Upload

Training & Wissen

Wissensstand 2025 (V4)

Fine-Tuning Verfügbar (LoRA, Full, PEFT)

Sprachunterstützung

Beste Qualität Englisch, Chinesisch

Unterstützt 50+ Sprachen

Beste Qualität in Englisch und Chinesisch, gute Qualität in Deutsch

Hosting & Compliance

DSGVO-konforme Hosting-Optionen und Lizenzierung

DSGVO-konforme Hosting-Optionen

Lizenz & Hosting

Lizenz MIT (Code), Model Agreement (V3), MIT (R1)

Sicherheitsfilter Anpassbar

On-Premise

Update Juni 2026: Seit Mai 2026 sind DeepSeek V4-Flash und V4-Pro auch in Microsoft Foundry verfügbar – damit ist die V4-Generation erstmals über einen Hyperscaler mit EU-Datenresidenz nutzbar. Auf AWS Bedrock sind in EU-Regionen weiterhin V3.1, V3.2 und R1 verfügbar; V4-Pro startet typischerweise zuerst in US-Regionen. innFactory AI Consulting aus Rosenheim berät zu allen Deployment-Optionen.

Update April 2026: DeepSeek hat am 24. April 2026 die V4-Generation veröffentlicht. V4-Flash (284B) und V4-Pro (1,6T Parameter) bieten 1M Token Kontext durch eine neue hybride Attention (Compressed Sparse Attention + Heavily Compressed Attention). Beide Modelle sind als Open Weights auf HuggingFace verfügbar.

DeepSeek V4 - Die neue Generation (April 2026)

DeepSeek hat mit der V4-Generation einen bedeutenden Sprung gemacht:

V4-Flash

284B Parameter total, ca. 13B aktiv (MoE)
1M Token Kontextfenster
Thinking- und Non-Thinking-Modus
API: deepseek-v4-flash
Open Weights auf HuggingFace

V4-Pro

1,6 Billionen Parameter total, ca. 49B aktiv (MoE)
1M Token Kontextfenster – nur 27 % der FLOPs und 10 % des KV-Caches gegenüber V3.2
Thinking- und Non-Thinking-Modus
API: deepseek-v4-pro
80,6 % SWE-Bench (laut DeepSeek)

Hinweis: Die bisherigen API-Namen deepseek-chat und deepseek-reasoner werden am 24. Juli 2026 eingestellt und auf V4-Flash umgeleitet.

Besondere Stärken

Open Source & Lizenzierung

DeepSeek bietet volle Transparenz:

Öffentliche Gewichte: Vollständig auf GitHub/Hugging Face verfügbar
Lizenzierung: R1 unter MIT, V3 unter separatem Model Agreement
Community: Aktive Weiterentwicklung
Anpassbar: Fine-Tuning und Modifikationen möglich

MoE-Architektur

DeepSeek nutzt innovative Mixture-of-Experts:

671B Parameter gesamt, aber nur 37B aktiv pro Anfrage
Effizient: Hohe Leistung bei reduziertem Ressourcenbedarf
Multihead Latent Attention: Neuer Attention-Mechanismus

Reasoning-Fähigkeiten (R1)

DeepSeek-R1 zeigt transparente Denkprozesse:

Chain-of-Thought wird sichtbar gemacht
Besonders stark bei Mathematik und Logik
Vergleichbar mit OpenAI o1

EU-Verfügbarkeit (Update Februar 2026)

DeepSeek ist nun über alle drei großen Cloud-Anbieter in EU-Regionen verfügbar:

AWS Bedrock

Regionen: Frankfurt (eu-central-1), Ireland (eu-west-1)
Modelle: DeepSeek-V3.1, V3.2
Vorteil: Serverless, sofortige Verfügbarkeit

Microsoft Foundry (vormals Azure AI Foundry)

Regionen: West Europe, Sweden Central
Modelle: V3, R1, V4-Flash und V4-Pro (seit Mai 2026)
Vorteil: Integration in Azure-Ökosystem, jetzt mit V4-Generation

Google Vertex AI

Regionen: Frankfurt (europe-west3), Netherlands (europe-west4)
Modelle: V3.2, R1
Vorteil: Vertex AI Model Garden

Self-Hosting

Weiterhin möglich für maximale Kontrolle und vollständige DSGVO-Konformität.

Wichtige Hinweise

Datenschutz-Überlegungen

Update Februar 2026: Mit der Verfügbarkeit auf AWS Bedrock, Azure AI und Google Vertex AI in EU-Regionen können Unternehmen DeepSeek nun DSGVO-konform in der Cloud nutzen!

Cloud-Hosting (EU): Daten bleiben in EU-Regionen bei AWS/Azure/Google
Direkte API: DeepSeek-Server in China (Vorsicht bei sensiblen Daten)
Self-Hosting: Weiterhin die Option mit maximaler Kontrolle

Für Unternehmen: Die Cloud-Provider bieten EU-Datenresidenz mit vollständiger Compliance. Self-Hosting bleibt eine Alternative für höchste Sicherheitsanforderungen.

Self-Hosting als Lösung

Das Open-Source-Modell kann in der eigenen Infrastruktur betrieben werden:

Alle Daten bleiben unter Ihrer Kontrolle
Keine Abhängigkeit von externen APIs
Volle DSGVO-Konformität möglich
Hardware-Anforderungen: Mehrere High-End GPUs (A100/H100)

Preis-Leistung

DeepSeek bietet exzellente Preis-Leistung:

API: Sehr günstige Preise (ca. 90% günstiger als GPT-4)
Self-Hosting: Kostenlos nutzbar (nur Hardware-Kosten)
Keine Lizenzgebühren: R1 unter MIT, V3 unter Model Agreement

Unsere Empfehlung

DeepSeek ist technisch beeindruckend und erreicht Frontier-Niveau bei Reasoning und Coding. Mit der neuen EU-Verfügbarkeit auf AWS, Azure und Google können Unternehmen DeepSeek nun DSGVO-konform nutzen.

Für die meisten Unternehmen empfehlen wir:

Cloud-Option: DeepSeek-V4-Flash über die API oder EU-Cloud-Provider - günstig, leistungsstark, 1M Kontext
Self-Hosting: DeepSeek-V4-Flash oder V3.2 für maximale Kontrolle und Anpassbarkeit

Die Wahl hängt von Ihren Anforderungen an Kontrolle, Compliance und technische Ressourcen ab.

Kostenkalkulation für dieses Modell

Eine aktuelle Übersicht über Token-Preise, Modellvarianten und EU-Verfügbarkeit finden Sie auf unserem Schwesterprojekt ai-prices.eu. Dort lassen sich die laufenden Betriebskosten für Ihren konkreten Anwendungsfall vergleichen und abschätzen.

Preise auf ai-prices.eu vergleichen

ai-prices.eu ist ein Projekt der innFactory AI Consulting GmbH und hilft bei der transparenten Preisabschätzung führender KI-Modelle.

DeepSeek