Zum Hauptinhalt springen
9 – 17 UHR +49 8031 3508270 LUITPOLDSTR. 9, 83022 ROSENHEIM
DE / EN
LLM DeepSeek China

DeepSeek

DeepSeek V4, V3 und R1 - leistungsstarke Open-Source Modelle. V4-Flash & V4-Pro mit 1M Kontext. KI-Beratung Rosenheim berät zu sicherem DeepSeek-Einsatz.

Lizenz MIT (Code), Model Agreement (V3), MIT (R1)
DSGVO-Hosting Verfügbar
Kontext 128K-1M Tokens
Modalität Text, Image, Code → Text, Code

Versionen

Verfügbare Modellvarianten im Überblick

ModellReleaseEUStärkenSchwächenStatus
DeepSeek-V4-Pro
24. April 2026
1,6 Billionen Parameter (ca. 49B aktiv – MoE) 1M Token Kontextfenster (Compressed Sparse Attention + Heavily Compressed Attention) Thinking und Non-Thinking Modus Open Weights auf HuggingFace Seit Mai 2026 in Microsoft Foundry verfügbar
Extrem hoher Ressourcenbedarf für Self-Hosting EU-Region auf AWS Bedrock noch nicht bestätigt (US-first Rollout)
Aktuell
DeepSeek-V4-Flash Empfohlen
April 2026
284B Parameter (ca. 13B aktiv – MoE) 1M Token Kontextfenster Open Weights auf HuggingFace Kosteneffiziente Alternative zu V4-Pro Seit Mai 2026 in Microsoft Foundry verfügbar
EU-Region auf AWS Bedrock noch nicht bestätigt
Aktuell
DeepSeek-V3.2
Dezember 2025
Aktuelle Generation Open Source (Model Agreement) Jetzt auf AWS, Azure, Vertex AI verfügbar
Ressourcenintensiv
Aktuell
DeepSeek-V3.1
2025
Stabil Auf AWS Bedrock EU verfügbar
Aktuell
DeepSeek-R1
Januar 2025
Reasoning-Fokus MIT-Lizenz
Aktuell

Einsatzbereiche

Typische Anwendungsgebiete für dieses Modell

Coding & Softwareentwicklung
Mathematik & Wissenschaft
Reasoning-Aufgaben
Forschung & Entwicklung
Self-Hosted Deployments
Agentic Workflows

Technische Details

API, Features und Capabilities

API & Verfügbarkeit
Verfügbarkeit Public
Latenz (TTFT) ~800ms
Features & Capabilities
Tool Use Function Calling Structured Output Vision Reasoning Mode Datei-Upload
Training & Wissen
Wissensstand 2025 (V4)
Fine-Tuning Verfügbar (LoRA, Full, PEFT)
Sprachunterstützung
Beste Qualität Englisch, Chinesisch
Unterstützt 50+ Sprachen
Beste Qualität in Englisch und Chinesisch, gute Qualität in Deutsch

Hosting & Compliance

DSGVO-konforme Hosting-Optionen und Lizenzierung

DSGVO-konforme Hosting-Optionen
AWS
Frankfurt (eu-central-1)
Amazon Bedrock - V3.1/V3.2 verfügbar
Azure
West Europe
Microsoft Foundry - V3/R1 sowie V4-Flash/V4-Pro (seit Mai 2026)
Google Cloud
Frankfurt (europe-west3)
Vertex AI - V3.2/R1 verfügbar
Self-Hosted
Eigene Infrastruktur
Open Source - volle Kontrolle
Lizenz & Hosting
Lizenz MIT (Code), Model Agreement (V3), MIT (R1)
Sicherheitsfilter Anpassbar
On-Premise

Update Juni 2026: Seit Mai 2026 sind DeepSeek V4-Flash und V4-Pro auch in Microsoft Foundry verfügbar – damit ist die V4-Generation erstmals über einen Hyperscaler mit EU-Datenresidenz nutzbar. Auf AWS Bedrock sind in EU-Regionen weiterhin V3.1, V3.2 und R1 verfügbar; V4-Pro startet typischerweise zuerst in US-Regionen. innFactory AI Consulting aus Rosenheim berät zu allen Deployment-Optionen.

Update April 2026: DeepSeek hat am 24. April 2026 die V4-Generation veröffentlicht. V4-Flash (284B) und V4-Pro (1,6T Parameter) bieten 1M Token Kontext durch eine neue hybride Attention (Compressed Sparse Attention + Heavily Compressed Attention). Beide Modelle sind als Open Weights auf HuggingFace verfügbar.

DeepSeek V4 - Die neue Generation (April 2026)

DeepSeek hat mit der V4-Generation einen bedeutenden Sprung gemacht:

V4-Flash

  • 284B Parameter total, ca. 13B aktiv (MoE)
  • 1M Token Kontextfenster
  • Thinking- und Non-Thinking-Modus
  • API: deepseek-v4-flash
  • Open Weights auf HuggingFace

V4-Pro

  • 1,6 Billionen Parameter total, ca. 49B aktiv (MoE)
  • 1M Token Kontextfenster – nur 27 % der FLOPs und 10 % des KV-Caches gegenüber V3.2
  • Thinking- und Non-Thinking-Modus
  • API: deepseek-v4-pro
  • 80,6 % SWE-Bench (laut DeepSeek)

Hinweis: Die bisherigen API-Namen deepseek-chat und deepseek-reasoner werden am 24. Juli 2026 eingestellt und auf V4-Flash umgeleitet.

Besondere Stärken

Open Source & Lizenzierung

DeepSeek bietet volle Transparenz:

  • Öffentliche Gewichte: Vollständig auf GitHub/Hugging Face verfügbar
  • Lizenzierung: R1 unter MIT, V3 unter separatem Model Agreement
  • Community: Aktive Weiterentwicklung
  • Anpassbar: Fine-Tuning und Modifikationen möglich

MoE-Architektur

DeepSeek nutzt innovative Mixture-of-Experts:

  • 671B Parameter gesamt, aber nur 37B aktiv pro Anfrage
  • Effizient: Hohe Leistung bei reduziertem Ressourcenbedarf
  • Multihead Latent Attention: Neuer Attention-Mechanismus

Reasoning-Fähigkeiten (R1)

DeepSeek-R1 zeigt transparente Denkprozesse:

  • Chain-of-Thought wird sichtbar gemacht
  • Besonders stark bei Mathematik und Logik
  • Vergleichbar mit OpenAI o1

EU-Verfügbarkeit (Update Februar 2026)

DeepSeek ist nun über alle drei großen Cloud-Anbieter in EU-Regionen verfügbar:

AWS Bedrock

  • Regionen: Frankfurt (eu-central-1), Ireland (eu-west-1)
  • Modelle: DeepSeek-V3.1, V3.2
  • Vorteil: Serverless, sofortige Verfügbarkeit

Microsoft Foundry (vormals Azure AI Foundry)

  • Regionen: West Europe, Sweden Central
  • Modelle: V3, R1, V4-Flash und V4-Pro (seit Mai 2026)
  • Vorteil: Integration in Azure-Ökosystem, jetzt mit V4-Generation

Google Vertex AI

  • Regionen: Frankfurt (europe-west3), Netherlands (europe-west4)
  • Modelle: V3.2, R1
  • Vorteil: Vertex AI Model Garden

Self-Hosting

Weiterhin möglich für maximale Kontrolle und vollständige DSGVO-Konformität.

Wichtige Hinweise

Datenschutz-Überlegungen

Update Februar 2026: Mit der Verfügbarkeit auf AWS Bedrock, Azure AI und Google Vertex AI in EU-Regionen können Unternehmen DeepSeek nun DSGVO-konform in der Cloud nutzen!

  • Cloud-Hosting (EU): Daten bleiben in EU-Regionen bei AWS/Azure/Google
  • Direkte API: DeepSeek-Server in China (Vorsicht bei sensiblen Daten)
  • Self-Hosting: Weiterhin die Option mit maximaler Kontrolle

Für Unternehmen: Die Cloud-Provider bieten EU-Datenresidenz mit vollständiger Compliance. Self-Hosting bleibt eine Alternative für höchste Sicherheitsanforderungen.

Self-Hosting als Lösung

Das Open-Source-Modell kann in der eigenen Infrastruktur betrieben werden:

  • Alle Daten bleiben unter Ihrer Kontrolle
  • Keine Abhängigkeit von externen APIs
  • Volle DSGVO-Konformität möglich
  • Hardware-Anforderungen: Mehrere High-End GPUs (A100/H100)

Preis-Leistung

DeepSeek bietet exzellente Preis-Leistung:

  • API: Sehr günstige Preise (ca. 90% günstiger als GPT-4)
  • Self-Hosting: Kostenlos nutzbar (nur Hardware-Kosten)
  • Keine Lizenzgebühren: R1 unter MIT, V3 unter Model Agreement

Unsere Empfehlung

DeepSeek ist technisch beeindruckend und erreicht Frontier-Niveau bei Reasoning und Coding. Mit der neuen EU-Verfügbarkeit auf AWS, Azure und Google können Unternehmen DeepSeek nun DSGVO-konform nutzen.

Für die meisten Unternehmen empfehlen wir:

  • Cloud-Option: DeepSeek-V4-Flash über die API oder EU-Cloud-Provider - günstig, leistungsstark, 1M Kontext
  • Self-Hosting: DeepSeek-V4-Flash oder V3.2 für maximale Kontrolle und Anpassbarkeit

Die Wahl hängt von Ihren Anforderungen an Kontrolle, Compliance und technische Ressourcen ab.

Kostenkalkulation für dieses Modell

Eine aktuelle Übersicht über Token-Preise, Modellvarianten und EU-Verfügbarkeit finden Sie auf unserem Schwesterprojekt ai-prices.eu. Dort lassen sich die laufenden Betriebskosten für Ihren konkreten Anwendungsfall vergleichen und abschätzen.

Preise auf ai-prices.eu vergleichen

ai-prices.eu ist ein Projekt der innFactory AI Consulting GmbH und hilft bei der transparenten Preisabschätzung führender KI-Modelle.

Beratung zu diesem Modell?

Wir helfen Ihnen bei der Auswahl und Integration des richtigen KI-Modells für Ihren Anwendungsfall.