Als KI-Beratung aus Rosenheim empfehlen wir Qwen-Modelle für Unternehmen, die eine Open-Source-Alternative mit Apache 2.0 Lizenz suchen. Mit der Qwen 3.7-Generation (Mai/Juni 2026) liefert Alibaba das neue Flaggschiff mit 1M Kontext und vollwertigen Agenten-Workflows – während Qwen 3.6 weiter die Open-Weight-Linie bedient. Für den DSGVO-konformen Einsatz im DACH-Raum empfehlen wir Self-Hosting oder AWS Bedrock in Frankfurt.

Qwen 3.7: Neues Flaggschiff (Mai/Juni 2026)

Auf dem Apsara Summit in Hangzhou hat Alibaba am 20. Mai 2026 Qwen3.7-Max vorgestellt – das neue, proprietäre Top-Modell der Qwen-Familie. Am 1. Juni 2026 folgte mit Qwen3.7-Plus die multimodale Agent-Variante zu rund einem Sechstel der Token-Kosten.

Qwen3.7-Max

1 Million Token Kontextfenster – passend für umfangreiche Agent-Workflows mit langen Dokumenten
Spitzenwerte (laut Alibaba) auf Terminal-Bench 2.0, SWE-Bench Pro und MCP-Atlas
Unterstützung für das Anthropic-Protokoll (MCP)
Verfügbar via Alibaba Cloud Model Studio (proprietär, keine Open Weights)

Qwen3.7-Plus

Multimodaler Agent (Text, Bild, Video) auf dem Qwen-3.7-Backbone
Deep Reasoning, Tool Invocation und autonome Iteration über die Bailian-Plattform
Listenpreis um ~1/6 der Qwen3.7-Max-Kosten – attraktiv für vision-lastige Agenten-Workloads
Zuerst als Preview auf LM Arena (ca. 14. Mai 2026), GA am 1. Juni 2026

Hinweis: Qwen 3.7 ist (Stand Juni 2026) ausschließlich API-only über Alibaba Cloud verfügbar. Für Self-Hosting bleibt Qwen3.6-35B-A3B (Apache 2.0) unsere Empfehlung.

Qwen 3.6: Agentic Real-World AI (April 2026)

Im April 2026 hat Alibaba die Qwen 3.6-Generation veröffentlicht – mit Fokus auf reale Agenten-Workflows:

Qwen3.6-35B-A3B – Unser neuer Favorit

Das effizienteste Modell der Familie nutzt MoE-Architektur (36B total, nur 3B aktiv) und übertrifft dabei Google Gemma 4 in Benchmarks. Apache 2.0 Lizenz ermöglicht uneingeschränktes Self-Hosting.

Qwen3.6-27B – Dense Alternative

Mit 28 Milliarden Parametern bietet dieses dichte Modell starke Leistung für Anwendungen, die keine MoE-Architektur unterstützen.

Qwen3.6-Plus und Max-Preview

Die proprietären Modelle sind nur über die API verfügbar und zeigen Alibabas strategische Verschiebung hin zu kommerziellen Angeboten. Qwen3.6-Plus fokussiert sich auf Real-World-Agenten – autonome KI, die reale Aufgaben wie App-Steuerung und Dokumentenbearbeitung ausführt.

Hinweis: Mit Qwen 3.6 bietet Alibaba erstmals proprietäre Modelle an, die nicht als Open Source verfügbar sind. Für Self-Hosting empfehlen wir Qwen3.6-35B-A3B (Apache 2.0).

Qwen-Agent & agentische Qwen-Workflows

Neben den Modellen selbst pflegt das Qwen-Team mit Qwen-Agent (github.com/QwenLM/Qwen-Agent) ein quelloffenes Framework zum Bau von KI-Agenten auf Basis der Qwen-Modelle (ab Qwen 3.0). Es kapselt die typischen Bausteine produktiver Agenten und nimmt Entwicklern den Großteil des Boilerplate-Codes ab:

Function Calling / Tool-Use: native Unterstützung für parallele, mehrstufige und mehrschrittige Tool-Aufrufe inklusive automatischem Parsing und Ausführung
MCP-Integration: Anbindung externer Tools und Datenquellen (z. B. GitHub, Dateisystem, SQLite) über den offenen Model-Context-Protocol-Standard (MCP)
Code Interpreter: Ausführung von Python-Code in einer isolierten Docker-Sandbox
RAG über lange Kontexte: Dokumenten-QA über 1M+ Token mittels hybridem RAG und agentenbasierter Zerlegung
BrowserQwen: ein Browser-Assistent samt Chrome-Erweiterung als Referenzimplementierung

Das Framework unterstützt u. a. Qwen3, Qwen3-VL, Qwen3-Omni, Qwen3-Coder und QwQ und lässt sich sowohl über die Alibaba-Cloud-API als auch gegen lokale, OpenAI-kompatible Server (vLLM, SGLang) betreiben.

Auf Modellseite treibt Alibaba die agentische Ausrichtung konsequent voran. Qwen3.7-Max wird ausdrücklich als „Agent Frontier" positioniert: Alibaba demonstriert (Stand Juni 2026) lange autonome Läufe – etwa eine 35-stündige Kernel-Optimierung mit über 1.000 Tool-Aufrufen – und meldet Spitzenwerte auf Tool-Use-Benchmarks wie MCP-Mark und Terminal-Bench 2.0. Das Modell fungiert laut Hersteller als austauschbares Backbone für Agent-Frameworks (u. a. Claude Code, Qwen Code, OpenClaw) und unterstützt MCP. Open-Weight-seitig zielt Qwen3.6-35B-A3B explizit auf agentisches Coding und arbeitet z. B. mit dem quelloffenen Terminal-Agenten OpenClaw zusammen.

Souveränität & DSGVO: Den saubersten Weg für agentische Qwen-Workflows im DACH-Raum bietet die Kombination aus offenen Qwen-Gewichten (z. B. Qwen3.6-35B-A3B, Apache 2.0) plus Qwen-Agent, vollständig selbst gehostet auf EU-Infrastruktur – so verlassen weder Prompts noch Tool-Daten Ihr Unternehmen. Managed-Optionen sind Qwen3-Modelle über AWS Bedrock (Frankfurt) oder Azure AI Foundry. Die neuesten geschlossenen Flaggschiffe (Qwen 3.7-Max/Plus) sind dagegen (Stand Juni 2026) API-only über Alibaba Cloud – hier ist die Datenschutz-Lage gesondert zu prüfen.

Qwen 3.5: Die nächste Generation

Native Multimodalität

Qwen 3.5 vereint Text, Bild und Video in einer Architektur:

Video-Analyse: Versteht bis zu 2 Stunden Video in einem Prompt
Zeitstempel-genau: Identifiziert Ereignisse auf Sekunden-Ebene
Lange Kontexte: Bis zu 1 Million Token (ganze Bücher, große Codebases)
Flexible Eingabe: URLs, lokale Dateien, Frame-Sequenzen

Agentic AI & Automatisierung

Qwen 3.5 kann autonome Workflows ausführen:

App-Interaktion auf Smartphones
Dokumentenbearbeitung und E-Mail-Verwaltung
Reisebuchungen und Prozessautomatisierung
Multi-Step-Tasks mit Tool-Use

Effizienz durch Mixture-of-Experts

Das Qwen3.5-397B-A17B Modell nutzt:

397 Milliarden Parameter total
Nur 17 Milliarden aktiv pro Inferenz
60% geringere Kosten als Vorgänger
8-19x höherer Durchsatz als Qwen3

Neu: Qwen 3.5 Small Model Serie (März 2026)

Alibaba hat im März 2026 eine neue Serie kompakter Modelle für Edge- und Mobile-Anwendungen veröffentlicht:

Modell	Parameter	Einsatzbereich
Qwen3.5-9B	9 Mrd.	Edge-Server, rivalisiert 30B+ Modelle
Qwen3.5-4B	4 Mrd.	UI-Navigation, Dokumentenanalyse
Qwen3.5-2B	2 Mrd.	Mobile-Geräte
Qwen3.5-0.8B	0,8 Mrd.	IoT, Smartphones

Alle Small-Modelle sind nativ multimodal und agentenfähig. Sie eignen sich besonders für On-Device-KI, wo Datenschutz durch lokale Verarbeitung gewährleistet wird.

Qwen3.5-Max-Preview

Mit dem Qwen3.5-Max-Preview führt Alibaba die chinesischen KI-Rankings auf LM Arena an und erreicht Platz 5 weltweit im Mathe-Reasoning.

Besondere Stärken

Open Source & Apache 2.0

Volle Kontrolle: Modell läuft in Ihrer Infrastruktur
Keine Lizenzkosten: Kommerzielle Nutzung erlaubt
Anpassbar: Fine-Tuning auf eigene Daten möglich
DSGVO-freundlich: Keine Daten verlassen Ihr Unternehmen

Erweiterte Mehrsprachigkeit

Qwen 3.5 unterstützt 200+ Sprachen und Dialekte:

Chinesisch (herausragend)
Europäische Sprachen (sehr gut)
Erweiterte Abdeckung: Südasien, Afrika, Ozeanien
Konkurrenzfähig mit westlichen Modellen

Text-in-Bild-Generierung

Qwen-Image ist führend bei:

Komplexen Text-Layouts
Mehrsprachiger Textdarstellung
Absatz-level Semantik
Feiner Detailarbeit

Verfügbarkeit

AWS Bedrock (EU)

Qwen3-Modelle sind jetzt auf AWS Bedrock in Frankfurt verfügbar:

Vollständig verwaltet und serverless
EU-Datenresidenz (DSGVO-konform)
Integration mit AWS-Services
Qwen3-32B, Qwen3-235B, Qwen3-Coder verfügbar

Self-Hosting

Alle Qwen-Modelle können in der eigenen Infrastruktur betrieben werden - damit bleiben alle Daten unter Ihrer Kontrolle.

Benchmarks & Leistung

Benchmark	Score	Modell
MMLU	90.6%	Qwen3-235B VL
HumanEval	93%	Qwen3-32B
GSM8K	79.3%	Qwen3-32B
C-Eval (CN)	85.6%	Qwen3-32B

Qwen 3.5 konkurriert mit GPT-4-Klasse-Modellen und übertrifft andere Open-Source-Alternativen deutlich.

Hardware-Anforderungen (Self-Hosted)

Modell	VRAM	Empfohlene GPU
Qwen3.5-397B-A17B	80+ GB	H100/MI300X
Qwen3-235B-A22B	48+ GB	A100/H100
Qwen-Image 20B	48+ GB	A100/H100
Qwen3 (kleinere Varianten)	16-24 GB	RTX 4090

Integration mit CompanyGPT

Qwen-Modelle können in CompanyGPT als Self-Hosted-Option oder via AWS Bedrock integriert werden - volle DSGVO-Konformität garantiert.

Unsere Empfehlung

Mit Qwen 3.7 liefert Alibaba ein neues proprietäres Flaggschiff mit 1M Kontext und Agenten-Stack. Open-Source-seitig bleibt Qwen 3.6 das Maß der Dinge. Für DACH-Unternehmen empfehlen wir:

Qwen3.6-35B-A3B: Top-Pick für Self-Hosting – extrem effizient (3B aktiv), Apache 2.0, übertrifft Gemma 4
Qwen3.7-Max / Plus: Für maximale Agent-Leistung und 1M Kontext – nur via Alibaba Cloud Model Studio
AWS Bedrock Frankfurt: Für verwaltete Qwen3-Modelle mit EU-Datenresidenz
Self-Hosting: Für maximale Datenkontrolle und Anpassbarkeit
Qwen3.5-397B-A17B: Für höchste Anforderungen an offene Multimodalität

Modell	Release	Stärken	Schwächen	Status
Qwen3.7-Plus	1. Juni 2026	Multimodaler Agent (Text, Bild, Video) 1M Token Kontextfenster Deep Reasoning, Tool Invocation, autonome Iteration Sehr günstig pro Token	Proprietär, keine Open Weights API-only via Alibaba Cloud Bailian / Model Studio	Aktuell
Qwen3.7-Max	20. Mai 2026	Neues Qwen-Flaggschiff, präsentiert auf dem Apsara Summit Hangzhou 1M Token Kontextfenster Spitzenwerte auf Terminal-Bench 2.0, SWE-Bench Pro und MCP-Atlas (laut Alibaba) Unterstützt das Anthropic-Protokoll (MCP)	Proprietär, keine Open Weights API-only via Alibaba Cloud Model Studio	Aktuell
Qwen3.6-Max-Preview	20. April 2026	Stärkstes Qwen-Modell (proprietär, geschlossene Gewichte) Spitze in sechs agentic Coding-Benchmarks (laut Alibaba) Multimodal (Text + Bild)	Preview-Status Erstmals in Qwens Historie keine Open Weights – nur über Alibaba Cloud Model Studio	Aktuell
Qwen3.6-Plus	2026-04	Fokus auf Real-World-Agenten Multimodal	Proprietär, nicht Open Source	Aktuell
Qwen3.6-27B	2026-04	28B Dense-Modell Open Weights Multimodal (Text + Bild)	Hoher Ressourcenbedarf für 27B-Klasse	Aktuell
Qwen3.6-35B-A3B Empfohlen	2026-04	MoE: 36B total, nur 3B aktiv – extrem effizient Apache 2.0 Lizenz Multimodal Übertrifft Google Gemma 4 in Benchmarks	—	Aktuell
Qwen3.5-397B-A17B	16. Februar 2026	Flaggschiff (MoE, 17B aktiv) Native Multimodalität (Text, Bild, Video) Bis 1M Kontext Agentic AI Workflows #5 weltweit in Mathe-Reasoning (LM Arena)	Hoher Ressourcenbedarf	Aktuell
Qwen3.5-Max-Preview	2026-03	Führendes chinesisches Modell auf LM Arena #5 global im Mathe-Reasoning	Preview-Status	Aktuell
Qwen3.5-9B	2026-03	Starkes logisches Reasoning Rivalisiert 30B+ Modelle Nativ multimodal Ideal für Edge-Server	Begrenzt bei sehr komplexen Aufgaben	Aktuell
Qwen3.5-4B	2026-03	Nativer multimodaler Agent UI-Navigation und Dokumentenanalyse Kompakt und effizient	Begrenzte Kapazität	Aktuell
Qwen3.5-2B	2026-03	Für Mobile und Edge optimiert Nativ multimodal	Begrenzte Kapazität	Aktuell
Qwen3.5-0.8B	2026-03	Ultra-kompakt für IoT und Smartphones Nativ multimodal	Stark begrenzte Kapazität	Aktuell
Qwen3-235B-A22B	2025	Starkes Vorgängermodell (MoE, 22B aktiv) Open Weights Bis 1M Kontext (Konfiguration)	Hoher Ressourcenbedarf	Aktuell
Qwen3-32B	2025	Allround-Modell Open Weights	—	Aktuell
Qwen3-Coder	August 2025	Spezialisiert auf Software-Engineering Open Weights, Apache 2.0	Coding-Spezialmodell	Aktuell
QwQ-32B	März 2025	Reasoning-Spezialmodell (Chain-of-Thought) 32B Parameter, Open Weights	Höhere Latenz durch Reasoning-Modus	Aktuell

Alibaba Qwen

Versionen

Einsatzbereiche

Technische Details

Hosting & Compliance

Benchmarks