Als KI-Beratung aus Rosenheim empfehlen wir Qwen-Modelle für Unternehmen, die eine Open-Source-Alternative mit Apache 2.0 Lizenz suchen. Mit der Qwen 3.7-Generation (Mai/Juni 2026) liefert Alibaba das neue Flaggschiff mit 1M Kontext und vollwertigen Agenten-Workflows – während Qwen 3.6 weiter die Open-Weight-Linie bedient. Für den DSGVO-konformen Einsatz im DACH-Raum empfehlen wir Self-Hosting oder AWS Bedrock in Frankfurt.
Qwen 3.7: Neues Flaggschiff (Mai/Juni 2026)
Auf dem Apsara Summit in Hangzhou hat Alibaba am 20. Mai 2026 Qwen3.7-Max vorgestellt – das neue, proprietäre Top-Modell der Qwen-Familie. Am 1. Juni 2026 folgte mit Qwen3.7-Plus die multimodale Agent-Variante zu rund einem Sechstel der Token-Kosten.
Qwen3.7-Max
- 1 Million Token Kontextfenster – passend für umfangreiche Agent-Workflows mit langen Dokumenten
- Spitzenwerte (laut Alibaba) auf Terminal-Bench 2.0, SWE-Bench Pro und MCP-Atlas
- Unterstützung für das Anthropic-Protokoll (MCP)
- Verfügbar via Alibaba Cloud Model Studio (proprietär, keine Open Weights)
Qwen3.7-Plus
- Multimodaler Agent (Text, Bild, Video) auf dem Qwen-3.7-Backbone
- Deep Reasoning, Tool Invocation und autonome Iteration über die Bailian-Plattform
- Listenpreis um ~1/6 der Qwen3.7-Max-Kosten – attraktiv für vision-lastige Agenten-Workloads
- Zuerst als Preview auf LM Arena (ca. 14. Mai 2026), GA am 1. Juni 2026
Hinweis: Qwen 3.7 ist (Stand Juni 2026) ausschließlich API-only über Alibaba Cloud verfügbar. Für Self-Hosting bleibt Qwen3.6-35B-A3B (Apache 2.0) unsere Empfehlung.
Qwen 3.6: Agentic Real-World AI (April 2026)
Im April 2026 hat Alibaba die Qwen 3.6-Generation veröffentlicht – mit Fokus auf reale Agenten-Workflows:
Qwen3.6-35B-A3B – Unser neuer Favorit
Das effizienteste Modell der Familie nutzt MoE-Architektur (36B total, nur 3B aktiv) und übertrifft dabei Google Gemma 4 in Benchmarks. Apache 2.0 Lizenz ermöglicht uneingeschränktes Self-Hosting.
Qwen3.6-27B – Dense Alternative
Mit 28 Milliarden Parametern bietet dieses dichte Modell starke Leistung für Anwendungen, die keine MoE-Architektur unterstützen.
Qwen3.6-Plus und Max-Preview
Die proprietären Modelle sind nur über die API verfügbar und zeigen Alibabas strategische Verschiebung hin zu kommerziellen Angeboten. Qwen3.6-Plus fokussiert sich auf Real-World-Agenten – autonome KI, die reale Aufgaben wie App-Steuerung und Dokumentenbearbeitung ausführt.
Hinweis: Mit Qwen 3.6 bietet Alibaba erstmals proprietäre Modelle an, die nicht als Open Source verfügbar sind. Für Self-Hosting empfehlen wir Qwen3.6-35B-A3B (Apache 2.0).
Qwen 3.5: Die nächste Generation
Native Multimodalität
Qwen 3.5 vereint Text, Bild und Video in einer Architektur:
- Video-Analyse: Versteht bis zu 2 Stunden Video in einem Prompt
- Zeitstempel-genau: Identifiziert Ereignisse auf Sekunden-Ebene
- Lange Kontexte: Bis zu 1 Million Token (ganze Bücher, große Codebases)
- Flexible Eingabe: URLs, lokale Dateien, Frame-Sequenzen
Agentic AI & Automatisierung
Qwen 3.5 kann autonome Workflows ausführen:
- App-Interaktion auf Smartphones
- Dokumentenbearbeitung und E-Mail-Verwaltung
- Reisebuchungen und Prozessautomatisierung
- Multi-Step-Tasks mit Tool-Use
Effizienz durch Mixture-of-Experts
Das Qwen3.5-397B-A17B Modell nutzt:
- 397 Milliarden Parameter total
- Nur 17 Milliarden aktiv pro Inferenz
- 60% geringere Kosten als Vorgänger
- 8-19x höherer Durchsatz als Qwen3
Neu: Qwen 3.5 Small Model Serie (März 2026)
Alibaba hat im März 2026 eine neue Serie kompakter Modelle für Edge- und Mobile-Anwendungen veröffentlicht:
| Modell | Parameter | Einsatzbereich |
|---|---|---|
| Qwen3.5-9B | 9 Mrd. | Edge-Server, rivalisiert 30B+ Modelle |
| Qwen3.5-4B | 4 Mrd. | UI-Navigation, Dokumentenanalyse |
| Qwen3.5-2B | 2 Mrd. | Mobile-Geräte |
| Qwen3.5-0.8B | 0,8 Mrd. | IoT, Smartphones |
Alle Small-Modelle sind nativ multimodal und agentenfähig. Sie eignen sich besonders für On-Device-KI, wo Datenschutz durch lokale Verarbeitung gewährleistet wird.
Qwen3.5-Max-Preview
Mit dem Qwen3.5-Max-Preview führt Alibaba die chinesischen KI-Rankings auf LM Arena an und erreicht Platz 5 weltweit im Mathe-Reasoning.
Besondere Stärken
Open Source & Apache 2.0
- Volle Kontrolle: Modell läuft in Ihrer Infrastruktur
- Keine Lizenzkosten: Kommerzielle Nutzung erlaubt
- Anpassbar: Fine-Tuning auf eigene Daten möglich
- DSGVO-freundlich: Keine Daten verlassen Ihr Unternehmen
Erweiterte Mehrsprachigkeit
Qwen 3.5 unterstützt 200+ Sprachen und Dialekte:
- Chinesisch (herausragend)
- Europäische Sprachen (sehr gut)
- Erweiterte Abdeckung: Südasien, Afrika, Ozeanien
- Konkurrenzfähig mit westlichen Modellen
Text-in-Bild-Generierung
Qwen-Image ist führend bei:
- Komplexen Text-Layouts
- Mehrsprachiger Textdarstellung
- Absatz-level Semantik
- Feiner Detailarbeit
Verfügbarkeit
AWS Bedrock (EU)
Qwen3-Modelle sind jetzt auf AWS Bedrock in Frankfurt verfügbar:
- Vollständig verwaltet und serverless
- EU-Datenresidenz (DSGVO-konform)
- Integration mit AWS-Services
- Qwen3-32B, Qwen3-235B, Qwen3-Coder verfügbar
Self-Hosting
Alle Qwen-Modelle können in der eigenen Infrastruktur betrieben werden - damit bleiben alle Daten unter Ihrer Kontrolle.
Benchmarks & Leistung
| Benchmark | Score | Modell |
|---|---|---|
| MMLU | 90.6% | Qwen3-235B VL |
| HumanEval | 93% | Qwen3-32B |
| GSM8K | 79.3% | Qwen3-32B |
| C-Eval (CN) | 85.6% | Qwen3-32B |
Qwen 3.5 konkurriert mit GPT-4-Klasse-Modellen und übertrifft andere Open-Source-Alternativen deutlich.
Hardware-Anforderungen (Self-Hosted)
| Modell | VRAM | Empfohlene GPU |
|---|---|---|
| Qwen3.5-397B-A17B | 80+ GB | H100/MI300X |
| Qwen3-235B-A22B | 48+ GB | A100/H100 |
| Qwen-Image 20B | 48+ GB | A100/H100 |
| Qwen3 (kleinere Varianten) | 16-24 GB | RTX 4090 |
Integration mit CompanyGPT
Qwen-Modelle können in CompanyGPT als Self-Hosted-Option oder via AWS Bedrock integriert werden - volle DSGVO-Konformität garantiert.
Unsere Empfehlung
Mit Qwen 3.7 liefert Alibaba ein neues proprietäres Flaggschiff mit 1M Kontext und Agenten-Stack. Open-Source-seitig bleibt Qwen 3.6 das Maß der Dinge. Für DACH-Unternehmen empfehlen wir:
- Qwen3.6-35B-A3B: Top-Pick für Self-Hosting – extrem effizient (3B aktiv), Apache 2.0, übertrifft Gemma 4
- Qwen3.7-Max / Plus: Für maximale Agent-Leistung und 1M Kontext – nur via Alibaba Cloud Model Studio
- AWS Bedrock Frankfurt: Für verwaltete Qwen3-Modelle mit EU-Datenresidenz
- Self-Hosting: Für maximale Datenkontrolle und Anpassbarkeit
- Qwen3.5-397B-A17B: Für höchste Anforderungen an offene Multimodalität
