Als KI-Beratung aus Rosenheim empfehlen wir Qwen-Modelle für Unternehmen, die eine Open-Source-Alternative mit Apache 2.0 Lizenz suchen. Mit der Qwen 3.6-Generation (April 2026) setzt Alibaba auf agentic Real-World-Workflows – vom effizienten MoE-Modell bis zum proprietären Flaggschiff. Für den DSGVO-konformen Einsatz im DACH-Raum empfehlen wir Self-Hosting oder AWS Bedrock in Frankfurt.
Qwen 3.6: Agentic Real-World AI (April 2026)
Im April 2026 hat Alibaba die Qwen 3.6-Generation veröffentlicht – mit Fokus auf reale Agenten-Workflows:
Qwen3.6-35B-A3B – Unser neuer Favorit
Das effizienteste Modell der Familie nutzt MoE-Architektur (36B total, nur 3B aktiv) und übertrifft dabei Google Gemma 4 in Benchmarks. Apache 2.0 Lizenz ermöglicht uneingeschränktes Self-Hosting.
Qwen3.6-27B – Dense Alternative
Mit 28 Milliarden Parametern bietet dieses dichte Modell starke Leistung für Anwendungen, die keine MoE-Architektur unterstützen.
Qwen3.6-Plus und Max-Preview
Die proprietären Modelle sind nur über die API verfügbar und zeigen Alibabas strategische Verschiebung hin zu kommerziellen Angeboten. Qwen3.6-Plus fokussiert sich auf Real-World-Agenten – autonome KI, die reale Aufgaben wie App-Steuerung und Dokumentenbearbeitung ausführt.
Hinweis: Mit Qwen 3.6 bietet Alibaba erstmals proprietäre Modelle an, die nicht als Open Source verfügbar sind. Für Self-Hosting empfehlen wir Qwen3.6-35B-A3B (Apache 2.0).
Qwen 3.5: Die nächste Generation
Native Multimodalität
Qwen 3.5 vereint Text, Bild und Video in einer Architektur:
- Video-Analyse: Versteht bis zu 2 Stunden Video in einem Prompt
- Zeitstempel-genau: Identifiziert Ereignisse auf Sekunden-Ebene
- Lange Kontexte: Bis zu 1 Million Token (ganze Bücher, große Codebases)
- Flexible Eingabe: URLs, lokale Dateien, Frame-Sequenzen
Agentic AI & Automatisierung
Qwen 3.5 kann autonome Workflows ausführen:
- App-Interaktion auf Smartphones
- Dokumentenbearbeitung und E-Mail-Verwaltung
- Reisebuchungen und Prozessautomatisierung
- Multi-Step-Tasks mit Tool-Use
Effizienz durch Mixture-of-Experts
Das Qwen3.5-397B-A17B Modell nutzt:
- 397 Milliarden Parameter total
- Nur 17 Milliarden aktiv pro Inferenz
- 60% geringere Kosten als Vorgänger
- 8-19x höherer Durchsatz als Qwen3
Neu: Qwen 3.5 Small Model Serie (März 2026)
Alibaba hat im März 2026 eine neue Serie kompakter Modelle für Edge- und Mobile-Anwendungen veröffentlicht:
| Modell | Parameter | Einsatzbereich |
|---|---|---|
| Qwen3.5-9B | 9 Mrd. | Edge-Server, rivalisiert 30B+ Modelle |
| Qwen3.5-4B | 4 Mrd. | UI-Navigation, Dokumentenanalyse |
| Qwen3.5-2B | 2 Mrd. | Mobile-Geräte |
| Qwen3.5-0.8B | 0,8 Mrd. | IoT, Smartphones |
Alle Small-Modelle sind nativ multimodal und agentenfähig. Sie eignen sich besonders für On-Device-KI, wo Datenschutz durch lokale Verarbeitung gewährleistet wird.
Qwen3.5-Max-Preview
Mit dem Qwen3.5-Max-Preview führt Alibaba die chinesischen KI-Rankings auf LM Arena an und erreicht Platz 5 weltweit im Mathe-Reasoning.
Besondere Stärken
Open Source & Apache 2.0
- Volle Kontrolle: Modell läuft in Ihrer Infrastruktur
- Keine Lizenzkosten: Kommerzielle Nutzung erlaubt
- Anpassbar: Fine-Tuning auf eigene Daten möglich
- DSGVO-freundlich: Keine Daten verlassen Ihr Unternehmen
Erweiterte Mehrsprachigkeit
Qwen 3.5 unterstützt 200+ Sprachen und Dialekte:
- Chinesisch (herausragend)
- Europäische Sprachen (sehr gut)
- Erweiterte Abdeckung: Südasien, Afrika, Ozeanien
- Konkurrenzfähig mit westlichen Modellen
Text-in-Bild-Generierung
Qwen-Image ist führend bei:
- Komplexen Text-Layouts
- Mehrsprachiger Textdarstellung
- Absatz-level Semantik
- Feiner Detailarbeit
Verfügbarkeit
AWS Bedrock (EU)
Qwen3-Modelle sind jetzt auf AWS Bedrock in Frankfurt verfügbar:
- Vollständig verwaltet und serverless
- EU-Datenresidenz (DSGVO-konform)
- Integration mit AWS-Services
- Qwen3-32B, Qwen3-235B, Qwen3-Coder verfügbar
Self-Hosting
Alle Qwen-Modelle können in der eigenen Infrastruktur betrieben werden - damit bleiben alle Daten unter Ihrer Kontrolle.
Benchmarks & Leistung
| Benchmark | Score | Modell |
|---|---|---|
| MMLU | 90.6% | Qwen3-235B VL |
| HumanEval | 93% | Qwen3-32B |
| GSM8K | 79.3% | Qwen3-32B |
| C-Eval (CN) | 85.6% | Qwen3-32B |
Qwen 3.5 konkurriert mit GPT-4-Klasse-Modellen und übertrifft andere Open-Source-Alternativen deutlich.
Hardware-Anforderungen (Self-Hosted)
| Modell | VRAM | Empfohlene GPU |
|---|---|---|
| Qwen3.5-397B-A17B | 80+ GB | H100/MI300X |
| Qwen3-235B-A22B | 48+ GB | A100/H100 |
| Qwen-Image 20B | 48+ GB | A100/H100 |
| Qwen3 (kleinere Varianten) | 16-24 GB | RTX 4090 |
Integration mit CompanyGPT
Qwen-Modelle können in CompanyGPT als Self-Hosted-Option oder via AWS Bedrock integriert werden - volle DSGVO-Konformität garantiert.
Unsere Empfehlung
Qwen 3.6 setzt neue Maßstäbe für agentic AI mit Real-World-Workflows. Für DACH-Unternehmen empfehlen wir:
- Qwen3.6-35B-A3B: Neuer Top-Pick – extrem effizient (3B aktiv), Apache 2.0, übertrifft Gemma 4
- AWS Bedrock Frankfurt: Für verwaltete Lösung mit EU-Datenresidenz
- Self-Hosting: Für maximale Datenkontrolle und Anpassbarkeit
- Qwen3.5-397B-A17B: Für höchste Anforderungen an Multimodalität
