Zum Hauptinhalt springen
9 – 17 UHR +49 8031 3508270 LUITPOLDSTR. 9, 83022 ROSENHEIM
DE / EN
LLM Alibaba China

Alibaba Qwen

Alibaba Qwen 3.6 - Agentic Real-World AI mit MoE-Effizienz. Qwen3.6-35B-A3B als neuer Favorit (Apache 2.0). KI-Beratung Rosenheim für DSGVO-konformes Self-Hosting.

Lizenz Apache 2.0
DSGVO-Hosting Verfügbar
Kontext 128k (Standard), bis 1M (Qwen3.5-397B-A17B) Tokens
Modalität Text, Image, Video → Text, Image

Versionen

Verfügbare Modellvarianten im Überblick

ModellReleaseEUStärkenSchwächenStatus
Qwen3.6-Max-Preview
2026-04
Stärkstes Qwen-Modell (proprietär) Multimodal (Text + Bild) Agentic Real-World-Workflows
Preview-Status Nur über API, nicht Open Source
Aktuell
Qwen3.6-Plus
2026-04
Fokus auf Real-World-Agenten Multimodal
Proprietär, nicht Open Source
Aktuell
Qwen3.6-27B
2026-04
28B Dense-Modell Open Weights Multimodal (Text + Bild)
Hoher Ressourcenbedarf für 27B-Klasse
Aktuell
Qwen3.6-35B-A3B Empfohlen
2026-04
MoE: 36B total, nur 3B aktiv – extrem effizient Apache 2.0 Lizenz Multimodal Übertrifft Google Gemma 4 in Benchmarks
Aktuell
Qwen3.5-397B-A17B
2026-02
Flaggschiff (MoE, 17B aktiv) Native Multimodalität (Text, Bild, Video) Bis 1M Kontext Agentic AI Workflows #5 weltweit in Mathe-Reasoning (LM Arena)
Hoher Ressourcenbedarf
Aktuell
Qwen3.5-Max-Preview
2026-03
Führendes chinesisches Modell auf LM Arena #5 global im Mathe-Reasoning
Preview-Status
Aktuell
Qwen3.5-9B
2026-03
Starkes logisches Reasoning Rivalisiert 30B+ Modelle Nativ multimodal Ideal für Edge-Server
Begrenzt bei sehr komplexen Aufgaben
Aktuell
Qwen3.5-4B
2026-03
Nativer multimodaler Agent UI-Navigation und Dokumentenanalyse Kompakt und effizient
Begrenzte Kapazität
Aktuell
Qwen3.5-2B
2026-03
Für Mobile und Edge optimiert Nativ multimodal
Begrenzte Kapazität
Aktuell
Qwen3.5-0.8B
2026-03
Ultra-kompakt für IoT und Smartphones Nativ multimodal
Stark begrenzte Kapazität
Aktuell
Qwen3-235B-A22B
2025
Starkes Vorgängermodell (MoE, 22B aktiv) Open Weights Bis 1M Kontext (Konfiguration)
Hoher Ressourcenbedarf
Aktuell
Qwen3-32B
2025
Allround-Modell Open Weights
Aktuell

Einsatzbereiche

Typische Anwendungsgebiete für dieses Modell

Mehrsprachige Kommunikation
Video-Analyse und Zusammenfassung
Bildgenerierung mit Text
Self-Hosted AI
Agentic Workflows & Automation
Internationale Teams (Asien-Europa)
Content-Erstellung
Safety & Moderation
Übersetzung

Technische Details

API, Features und Capabilities

API & Verfügbarkeit
Verfügbarkeit Public
Latenz (TTFT) Variiert (Self-Hosted)
Features & Capabilities
Tool Use Function Calling Structured Output Vision Reasoning Mode Datei-Upload
Training & Wissen
Wissensstand 2025-12
Fine-Tuning Verfügbar (LoRA, Full, PEFT)
Sprachunterstützung
Beste Qualität Chinesisch, Englisch, Deutsch
Unterstützt 200+ Sprachen und Dialekte (Qwen3.5)
Herausragend in Chinesisch, sehr gut in europaeischen Sprachen, erweiterte Abdeckung für Südasien, Afrika und Ozeanien

Hosting & Compliance

DSGVO-konforme Hosting-Optionen und Lizenzierung

DSGVO-konforme Hosting-Optionen
Self-Hosted
Eigene Infrastruktur
Empfohlen für Unternehmensdaten
AWS Bedrock
Frankfurt (eu-central-1)
Qwen3-Modelle verfügbar
Alibaba Cloud
Frankfurt (eu-central-1)
Alibaba Cloud EU - Datenschutz prüfen
Lizenz & Hosting
Lizenz Apache 2.0
Sicherheitsfilter Anpassbar (Qwen3Guard)
On-Premise Edge-fähig

Benchmarks

Leistungsvergleich mit standardisierten Tests

MMLU
90.6%
HumanEval
93%
GSM8K
79.3%
C-Eval
85.6%

Als KI-Beratung aus Rosenheim empfehlen wir Qwen-Modelle für Unternehmen, die eine Open-Source-Alternative mit Apache 2.0 Lizenz suchen. Mit der Qwen 3.6-Generation (April 2026) setzt Alibaba auf agentic Real-World-Workflows – vom effizienten MoE-Modell bis zum proprietären Flaggschiff. Für den DSGVO-konformen Einsatz im DACH-Raum empfehlen wir Self-Hosting oder AWS Bedrock in Frankfurt.

Qwen 3.6: Agentic Real-World AI (April 2026)

Im April 2026 hat Alibaba die Qwen 3.6-Generation veröffentlicht – mit Fokus auf reale Agenten-Workflows:

Qwen3.6-35B-A3B – Unser neuer Favorit

Das effizienteste Modell der Familie nutzt MoE-Architektur (36B total, nur 3B aktiv) und übertrifft dabei Google Gemma 4 in Benchmarks. Apache 2.0 Lizenz ermöglicht uneingeschränktes Self-Hosting.

Qwen3.6-27B – Dense Alternative

Mit 28 Milliarden Parametern bietet dieses dichte Modell starke Leistung für Anwendungen, die keine MoE-Architektur unterstützen.

Qwen3.6-Plus und Max-Preview

Die proprietären Modelle sind nur über die API verfügbar und zeigen Alibabas strategische Verschiebung hin zu kommerziellen Angeboten. Qwen3.6-Plus fokussiert sich auf Real-World-Agenten – autonome KI, die reale Aufgaben wie App-Steuerung und Dokumentenbearbeitung ausführt.

Hinweis: Mit Qwen 3.6 bietet Alibaba erstmals proprietäre Modelle an, die nicht als Open Source verfügbar sind. Für Self-Hosting empfehlen wir Qwen3.6-35B-A3B (Apache 2.0).

Qwen 3.5: Die nächste Generation

Native Multimodalität

Qwen 3.5 vereint Text, Bild und Video in einer Architektur:

  • Video-Analyse: Versteht bis zu 2 Stunden Video in einem Prompt
  • Zeitstempel-genau: Identifiziert Ereignisse auf Sekunden-Ebene
  • Lange Kontexte: Bis zu 1 Million Token (ganze Bücher, große Codebases)
  • Flexible Eingabe: URLs, lokale Dateien, Frame-Sequenzen

Agentic AI & Automatisierung

Qwen 3.5 kann autonome Workflows ausführen:

  • App-Interaktion auf Smartphones
  • Dokumentenbearbeitung und E-Mail-Verwaltung
  • Reisebuchungen und Prozessautomatisierung
  • Multi-Step-Tasks mit Tool-Use

Effizienz durch Mixture-of-Experts

Das Qwen3.5-397B-A17B Modell nutzt:

  • 397 Milliarden Parameter total
  • Nur 17 Milliarden aktiv pro Inferenz
  • 60% geringere Kosten als Vorgänger
  • 8-19x höherer Durchsatz als Qwen3

Neu: Qwen 3.5 Small Model Serie (März 2026)

Alibaba hat im März 2026 eine neue Serie kompakter Modelle für Edge- und Mobile-Anwendungen veröffentlicht:

ModellParameterEinsatzbereich
Qwen3.5-9B9 Mrd.Edge-Server, rivalisiert 30B+ Modelle
Qwen3.5-4B4 Mrd.UI-Navigation, Dokumentenanalyse
Qwen3.5-2B2 Mrd.Mobile-Geräte
Qwen3.5-0.8B0,8 Mrd.IoT, Smartphones

Alle Small-Modelle sind nativ multimodal und agentenfähig. Sie eignen sich besonders für On-Device-KI, wo Datenschutz durch lokale Verarbeitung gewährleistet wird.

Qwen3.5-Max-Preview

Mit dem Qwen3.5-Max-Preview führt Alibaba die chinesischen KI-Rankings auf LM Arena an und erreicht Platz 5 weltweit im Mathe-Reasoning.

Besondere Stärken

Open Source & Apache 2.0

  • Volle Kontrolle: Modell läuft in Ihrer Infrastruktur
  • Keine Lizenzkosten: Kommerzielle Nutzung erlaubt
  • Anpassbar: Fine-Tuning auf eigene Daten möglich
  • DSGVO-freundlich: Keine Daten verlassen Ihr Unternehmen

Erweiterte Mehrsprachigkeit

Qwen 3.5 unterstützt 200+ Sprachen und Dialekte:

  • Chinesisch (herausragend)
  • Europäische Sprachen (sehr gut)
  • Erweiterte Abdeckung: Südasien, Afrika, Ozeanien
  • Konkurrenzfähig mit westlichen Modellen

Text-in-Bild-Generierung

Qwen-Image ist führend bei:

  • Komplexen Text-Layouts
  • Mehrsprachiger Textdarstellung
  • Absatz-level Semantik
  • Feiner Detailarbeit

Verfügbarkeit

AWS Bedrock (EU)

Qwen3-Modelle sind jetzt auf AWS Bedrock in Frankfurt verfügbar:

  • Vollständig verwaltet und serverless
  • EU-Datenresidenz (DSGVO-konform)
  • Integration mit AWS-Services
  • Qwen3-32B, Qwen3-235B, Qwen3-Coder verfügbar

Self-Hosting

Alle Qwen-Modelle können in der eigenen Infrastruktur betrieben werden - damit bleiben alle Daten unter Ihrer Kontrolle.

Benchmarks & Leistung

BenchmarkScoreModell
MMLU90.6%Qwen3-235B VL
HumanEval93%Qwen3-32B
GSM8K79.3%Qwen3-32B
C-Eval (CN)85.6%Qwen3-32B

Qwen 3.5 konkurriert mit GPT-4-Klasse-Modellen und übertrifft andere Open-Source-Alternativen deutlich.

Hardware-Anforderungen (Self-Hosted)

ModellVRAMEmpfohlene GPU
Qwen3.5-397B-A17B80+ GBH100/MI300X
Qwen3-235B-A22B48+ GBA100/H100
Qwen-Image 20B48+ GBA100/H100
Qwen3 (kleinere Varianten)16-24 GBRTX 4090

Integration mit CompanyGPT

Qwen-Modelle können in CompanyGPT als Self-Hosted-Option oder via AWS Bedrock integriert werden - volle DSGVO-Konformität garantiert.

Unsere Empfehlung

Qwen 3.6 setzt neue Maßstäbe für agentic AI mit Real-World-Workflows. Für DACH-Unternehmen empfehlen wir:

  • Qwen3.6-35B-A3B: Neuer Top-Pick – extrem effizient (3B aktiv), Apache 2.0, übertrifft Gemma 4
  • AWS Bedrock Frankfurt: Für verwaltete Lösung mit EU-Datenresidenz
  • Self-Hosting: Für maximale Datenkontrolle und Anpassbarkeit
  • Qwen3.5-397B-A17B: Für höchste Anforderungen an Multimodalität

Beratung zu diesem Modell?

Wir helfen Ihnen bei der Auswahl und Integration des richtigen KI-Modells für Ihren Anwendungsfall.