Versionen

Verfügbare Modellvarianten im Überblick

Modell	Release	Stärken	Schwächen	Status
MAI-Thinking-1 Empfohlen	2. Juni 2026	Erstes vollständig hauseigenes Microsoft-Reasoning-Modell (ohne OpenAI-Distillation) Sparse Mixture-of-Experts mit 35B aktiven Parametern 256k Kontextfenster 97,0 % AIME 2025, 94,5 % AIME 2026 Auf SWE-Bench Pro auf Augenhöhe mit Claude Opus 4.6 Auf kommerziell lizenzierten Daten trainiert	Neu – noch wenig Praxiserfahrung im Enterprise-Einsatz Nicht Open Source	Aktuell
MAI-Code-1-Flash Empfohlen	2. Juni 2026	5B Parameter Coding-Modell – schnell und günstig Schlägt Claude Haiku 4.5 auf allen vier getesteten Coding-Benchmarks 16 Punkte Vorsprung auf SWE-Bench Pro (51,2 % vs. 35,2 %) Direkt in GitHub Copilot (Free, Pro, Pro+, Max) integriert	Spezialisiert auf Coding – kein Allzweck-Modell Nicht Open Source	Aktuell
Phi-4-reasoning-vision-15B Empfohlen	4. März 2026	15B Parameter mit Vision und Reasoning Entscheidet selbst, wann tiefes Reasoning nötig ist 84,8 AI2D, 83,3 ChartQA, 75,2 MathVista, 88,2 ScreenSpot v2 MIT-Lizenz, auf Microsoft Foundry, HuggingFace und GitHub	Höherer Ressourcenbedarf als Phi-4 16k Kontextfenster	Aktuell
Phi-4-reasoning (14B)	April 2025	Reines Reasoning-Modell (kein Vision) MIT-Lizenz	Kein Vision-Support	Aktuell
Phi-4-mini	Februar 2025	3.8B Parameter – Edge-fähig MIT-Lizenz	Geringere Kapazität	Aktuell
Phi-4-multimodal	Februar 2025	Multimodale Eingaben (Text, Bild, Audio) MIT-Lizenz	—	Aktuell
Phi-4	Dezember 2024	14B Parameter - sehr effizient Starke Reasoning-Fähigkeiten	Kleiner als Frontier-Modelle	Aktuell
Phi-3.5-MoE	2024	Mixture-of-Experts 42B Parameter (6.6B aktiv)	—	Aktuell
Phi-3.5-mini	2024	3.8B Parameter Laeuft auf Smartphones	Begrenzte Kapazität	Aktuell
Phi-3.5-vision	2024	Multimodal Bildverständnis	—	Aktuell
Phi-3-medium	2024	14B Parameter Balance aus Größe und Leistung	—	Aktuell

Technische Details

API, Features und Capabilities

API & Verfügbarkeit

Verfügbarkeit Public

Latenz (TTFT) ~100ms (lokal)

Durchsatz Hardwareabhängig Tokens/Sek

Features & Capabilities

Tool Use Function Calling Structured Output Vision Reasoning Mode Datei-Upload

Training & Wissen

Wissensstand Februar 2026 (Phi-4-reasoning-vision), 2024-10 (Phi-4)

Fine-Tuning Verfügbar (LoRA, QLoRA, Full Fine-Tuning)

Sprachunterstützung

Beste Qualität Englisch, Deutsch

Unterstützt 20+ Sprachen

Optimiert für Englisch, brauchbare Qualität in Deutsch

Hosting & Compliance

DSGVO-konforme Hosting-Optionen und Lizenzierung

DSGVO-konforme Hosting-Optionen

Lizenz & Hosting

Lizenz MIT

Sicherheitsfilter Anpassbar

Enterprise Support Ja

SLA verfügbar Ja

On-Premise Edge-fähig

Als KI-Beratung aus Rosenheim empfehlen wir Microsoft Phi für Unternehmen im DACH-Raum, die leistungsstarke KI auf ressourcenbeschränkter Hardware betreiben möchten. Seit der Veröffentlichung von Phi-4 im Dezember 2024 haben sich die Phi-Modelle als zuverlässige Lösung für Edge- und On-Premise-Deployments etabliert und bieten beeindruckende Leistung bei minimalen Anforderungen. Mit der MAI-Familie (Build 2026) erweitert Microsoft das eigene Modell-Portfolio nun um vollständig hauseigene Reasoning- und Coding-Modelle.

Neu: MAI-Thinking-1 und MAI-Code-1-Flash (Juni 2026)

Auf der Build 2026 (2. Juni 2026) hat Microsoft die ersten vollständig hauseigenen Foundation-Modelle vorgestellt – trainiert ohne OpenAI-Distillation und ausschließlich auf kommerziell lizenzierten Daten. Aus DACH-Sicht besonders relevant:

MAI-Thinking-1: Sparse Mixture-of-Experts mit 35B aktiven Parametern und 256k Kontextfenster. Erreicht 97,0 % AIME 2025 und 94,5 % AIME 2026 und liegt auf SWE-Bench Pro auf dem Niveau von Claude Opus 4.6. Über Microsoft Foundry / Azure in West Europe und Germany verfügbar.
MAI-Code-1-Flash: 5B-Parameter-Coding-Modell, das Claude Haiku 4.5 auf allen vier getesteten Coding-Benchmarks schlägt (auf SWE-Bench Pro 51,2 % vs. 35,2 %). Ab dem 2. Juni 2026 in GitHub Copilot (Free, Pro, Pro+, Max) für VS Code ausgerollt.

Beide Modelle sind Teil einer siebenteiligen MAI-Familie (u. a. MAI-Image-2.5, MAI-Transcribe-1.5 mit 43 Sprachen, MAI-Voice-2 mit über 15 Sprachen) und reduzieren Microsofts Abhängigkeit von OpenAI deutlich. Sie sind allerdings nicht Open Source – wer volle Datenkontrolle braucht, bleibt bei Phi.

Neu: Phi-4-reasoning-vision (März 2026)

Microsoft hat mit Phi-4-reasoning-vision-15B ein neues Modell veröffentlicht, das Vision und Reasoning in einem 15B-Parameter-Modell kombiniert. Das Modell kann eigenständig entscheiden, wann tieferes Reasoning erforderlich ist – eine wichtige Fähigkeit für effiziente lokale Deployments.

15B Parameter: Mehr Kapazität als Phi-4 (14B)
Vision + Reasoning: Versteht Bilder und kann komplexe Schlussfolgerungen ziehen
MIT-Lizenz: Vollständige kommerzielle Nutzung erlaubt
Self-Hosting: Läuft auf RTX 4090 oder M2 Mac

Small Language Models (SLMs)

Microsoft Phi ist Microsofts Familie von “Small Language Models” - kompakte, aber leistungsstarke Modelle, die speziell für Effizienz optimiert sind.

Warum Phi für Unternehmen?

Kompakt: 3.8B bis 14B Parameter
Effizient: Laeuft auf Consumer-Hardware
MIT-Lizenz: Volle kommerzielle Nutzung erlaubt
Self-Hosting: Volle Datenkontrolle
Edge-fähig: Smartphones, IoT, Embedded

Besondere Stärken

Effizienz

Phi-Modelle erreichen beeindruckende Leistung bei minimaler Größe:

Modell	Parameter	Vergleichbare Leistung zu
Phi-4	14B	GPT-4 (teilweise)
Phi-3.5-MoE	42B (6.6B aktiv)	Llama 3 70B
Phi-3.5-mini	3.8B	Llama 3 8B

Lokales Deployment

Phi-Modelle können vollständig lokal betrieben werden:

Ollama: ollama run phi4
LM Studio: Einfache GUI
vLLM: Produktions-Deployment
ONNX: Optimierte Inferenz

Hardware-Anforderungen

Modell	RAM/VRAM	Empfohlene Hardware
Phi-4	16 GB	RTX 4070 / M2 Mac
Phi-3.5-MoE	24 GB	RTX 4090
Phi-3.5-mini	4 GB	Laptop / Smartphone
Phi-3.5-vision	8 GB	RTX 3060

Reasoning-Stärke

Phi-4 zeigt besonders starke Reasoning-Fähigkeiten:

Mathematik und Logik
Coding-Aufgaben
Strukturierte Analyse
Chain-of-Thought

Vergleich zu anderen SLMs

Feature	Phi-4	Llama 3.2 3B	Gemma 2 2B
Parameter	14B	3B	2B
Reasoning	Stark	Mittel	Mittel
Coding	Stark	Gut	Gut
Vision	Ja (3.5)	Nein	Nein
Lizenz	MIT	Community	Apache 2.0

Integration mit CompanyGPT

Microsoft Phi kann in CompanyGPT als Self-Hosted-Option integriert werden - ideal für Unternehmen, die KI ohne Cloud-Abhängigkeit betreiben möchten.

Unsere Empfehlung

Für Reasoning-intensive Cloud-Workloads auf Azure / Foundry ist MAI-Thinking-1 seit Juni 2026 unsere neue Top-Empfehlung im Microsoft-Stack. Für Coding-Assistenten in GitHub Copilot ist MAI-Code-1-Flash das beste Preis-Leistungs-Verhältnis.

Für lokale und Edge-Deployments mit Vision- und Reasoning-Anforderungen empfehlen wir weiterhin Microsoft Phi-4-reasoning-vision-15B. Für reine Text-Aufgaben bleibt Phi-4 eine ausgezeichnete Wahl. Für Smartphones und IoT eignet sich Phi-3.5-mini, für einfachere multimodale Anwendungen Phi-3.5-vision.

Für Anwendungen, die maximale Qualität erfordern und Cloud-Hosting akzeptabel ist, empfehlen wir stattdessen OpenAI GPT oder Anthropic Claude.

Kostenkalkulation für dieses Modell

Eine aktuelle Übersicht über Token-Preise, Modellvarianten und EU-Verfügbarkeit finden Sie auf unserem Schwesterprojekt ai-prices.eu. Dort lassen sich die laufenden Betriebskosten für Ihren konkreten Anwendungsfall vergleichen und abschätzen.

Preise auf ai-prices.eu vergleichen

ai-prices.eu ist ein Projekt der innFactory AI Consulting GmbH und hilft bei der transparenten Preisabschätzung führender KI-Modelle.

Microsoft Phi & MAI

Versionen

Einsatzbereiche