Versionen

Verfügbare Modellvarianten im Überblick

Modell	Release	EU	Stärken	Schwächen	Status
gpt-oss-120b Empfohlen	5. August 2025		117B Parameter total, 5,1B aktiv (MoE) Erreicht oder übertrifft OpenAI o4-mini bei Coding, Reasoning und Tool-Use Läuft auf einer 80-GB-GPU dank nativer MXFP4-Quantisierung Apache 2.0 – voll self-hostbar	Kein Vision-Input Reasoning-Modus erhöht Latenz	Aktuell
gpt-oss-20b	5. August 2025		21B Parameter total, 3,6B aktiv (MoE) Läuft mit ca. 16 GB Speicher – Laptop-tauglich Erreicht oder übertrifft OpenAI o3-mini Apache 2.0	Geringere Kapazität als gpt-oss-120b Kein Vision-Input	Aktuell

Technische Details

API, Features und Capabilities

API & Verfügbarkeit

Verfügbarkeit Open Weights (HuggingFace, Azure, AWS, Cloudflare, Ollama, vLLM, LM Studio u.v.m.)

Latenz (TTFT) Abhängig von Hardware

Durchsatz Abhängig von Hardware Tokens/Sek

Features & Capabilities

Tool Use Function Calling Structured Output Reasoning Mode

Training & Wissen

Wissensstand Anfang 2025

Fine-Tuning Verfügbar (LoRA, QLoRA, Full Fine-Tuning)

Sprachunterstützung

Beste Qualität Englisch, Deutsch, Französisch, Spanisch, Chinesisch

Unterstützt Mehrsprachig (Englisch dominant)

Beste Qualität in Englisch, sehr gute Qualität in europäischen Sprachen

Hosting & Compliance

DSGVO-konforme Hosting-Optionen und Lizenzierung

DSGVO-konforme Hosting-Optionen

Lizenz & Hosting

Lizenz Apache 2.0

Sicherheitsfilter Keine vorinstalliert (Self-Hosted Verantwortung)

On-Premise Edge-fähig

innFactory AI Consulting aus Rosenheim berät Unternehmen im DACH-Raum zur DSGVO-konformen Integration von gpt-oss – OpenAIs erste Open-Weight-Modelle seit GPT-2. Mit CompanyGPT können Sie gpt-oss sicher self-hostbar in Ihrer Infrastruktur betreiben.

Was ist gpt-oss?

Am 5. August 2025 hat OpenAI mit gpt-oss-120b und gpt-oss-20b zwei Open-Weight-Modelle unter Apache-2.0-Lizenz veröffentlicht – die erste Open-Weight-Release seit GPT-2 im Jahr 2019. Für DACH-Unternehmen ist das ein Wendepunkt: Erstmals lassen sich OpenAI-nahe Modelle voll self-hostbar und ohne API-Abhängigkeit betreiben.

Modellvarianten

gpt-oss-120b

117 Mrd. Parameter total, 5,1 Mrd. aktiv (Mixture-of-Experts)
Performance: Erreicht oder übertrifft OpenAI o4-mini bei Coding, Reasoning, Tool-Use und Mathematik
Hardware: Läuft auf einer einzelnen 80-GB-GPU (A100/H100/MI300) dank nativer MXFP4-Quantisierung
Empfohlen für: Enterprise-Workloads, RAG-Pipelines, Coding-Agenten

gpt-oss-20b

21 Mrd. Parameter total, 3,6 Mrd. aktiv (Mixture-of-Experts)
Performance: Erreicht oder übertrifft OpenAI o3-mini, vor allem in Mathematik und Health-Themen
Hardware: ca. 16 GB Speicher – läuft auf leistungsfähigen Laptops und Workstations
Empfohlen für: Edge-Deployment, lokale Entwickler-Tools, datensensitive Prototypen

Warum gpt-oss für DACH-Unternehmen

DSGVO-konformes Self-Hosting

Apache 2.0 erlaubt kommerzielle Nutzung, Modifikation und Redistribution ohne Copyleft. Damit lassen sich gpt-oss-Modelle in der eigenen Infrastruktur oder in EU-Clouds betreiben – ohne dass Daten zu OpenAI gehen.

Breites Deployment-Ökosystem

Zum Launch hat OpenAI mit folgenden Plattformen partnered: Azure, AWS, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare, OpenRouter.

In der EU besonders relevant:

Azure AI Foundry in West Europe und Germany West Central
AWS Bedrock Marketplace in Frankfurt
Cloudflare Workers AI mit EU-Edge-Routing

Compliance- und Sovereignty-Vorteile

Air-Gapped-Deployment möglich (Behörden, Verteidigung, kritische Infrastruktur)
Volle Auditierbarkeit der Modellgewichte
Keine API-Telemetrie in Richtung OpenAI

gpt-oss vs. proprietäre GPT-Modelle

Aspekt	gpt-oss	GPT-5.x / Frontier
Lizenz	Apache 2.0	Proprietär
Self-Hosting	Ja	Nein
Vision-Input	Nein	Ja
Frontier-Performance	Nahe o3/o4-mini	Höher
DSGVO-Risiko	Minimal (self-hostbar)	Höher (Cloud-API)

Für DSGVO-kritische Workloads ist gpt-oss die naheliegende Wahl – auch wenn die Frontier-GPT-Modelle bei Spitzenleistung in Vision und komplexen Reasoning-Aufgaben weiterhin überlegen sind.

Integration mit CompanyGPT

Mit CompanyGPT lässt sich gpt-oss als DSGVO-konforme Alternative zu GPT-5.x über Azure in Ihrer Infrastruktur betreiben. Für hybride Setups kombinieren wir gpt-oss (für sensible Workloads) mit GPT-Cloud-Modellen (für Spitzenleistung) – mit intelligentem Routing pro Use-Case.

Unsere Empfehlung

gpt-oss-120b ist 2026 die DSGVO-konforme Standardempfehlung für Unternehmen, die OpenAI-Qualität ohne Cloud-API-Abhängigkeit benötigen. Für Edge-Szenarien und Entwickler-Workflows ist gpt-oss-20b der ideale Begleiter.

Wir unterstützen Sie bei der Hardware-Auswahl, Deployment-Architektur und der Integration in bestehende Wissens- und ERP-Systeme. Kontaktieren Sie uns für eine unverbindliche Erstberatung.

Kostenkalkulation für dieses Modell

Eine aktuelle Übersicht über Token-Preise, Modellvarianten und EU-Verfügbarkeit finden Sie auf unserem Schwesterprojekt ai-prices.eu. Dort lassen sich die laufenden Betriebskosten für Ihren konkreten Anwendungsfall vergleichen und abschätzen.

Preise auf ai-prices.eu vergleichen

ai-prices.eu ist ein Projekt der innFactory AI Consulting GmbH und hilft bei der transparenten Preisabschätzung führender KI-Modelle.

OpenAI gpt-oss

Versionen

Einsatzbereiche

Technische Details

Hosting & Compliance

Benchmarks

Was ist gpt-oss?

Modellvarianten

gpt-oss-120b

gpt-oss-20b

Warum gpt-oss für DACH-Unternehmen

DSGVO-konformes Self-Hosting

Breites Deployment-Ökosystem

Compliance- und Sovereignty-Vorteile

gpt-oss vs. proprietäre GPT-Modelle

Verwandte Modelle

Integration mit CompanyGPT

Unsere Empfehlung

Kostenkalkulation für dieses Modell

Ähnliche Modelle

SOOFI (Soofi S)

Tencent Hunyuan (Hy3)

NVIDIA Nemotron

Beratung zu diesem Modell?