Zum Hauptinhalt springen
9 – 17 UHR +49 8031 3508270 LUITPOLDSTR. 9, 83022 ROSENHEIM
DE / EN
LLM OpenAI USA

OpenAI gpt-oss

gpt-oss-120b und gpt-oss-20b – OpenAIs erste Open-Weight-Modelle seit GPT-2 (August 2025). Apache 2.0, voll self-hostbar, DSGVO-konform. KI-Beratung Rosenheim.

Lizenz Apache 2.0
DSGVO-Hosting Verfügbar
Kontext 128k Tokens
Modalität Text → Text

Versionen

Verfügbare Modellvarianten im Überblick

ModellReleaseEUStärkenSchwächenStatus
gpt-oss-120b Empfohlen
5. August 2025
117B Parameter total, 5,1B aktiv (MoE) Erreicht oder übertrifft OpenAI o4-mini bei Coding, Reasoning und Tool-Use Läuft auf einer 80-GB-GPU dank nativer MXFP4-Quantisierung Apache 2.0 – voll self-hostbar
Kein Vision-Input Reasoning-Modus erhöht Latenz
Aktuell
gpt-oss-20b
5. August 2025
21B Parameter total, 3,6B aktiv (MoE) Läuft mit ca. 16 GB Speicher – Laptop-tauglich Erreicht oder übertrifft OpenAI o3-mini Apache 2.0
Geringere Kapazität als gpt-oss-120b Kein Vision-Input
Aktuell

Einsatzbereiche

Typische Anwendungsgebiete für dieses Modell

DSGVO-konformes Self-Hosting
Coding & Softwareentwicklung
Reasoning-intensive Workflows
Tool-Use und Agentic AI
Edge- und On-Premise-Deployment (20b)
Air-Gapped-Umgebungen (Behörden, kritische Infrastruktur)

Technische Details

API, Features und Capabilities

API & Verfügbarkeit
Verfügbarkeit Open Weights (HuggingFace, Azure, AWS, Cloudflare, Ollama, vLLM, LM Studio u.v.m.)
Latenz (TTFT) Abhängig von Hardware
Durchsatz Abhängig von Hardware Tokens/Sek
Features & Capabilities
Tool Use Function Calling Structured Output Reasoning Mode
Training & Wissen
Wissensstand Anfang 2025
Fine-Tuning Verfügbar (LoRA, QLoRA, Full Fine-Tuning)
Sprachunterstützung
Beste Qualität Englisch, Deutsch, Französisch, Spanisch, Chinesisch
Unterstützt Mehrsprachig (Englisch dominant)
Beste Qualität in Englisch, sehr gute Qualität in europäischen Sprachen

Hosting & Compliance

DSGVO-konforme Hosting-Optionen und Lizenzierung

DSGVO-konforme Hosting-Optionen
Self-Hosted
Eigene Infrastruktur
Empfohlen – volle Datenkontrolle, Apache 2.0
Azure
West Europe, Germany West Central
Azure AI Foundry Model Catalog
AWS
Frankfurt (eu-central-1)
Amazon Bedrock Marketplace
Cloudflare Workers AI
Global Edge mit EU-Routing
Serverless Inference
Lizenz & Hosting
Lizenz Apache 2.0
Sicherheitsfilter Keine vorinstalliert (Self-Hosted Verantwortung)
On-Premise Edge-fähig

Benchmarks

Leistungsvergleich mit standardisierten Tests

Competition Coding
matches o4-mini
Competition Math
übertrifft o4-mini
Health Q&A
übertrifft o4-mini

innFactory AI Consulting aus Rosenheim berät Unternehmen im DACH-Raum zur DSGVO-konformen Integration von gpt-oss – OpenAIs erste Open-Weight-Modelle seit GPT-2. Mit CompanyGPT können Sie gpt-oss sicher self-hostbar in Ihrer Infrastruktur betreiben.

Was ist gpt-oss?

Am 5. August 2025 hat OpenAI mit gpt-oss-120b und gpt-oss-20b zwei Open-Weight-Modelle unter Apache-2.0-Lizenz veröffentlicht – die erste Open-Weight-Release seit GPT-2 im Jahr 2019. Für DACH-Unternehmen ist das ein Wendepunkt: Erstmals lassen sich OpenAI-nahe Modelle voll self-hostbar und ohne API-Abhängigkeit betreiben.

Modellvarianten

gpt-oss-120b

  • 117 Mrd. Parameter total, 5,1 Mrd. aktiv (Mixture-of-Experts)
  • Performance: Erreicht oder übertrifft OpenAI o4-mini bei Coding, Reasoning, Tool-Use und Mathematik
  • Hardware: Läuft auf einer einzelnen 80-GB-GPU (A100/H100/MI300) dank nativer MXFP4-Quantisierung
  • Empfohlen für: Enterprise-Workloads, RAG-Pipelines, Coding-Agenten

gpt-oss-20b

  • 21 Mrd. Parameter total, 3,6 Mrd. aktiv (Mixture-of-Experts)
  • Performance: Erreicht oder übertrifft OpenAI o3-mini, vor allem in Mathematik und Health-Themen
  • Hardware: ca. 16 GB Speicher – läuft auf leistungsfähigen Laptops und Workstations
  • Empfohlen für: Edge-Deployment, lokale Entwickler-Tools, datensensitive Prototypen

Warum gpt-oss für DACH-Unternehmen

DSGVO-konformes Self-Hosting

Apache 2.0 erlaubt kommerzielle Nutzung, Modifikation und Redistribution ohne Copyleft. Damit lassen sich gpt-oss-Modelle in der eigenen Infrastruktur oder in EU-Clouds betreiben – ohne dass Daten zu OpenAI gehen.

Breites Deployment-Ökosystem

Zum Launch hat OpenAI mit folgenden Plattformen partnered: Azure, AWS, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare, OpenRouter.

In der EU besonders relevant:

  • Azure AI Foundry in West Europe und Germany West Central
  • AWS Bedrock Marketplace in Frankfurt
  • Cloudflare Workers AI mit EU-Edge-Routing

Compliance- und Sovereignty-Vorteile

  • Air-Gapped-Deployment möglich (Behörden, Verteidigung, kritische Infrastruktur)
  • Volle Auditierbarkeit der Modellgewichte
  • Keine API-Telemetrie in Richtung OpenAI

gpt-oss vs. proprietäre GPT-Modelle

Aspektgpt-ossGPT-5.x / Frontier
LizenzApache 2.0Proprietär
Self-HostingJaNein
Vision-InputNeinJa
Frontier-PerformanceNahe o3/o4-miniHöher
DSGVO-RisikoMinimal (self-hostbar)Höher (Cloud-API)

Für DSGVO-kritische Workloads ist gpt-oss die naheliegende Wahl – auch wenn die Frontier-GPT-Modelle bei Spitzenleistung in Vision und komplexen Reasoning-Aufgaben weiterhin überlegen sind.

Verwandte Modelle

Integration mit CompanyGPT

Mit CompanyGPT lässt sich gpt-oss als DSGVO-konforme Alternative zu GPT-5.x über Azure in Ihrer Infrastruktur betreiben. Für hybride Setups kombinieren wir gpt-oss (für sensible Workloads) mit GPT-Cloud-Modellen (für Spitzenleistung) – mit intelligentem Routing pro Use-Case.

Unsere Empfehlung

gpt-oss-120b ist 2026 die DSGVO-konforme Standardempfehlung für Unternehmen, die OpenAI-Qualität ohne Cloud-API-Abhängigkeit benötigen. Für Edge-Szenarien und Entwickler-Workflows ist gpt-oss-20b der ideale Begleiter.

Wir unterstützen Sie bei der Hardware-Auswahl, Deployment-Architektur und der Integration in bestehende Wissens- und ERP-Systeme. Kontaktieren Sie uns für eine unverbindliche Erstberatung.

Kostenkalkulation für dieses Modell

Eine aktuelle Übersicht über Token-Preise, Modellvarianten und EU-Verfügbarkeit finden Sie auf unserem Schwesterprojekt ai-prices.eu. Dort lassen sich die laufenden Betriebskosten für Ihren konkreten Anwendungsfall vergleichen und abschätzen.

Preise auf ai-prices.eu vergleichen

ai-prices.eu ist ein Projekt der innFactory AI Consulting GmbH und hilft bei der transparenten Preisabschätzung führender KI-Modelle.

Beratung zu diesem Modell?

Wir helfen Ihnen bei der Auswahl und Integration des richtigen KI-Modells für Ihren Anwendungsfall.