innFactory AI Consulting aus Rosenheim berät Unternehmen im DACH-Raum zur DSGVO-konformen Integration von gpt-oss – OpenAIs erste Open-Weight-Modelle seit GPT-2. Mit CompanyGPT können Sie gpt-oss sicher self-hostbar in Ihrer Infrastruktur betreiben.
Was ist gpt-oss?
Am 5. August 2025 hat OpenAI mit gpt-oss-120b und gpt-oss-20b zwei Open-Weight-Modelle unter Apache-2.0-Lizenz veröffentlicht – die erste Open-Weight-Release seit GPT-2 im Jahr 2019. Für DACH-Unternehmen ist das ein Wendepunkt: Erstmals lassen sich OpenAI-nahe Modelle voll self-hostbar und ohne API-Abhängigkeit betreiben.
Modellvarianten
gpt-oss-120b
- 117 Mrd. Parameter total, 5,1 Mrd. aktiv (Mixture-of-Experts)
- Performance: Erreicht oder übertrifft OpenAI o4-mini bei Coding, Reasoning, Tool-Use und Mathematik
- Hardware: Läuft auf einer einzelnen 80-GB-GPU (A100/H100/MI300) dank nativer MXFP4-Quantisierung
- Empfohlen für: Enterprise-Workloads, RAG-Pipelines, Coding-Agenten
gpt-oss-20b
- 21 Mrd. Parameter total, 3,6 Mrd. aktiv (Mixture-of-Experts)
- Performance: Erreicht oder übertrifft OpenAI o3-mini, vor allem in Mathematik und Health-Themen
- Hardware: ca. 16 GB Speicher – läuft auf leistungsfähigen Laptops und Workstations
- Empfohlen für: Edge-Deployment, lokale Entwickler-Tools, datensensitive Prototypen
Warum gpt-oss für DACH-Unternehmen
DSGVO-konformes Self-Hosting
Apache 2.0 erlaubt kommerzielle Nutzung, Modifikation und Redistribution ohne Copyleft. Damit lassen sich gpt-oss-Modelle in der eigenen Infrastruktur oder in EU-Clouds betreiben – ohne dass Daten zu OpenAI gehen.
Breites Deployment-Ökosystem
Zum Launch hat OpenAI mit folgenden Plattformen partnered: Azure, AWS, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare, OpenRouter.
In der EU besonders relevant:
- Azure AI Foundry in West Europe und Germany West Central
- AWS Bedrock Marketplace in Frankfurt
- Cloudflare Workers AI mit EU-Edge-Routing
Compliance- und Sovereignty-Vorteile
- Air-Gapped-Deployment möglich (Behörden, Verteidigung, kritische Infrastruktur)
- Volle Auditierbarkeit der Modellgewichte
- Keine API-Telemetrie in Richtung OpenAI
gpt-oss vs. proprietäre GPT-Modelle
| Aspekt | gpt-oss | GPT-5.x / Frontier |
|---|---|---|
| Lizenz | Apache 2.0 | Proprietär |
| Self-Hosting | Ja | Nein |
| Vision-Input | Nein | Ja |
| Frontier-Performance | Nahe o3/o4-mini | Höher |
| DSGVO-Risiko | Minimal (self-hostbar) | Höher (Cloud-API) |
Für DSGVO-kritische Workloads ist gpt-oss die naheliegende Wahl – auch wenn die Frontier-GPT-Modelle bei Spitzenleistung in Vision und komplexen Reasoning-Aufgaben weiterhin überlegen sind.
Verwandte Modelle
- gpt-oss-safeguard: Spezielle Safety-Variante für Content-Moderation
- OpenAI Privacy Filter: Apache-2.0-PII-Erkennungsmodell – ideal als Preprocessing-Layer vor gpt-oss
Integration mit CompanyGPT
Mit CompanyGPT lässt sich gpt-oss als DSGVO-konforme Alternative zu GPT-5.x über Azure in Ihrer Infrastruktur betreiben. Für hybride Setups kombinieren wir gpt-oss (für sensible Workloads) mit GPT-Cloud-Modellen (für Spitzenleistung) – mit intelligentem Routing pro Use-Case.
Unsere Empfehlung
gpt-oss-120b ist 2026 die DSGVO-konforme Standardempfehlung für Unternehmen, die OpenAI-Qualität ohne Cloud-API-Abhängigkeit benötigen. Für Edge-Szenarien und Entwickler-Workflows ist gpt-oss-20b der ideale Begleiter.
Wir unterstützen Sie bei der Hardware-Auswahl, Deployment-Architektur und der Integration in bestehende Wissens- und ERP-Systeme. Kontaktieren Sie uns für eine unverbindliche Erstberatung.
