Zum Hauptinhalt springen
9 – 17 UHR +49 8031 3508270 LUITPOLDSTR. 9, 83022 ROSENHEIM
DE / EN
SAFETY OpenAI USA

OpenAI Privacy Filter

OpenAI Privacy Filter – Open-Source KI-Modell (Apache 2.0) zur Erkennung und Redaktion personenbezogener Daten (PII). DSGVO-relevantes Tool für datenschutzkonforme KI-Anwendungen.

Lizenz Apache 2.0
DSGVO-Hosting Verfügbar
Kontext 128k Tokens
Modalität Text → Text

Versionen

Verfügbare Modellvarianten im Überblick

ModellReleaseEUStärkenSchwächenStatus
OpenAI Privacy Filter Empfohlen
April 2026
Open Source (Apache 2.0) 1,5 Mrd. Parameter total, ca. 50 Mio. aktiv – läuft auf Notebook oder im Browser 128k Token Kontextfenster Bidirektionaler Token-Classifier auf gpt-oss-ähnlicher Architektur PII-Taxonomie: private_person, private_address, private_email, private_phone, private_url, private_date, account_number, secret
Englisch-zentrisch, Multilingualität nicht offiziell dokumentiert
Aktuell

Einsatzbereiche

Typische Anwendungsgebiete für dieses Modell

PII-Erkennung in Texten
Automatische Datenredaktion
DSGVO-konforme Textverarbeitung
Preprocessing für LLM-Pipelines
Anonymisierung von Kundendaten
Compliance-Automatisierung
Datenschutz in Chatbot-Systemen

Technische Details

API, Features und Capabilities

API & Verfügbarkeit
Verfügbarkeit Open Source
Features & Capabilities
Structured Output
Training & Wissen
Fine-Tuning Verfügbar (Full, LoRA)
Sprachunterstützung
Beste Qualität Englisch
Unterstützt Weitere Sprachen nicht bestätigt
Primär für englischsprachige PII-Erkennung entwickelt. Mehrsprachige Unterstützung ist wahrscheinlich, aber nicht offiziell dokumentiert.

Hosting & Compliance

DSGVO-konforme Hosting-Optionen und Lizenzierung

DSGVO-konforme Hosting-Optionen
Self-Hosted
Eigene Infrastruktur
Empfohlen – 100% DSGVO-konform, keine Daten verlassen die eigene Infrastruktur
Lizenz & Hosting
Lizenz Apache 2.0
Sicherheitsfilter PII-Filterung
On-Premise Edge-fähig

innFactory AI Consulting aus Rosenheim berät Unternehmen im DACH-Raum zur Integration von Datenschutz-KI in bestehende Systeme. Der OpenAI Privacy Filter ist eines der wenigen Open-Source-Modelle von OpenAI und bietet durch seine Apache-2.0-Lizenz vollständige Freiheit beim Self-Hosting – ein entscheidender Baustein für DSGVO-konforme KI-Architekturen.

Was ist der OpenAI Privacy Filter?

Der OpenAI Privacy Filter ist ein spezialisiertes KI-Modell zur automatischen Erkennung und Redaktion personenbezogener Daten (PII – Personally Identifiable Information) in Texten. Das Modell identifiziert sensible Informationen wie Namen, E-Mail-Adressen, Telefonnummern, Adressen, Sozialversicherungsnummern und weitere personenbezogene Datenkategorien und kann diese automatisch maskieren oder entfernen.

Im Gegensatz zu regelbasierten Ansätzen (Regular Expressions) nutzt der Privacy Filter maschinelles Lernen, um auch kontextabhängige und unstrukturierte PII zuverlässig zu erkennen. Das erhöht die Erkennungsrate deutlich und reduziert sowohl False Positives als auch False Negatives.

Warum dieses Modell besonders ist

OpenAI ist primär für proprietäre Modelle bekannt. Die Veröffentlichung des Privacy Filters unter der permissiven Apache-2.0-Lizenz ist eine bemerkenswerte Ausnahme. Neben Whisper (MIT-Lizenz) gehört der Privacy Filter zu den wenigen Modellen, die OpenAI der Open-Source-Community zur Verfügung stellt.

Die Apache-2.0-Lizenz erlaubt:

  • Kommerzielle Nutzung ohne Einschränkungen
  • Modifikation und Anpassung an eigene Anforderungen
  • Redistribution in eigenen Produkten
  • Kein Copyleft – keine Pflicht zur Offenlegung eigener Erweiterungen

DSGVO-Relevanz und EU-Kontext

Für europäische Unternehmen ist der Privacy Filter besonders relevant:

Self-Hosting als Datenschutzgarantie

Da das Modell vollständig lokal betrieben werden kann, verlassen keine Daten die eigene Infrastruktur. Dies ist ein fundamentaler Vorteil gegenüber Cloud-basierten PII-Erkennungsdiensten, bei denen potenziell sensible Daten an Drittanbieter übermittelt werden müssen – also genau die Daten, die geschützt werden sollen.

Preprocessing für LLM-Pipelines

Der Privacy Filter eignet sich als vorgeschaltete Schutzschicht in KI-Pipelines: Bevor Texte an ein Large Language Model gesendet werden (sei es lokal oder über eine API), können personenbezogene Daten automatisch entfernt werden. Dies reduziert das Risiko unbeabsichtigter Datenweitergabe erheblich.

Compliance-Automatisierung

In Kombination mit bestehenden Datenschutzprozessen kann der Privacy Filter die manuelle Prüfung von Dokumenten auf personenbezogene Daten automatisieren. Besonders relevant für:

  • Rechtsabteilungen bei der Dokumentenprüfung
  • Kundenservice bei der Archivierung von Kommunikation
  • HR-Abteilungen bei der Verarbeitung von Bewerbungsunterlagen
  • Forschungseinrichtungen bei der Anonymisierung von Studiendaten

Integration mit CompanyGPT

Mit CompanyGPT lässt sich der OpenAI Privacy Filter als Preprocessing-Layer in Ihre KI-Infrastruktur einbinden. Eingehende Texte werden vor der Verarbeitung durch das LLM automatisch auf personenbezogene Daten geprüft und bei Bedarf anonymisiert. So entsteht eine mehrstufige Datenschutzarchitektur, die sowohl technische als auch organisatorische Anforderungen der DSGVO adressiert.

Technische Einordnung

Hinweis: Da OpenAI zum Zeitpunkt dieser Veröffentlichung nur begrenzte technische Dokumentation bereitgestellt hat, basieren einige der folgenden Angaben auf der allgemeinen Funktionsweise vergleichbarer PII-Erkennungsmodelle. Wir aktualisieren diese Seite, sobald detailliertere Spezifikationen verfügbar sind.

  • Modelltyp: Bidirektionaler Token-Classifier auf gpt-oss-ähnlicher Architektur
  • Größe: 1,5 Mrd. Parameter total, ca. 50 Mio. aktiv – läuft lokal auf Notebook oder im Browser
  • Kontextfenster: 128k Token
  • Lizenz: Apache 2.0 (offizielles Repo: openai/privacy-filter auf Hugging Face)
  • Einsatzmodus: Primär Self-Hosting, keine offizielle API von OpenAI
  • Erkannte PII-Kategorien: private_person, private_address, private_email, private_phone, private_url, private_date, account_number, secret

Hinweis zu Fake-Repos: Es kursieren manipulierte Kopien des Modells unter ähnlichen Repo-Namen auf Hugging Face. Verwenden Sie ausschließlich das offizielle Repo openai/privacy-filter.

Unsere Empfehlung

Der OpenAI Privacy Filter ist ein wertvolles Werkzeug für jedes Unternehmen, das KI-Systeme datenschutzkonform betreiben möchte. Besonders in Kombination mit Self-Hosted LLMs oder als Schutzschicht vor Cloud-APIs bietet das Modell einen konkreten Mehrwert für die DSGVO-Compliance.

Für Unternehmen mit bestehenden KI-Pipelines empfehlen wir, den Privacy Filter als festen Bestandteil der Datenverarbeitungskette zu evaluieren. Die Apache-2.0-Lizenz und die Möglichkeit zum Self-Hosting machen eine Integration risikoarm und flexibel.

innFactory AI Consulting unterstützt Sie bei der Bewertung, Integration und dem Betrieb des Privacy Filters in Ihrer Infrastruktur. Kontaktieren Sie uns für eine unverbindliche Erstberatung.

Kostenkalkulation für dieses Modell

Eine aktuelle Übersicht über Token-Preise, Modellvarianten und EU-Verfügbarkeit finden Sie auf unserem Schwesterprojekt ai-prices.eu. Dort lassen sich die laufenden Betriebskosten für Ihren konkreten Anwendungsfall vergleichen und abschätzen.

Preise auf ai-prices.eu vergleichen

ai-prices.eu ist ein Projekt der innFactory AI Consulting GmbH und hilft bei der transparenten Preisabschätzung führender KI-Modelle.

Beratung zu diesem Modell?

Wir helfen Ihnen bei der Auswahl und Integration des richtigen KI-Modells für Ihren Anwendungsfall.