Ajouter un commentaire

OpenAI Privacy Filter : masquer les données personnelles

Par:
francoistonic

lun, 01/06/2026 - 08:35

OpenAI propose depuis quelques semaines un nouvel modèle : Privacy Filter. Ce modèle doit permettre de détecter et de masquer les données sensibles et personnalisés dans les textes. Il s'agit d'un modèle de classivement bidirectionnel. Il supporte 8 catégories de données que l'on peut activer :

  • personne_privée
  • adresse_privée
  • e-mail_privé
  • téléphone_privé
  • URL_privée
  • date_privée
  • numéro_de_compte
  • secret

Il s'agit d'un LLM à 1,5 milliard de paramètres et utilise une approche Mixture of Experts (MoE). Pour assurer une performance de traitements, le LLM limite volontairement à 50 millions de paramètres par requête. 

Il fonctionne en local. Attention : ce n'est pas un outil d'anonymisation. "Privacy Filter n'est pas un outil d'anonymisation, une certification de conformité ni un substitut à l'examen des politiques dans des contextes à forts enjeux. Il s'agit de l'un des composants d'un système plus large de protection de la vie privée dès la conception." Il est sous licence Apache et fonctionne localement. 

Exemple :

Objet : suivi de la planification du T2

Bonjour Jordan,

= Objet : suivi de la planification du T2

Bonjour [PRIVATE_PERSON],

GitHub : https://github.com/openai/privacy-filter

Filtered HTML

Plain text

CAPTCHA
Cette question permet de vérifier que vous n'êtes pas un robot spammeur :-)
 RRRR    AA   TTTTTT  TTTTTT  K  K 
R R A A TT TT K K
RRRR AAAA TT TT KK
R R A A TT TT K K
R RR A A TT TT K K