OpenAI Privacy Filter : masquer les données personnelles
lun, 01/06/2026 - 08:35
OpenAI propose depuis quelques semaines un nouvel modèle : Privacy Filter. Ce modèle doit permettre de détecter et de masquer les données sensibles et personnalisés dans les textes. Il s'agit d'un modèle de classivement bidirectionnel. Il supporte 8 catégories de données que l'on peut activer :
personne_privéeadresse_privéee-mail_privétéléphone_privéURL_privéedate_privéenuméro_de_comptesecret
Il s'agit d'un LLM à 1,5 milliard de paramètres et utilise une approche Mixture of Experts (MoE). Pour assurer une performance de traitements, le LLM limite volontairement à 50 millions de paramètres par requête.
Il fonctionne en local. Attention : ce n'est pas un outil d'anonymisation. "Privacy Filter n'est pas un outil d'anonymisation, une certification de conformité ni un substitut à l'examen des politiques dans des contextes à forts enjeux. Il s'agit de l'un des composants d'un système plus large de protection de la vie privée dès la conception." Il est sous licence Apache et fonctionne localement.
Exemple :
Objet : suivi de la planification du T2
Bonjour Jordan,
= Objet : suivi de la planification du T2
Bonjour [PRIVATE_PERSON],

