Talend: une solution open source de qualité de données

Par:
fredericmazue

mer, 20/08/2008 - 16:03

Talend, éditeur de logiciels d’intégration de données Open Source, annonce aujourd’hui le lancement de Talend Data Quality, première suite Open Source combinant des fonctions d’intégration de données, de Data Profiling et de qualité de données.

Talend Data Quality identifie des données erronées ou inexactes telles que des doublons, des surnoms et des adresses postales incomplètes, puis les corrige en utilisant des données de référence issues de différents fournisseurs, comme par exemple les bases de références postales de différents pays. La solution permet même aux entreprises de distinguer des surnoms peu évidents à discerner, tels que « Peggy », « Peg », « Marge » et « Meg », diminutifs de « Margaret ».

Talend Data Quality permet aux entreprises de confirmer des adresses, des numéros de téléphone, et l’orthographe de noms et d’abréviations, en les comparant avec des millions d’autres enregistrements, dont ceux de La Poste en France et des bases de données issues de nombreux pays. La solution est par exemple capable de déterminer que « François-Xavier Durand, 15 boulevard Berthelot » et « FX Durand, 15 bvd Bertelot » sont la même personne, ce qui permet d’éviter d’envoyer plusieurs documents à la même adresse.

Parmi les principales fonctionnalités de Talend Data Quality figurent :

Data Profiling : fournit une visibilité instantanée et un historique de la qualité des données de votre entreprise, afin de vous aider à mesurer l’amélioration ou la dégradation de la qualité de vos données dans le temps.

Identification des données erronées : identifie individuellement les données de bonne et de mauvaise qualité.

Nettoyage des données : corrige les données incorrectes, incomplètes ou incohérentes, en procédant à des vérifications croisées avec d’autres bases de données et données de référence.

Enrichissement des données : enrichit les données à l’aide d’informations diverses – latitude et longitude, données INSEE, notation de crédit ou autre information permettant de valoriser ces données – par exemple en permettant de cibler des mailings en fonction de catégories socio-professionnelles ou en organisant les tournées de livraison par proximité géographique.

Pour plus d’informations : www.talend.com