Google ajoute l'extraction d'entités à son kit ML

Par:
fredericmazue

mar, 22/12/2020 - 16:15

Partant du constat que la plupart des applications offrent aux utilisateurs très peu d'interaction avec le texte au-delà des opérations de base telles que couper, copier, oller, Google a ajouté l'API Entity Extraction, ou extraction d'entités, à son kit ML.

Cette nouvelle API a pour vocation de permettre d'améliorer l'expérience utilisateur dans votre application mobile en comprenant le texte et en vous permettant d'ajouter des raccourcis utiles en fonction du contexte.

L'API permet de reconnaître des entités spécifiques dans du texte statique mais aussi à la volée, lors de la saisie. Une fois qu'une entité est identifiée, il est possible d'activer différentes actions pour l'utilisateur en fonction du type de l'entité identifiée. Les entités prises en charge par l'API sont à ce jour :

  • Adresse
  • Date-heure
  • Adresse e-mail
  • Numéro de vol (codes de vol IATA uniquement)
  • IBAN
  • ISBN (version 13 uniquement)
  • Argent / devise (sommes exprimés en chiffres arabes uniquement)
  • Cartes de paiement / crédit
  • Numéro de téléphone
  • Numéro de suivi (formats internationaux normalisés)
  • URL

L'API supporte à ce jour 15 langues dont le français.

Google précise que cette API se concentre sur la précision plutôt que sur la reconnaissance. Ce qui fait que certaines instances d'une entité particulière peuvent ne pas être détectées au profit de l'exactitude.

L'API Extraction Entity est en phase bêta, ce qui implique qu'elle peut être modifiée à tous moments.

Site : developers.google.com