Projet Oxford : de nouvelles API de reconnaissance vocale et vidéo

Par:
fredericmazue

mer, 16/12/2015 - 16:06

Après avoir mis à disposition une API qui saura vous dire si vous êtes heureux le projet Oxford de Microsoft propose une API qui saura confirmer que c'est bien vous qui le dites :-) Et pour faire bonne mesure, vient aussi une API vidéo.

C'est par un billet sur Technet que Microsoft a présenté ces nouvelles API qui, comme celles de la reconnaissance et analyse faciale évoquées plus haut, sont basées sur le machine learning.

En ce qui concerne la reconnaissance vocale, il ne s'agit pas ici de reconnaître des mots prononcés par un humain, mais bien de reconnaître l'humain qui prononce les mots.

Cette API peut être utilisée pour des authentifications sur divers systèmes, sans pour autant être capable de remplacer une authentification forte précise Microsoft. Elle peut être utilisée pour discerner et identifier plusieurs orateurs dans un document audio, elle peut encore servir de base à un service client, l'API identifiant automatiquement la personne qui appelle, sans qu'un opérateur humain ne doivent lui poser des questions pour cela.

En ce qui concerne la reconnaissance vidéo, l'API peut détecter puis suivre des visages dans des vidéos, détecter des mouvements sur des arrière-plans fixes, et fluidifier et stabiliser les vidéos.