Un « petit plaisantin » qui avait en 2014 pris l'habitude d'appeler les garde-côtes des États-Unis pour signaler de faux incidents se pensait probablement intouchable. Il ne laissait aucune empreinte digitale ni génétique et il passait des appels trop brefs être localisé par les enquêteurs.

Malheureusement pour lui, l'analyse vocale assistée par Intelligence artificielle est aujourd'hui si avancée qu'elle peut révéler beaucoup plus sur un individu qu'une empreinte digitale. En utilisant une technologie puissante pour analyser une voix enregistrée, les scientifiques peuvent aujourd'hui faire des prédictions fiables sur les caractéristiques physiques du locuteur (taille, poids, structure faciale et âge, par exemple), sur son cadre socioéconomique, son niveau de revenu et même l'état de sa santé physique et mentale.

Rita Singh, du Language Technologies Institute de l'Université de Carnegie Mellon, est l'une des principales scientifiques dans ce domaine. Quand les garde-côtes des États-Unis lui ont envoyé les enregistrements des canulars téléphoniques, l'experte travaillait déjà dans la reconnaissance vocale depuis 20 ans. « Ils m'ont demandé de leur dire tout ce que je pouvais en tirer », a-t-elle déclaré au podcast Women in Tech Show qui s'est tenu plus tôt cette année. « J'ai regardé au-delà du signal. Que pouvais-je dire aux garde-côtes à propos de cette personne ? »

Rita Singh est une experte en reconnaissance vocale.

Ce que votre voix dit sur vous

Les techniques développées par Rita Singh et ses collègues de Carnegie Mellon analysent et comparent de minuscules différences, imperceptibles à l'oreille humaine, dans la façon dont les individus articulent la parole. Elles permettent ensuite de décomposer le discours enregistré en minuscules fragments audio, de quelques millisecondes, et utilisent des techniques d'intelligence artificielle pour parcourir ces extraits à la recherche d'identifiants uniques.

Votre voix peut aussi donner beaucoup d'informations sur votre environnement. Par exemple, la technologie permet de deviner la taille de la pièce dans laquelle quelqu'un parle, si elle a des fenêtres et même de quoi sont faits les murs. Encore plus impressionnant, peut-être, l'IA peut détecter les signatures laissées dans l'enregistrement par les fluctuations du réseau électrique local, puis les associer à des bases de données spécifiques pour donner une idée très précise de l'emplacement physique du locuteur et de l'heure exacte du coup de téléphone.

Tout cela est utile à beaucoup d'autres choses qu'à la chasse aux auteurs de canulars téléphoniques bien sûr. La résolution de cas criminels fédéraux de harcèlement ou de maltraitance envers des enfants a été aidée par cette technologie relativement récente. « Des coupables dont on ne connaissait que la voix ont été retrouvés, et leurs aveux ont largement corroboré nos analyses », explique la spécialiste.

Portraits en 3D

Et ils n'en sont qu'à leurs débuts : Rita Singh et ses collègues chercheurs développent de nouvelles technologies qui peuvent fournir à la police un portrait visuel 3D d'un suspect, en se basant uniquement sur un enregistrement vocal. « L'audio peut nous donner une esquisse faciale d'un locuteur, ainsi que sa taille, son poids, sa race, son âge et son degré d'intoxication », précise-t-elle.

Mais il reste encore du chemin à parcourir avant qu'une technologie de profilage basée sur la voix devienne fiable devant un tribunal. La scientifique s'explique : « En termes de recevabilité, il y aura des questionnements. Nous sommes en quelque sorte là où en était l'ADN en 1987, lorsque la première condamnation fondée sur l'ADN a été prononcée aux États-Unis. »

Voilà une mauvaise nouvelle pour le farceur qui jouait avec les nerfs des garde-côtes. Signaler de fausses alertes aux services d'urgence aux États-Unis est considéré comme un crime fédéral, passible de lourdes amendes et de plusieurs années de prison – mais les appels sont les seules preuves disponibles. Rita Singh a réalisé un profil qui a aidé les garde-côtes à éliminer les fausses pistes et à identifier un suspect, contre qui des poursuites sont susceptibles d'être bientôt lancées.

Compte tenu de la vitesse exponentielle des avancées technologiques, on peut affirmer que cette technologie sera de plus en plus largement utilisée par les forces de l'ordre à l'avenir. Et pour tous les petits plaisantins qui lisent ces lignes : il serait plus sage de vous en tenir à coller les lettres d'un journal sur une feuille. Sans laisser d’empreinte.