Reconnaître l’appelant par biométrie vocale

Reconnaître l’appelant par biométrie vocale

La voix ouvre toutes les portes


Dans le Contact Center, une empreinte vocale permet l’identification et l’authentification de l’appelant. La biométrie vocale réduit le temps de travail et le client n’a plus à répondre aux questions de sécurité.


Texte: Urs Binder, Images: © Alamy,




Sylvie M. a une question au sujet de son nouvel abonnement fixe et appelle la hotline de Swisscom. Dans le Contact Center, Markus H. prend l’appel et Sylvie pose sa question. Markus peut la renseigner immédiatement de façon compétente car il sait exactement de quelle cliente il s’agit. Même en cas de sujets confidentiels comme les questions de paiement, Sylvie n’a pas à répondre à des questions de sécurité ou à indiquer un code PIN.

En arrière-plan, le système de biométrie vocale a en effet analysé les caractéristiques de la voix de Sylvie dès le début de la conversation et les a comparées à une empreinte vocale mémorisée lors d’un appel précédent. En quelques secondes, Sylvie a pu être clairement identifiée en tant que cliente et Markus, sur son écran, a reçu le feu vert pour pouvoir poursuivre la conversation.



Identification et vérification rapides et sûres

La biométrie vocale est le seul procédé biométrique fonctionnant également à distance: les autres méthodes telles que celles par empreinte digitale, identification de l’iris ou même comparaison d’ADN exigent un contact direct avec la personne. La reconnaissance d’un locuteur par biométrie vocale est une méthode très sûre et efficace d’identification des personnes à l’aide des caractéristiques individuelles de leur voix, ce qui garantit que l’appelant est bien la personne qu’il prétend être.

Au premier appel, le système crée une «empreinte vocale» qui englobe toutes les caractéristiques d’identification de la voix. Pour cela, une conversation d’environ 40 secondes est nécessaire. Cette empreinte vocale est alors disponible pour l’identification de l’appelant lors de ses appels futurs. L’identification de l’appelant dure entre 10 et 15 secondes. Il n’a pas à prononcer un texte prédéterminé et peut parler librement. L’identification a lieu en arrière-plan sans que l’appelant s’en aperçoive. Et cette méthode n’est pratiquement pas sujette aux perturbations: le système reconnaît la voix même si, par exemple, l’appelant est enrhumé.

Cette méthode est également intéressante pour les secteurs sensibles comme celui de la santé ou des finances: en effet, la voix peut continuer à être analysée pendant l’appel. Ainsi, toute tentative d’imposture, notamment par remplacement du locuteur en cours de communication, est aussitôt détectée. De plus, la biométrie vocale permet aussi un niveau de sécurité supplémentaire si des sujets particulièrement confidentiels sont abordés au cours de la conversation.

L’empreinte vocale ne constitue pas un enregistrement audio et ne contient aucune donnée personnelle. Seules les métadonnées sont collectées. Le rapport entre la personne et l’empreinte vocale ne peut être établi de manière évidente. Néanmoins, les clients concernés devraient pouvoir donner leur accord à la reconnaissance de locuteur, de préférence par accord explicite via opt-in ou grâce à une possibilité d’opt-out clairement formulée. Au sein de l’UE, la variante opt-in est d’ores et déjà obligatoire.


Avantages immédiats

L’identification par biométrie vocale permet de réduire nettement la durée des communications pour les demandes de clients par téléphone: l’identification et la vérification représentent en moyenne environ 30% de la durée totale alors que, dans le cas de la biométrie vocale, elles n’ont lieu qu’en arrière-plan. Ainsi, la biométrie vocale permet à un grand centre d’appels qui reçoit 3,8 millions d’appels par an d’économiser jusqu’à 4 200 journées de travail chaque année, à raison de 300 secondes de durée moyenne d’un appel.

En cas d’utilisation de technologies vocales supplémentaires (voir box), la durée de traitement peut être réduite de moitié. Les avantages dont profitent les appelants sont eux aussi évidents: ils n’ont plus à répondre à des questions de sécurité ennuyeuses ni à se rappeler des codes PIN, des mots de passe, des numéros de client ou des numéros de contrat et sont plus rapidement servis. La biométrie vocale contribue également à la détection de fraudes (Fraud Detection) et permet de rejeter les appelants indésirables (Blacklisting).

Une solution de biométrie vocale convient dans tous les cas là où un centre de contact/d’appels est utilisé et se rentabilise dès quelques centaines de contacts par mois. Depuis plusieurs mois, Swisscom utilise la biométrie vocale pour sa propre hotline et en a fait des expériences très positives.

Swisscom propose cette solution aux clients intéressés pour leur propre centre d’appels. Cela commence toujours par un Proof-of-Concept (démonstration de faisabilité). Celui-ci peut être effectué indépendamment de l’infrastructure existante du centre d’appels de manière à ce que le client puisse vérifier les performances. Cela comprend non seulement l’identification des appelants par biométrie vocale, mais aussi des fonctions telles que Speech-to-Text et AVR. De plus, la solution Swisscom comprend le suisse allemand. Les offres comparables ne possèdent pas cette faculté.


Reconnaissance de locuteur et reconnaissance de la parole


La biométrie vocale se base sur la reconnaissance des caractéristiques individuelles de la voix d’une personne. Au final, il en résulte une empreinte vocale permettant d’identifier, de valider et d’authentifier clairement la personne. Et cela totalement indépendamment du contenu formulé.

 

La biométrie vocale permet ainsi la reconnaissance du locuteur. La reconnaissance de la parole (ou Voice Recognition) n’est pas la même chose: cette dernière reconnaît la langue dans laquelle parle la personne, et le contenu prononcé est analysé et transformé en texte. La Voice Recognition est utilisée par des applications comme IVR (Interactive Voice Response, serveur vocal interactif automatique), AVR (Automatic Voice Recognition) et Speech-to-Text (transformation en texte des contenus prononcés).




En savoir plus sur ce thème