Anrufer-Erkennung mit Voice-Biometrie

Anrufer-Erkennung mit Voice-Biometrie

Die Stimme öffnet Tür und Tor


Im Contact Center sorgt ein Stimmabdruck für die Identifikation und Authentifizierung der Anrufer. Voice-Biometrie spart Arbeitszeit – und Kunden müssen keine Sicherheitsfragen mehr beantworten.


Text: Urs Binder, Fotos: © Alamy,




Sylvie M. hat eine Frage zu ihrem neuen Festnetz-Abo und ruft die Hotline von Swisscom an. Im Contact Center nimmt Markus H. den Anruf entgegen, und Sylvie schildert ihr Anliegen. Markus kann ihr sofort kompetent Auskunft geben, denn er weiss bereits genau, um welche Kundin es sich handelt. Auch wenn es um vertrauliche Punkte geht, etwa um die Zahlung, muss Sylvie keine Sicherheitsfragen beantworten oder PIN-Nummern eingeben.

Im Hintergrund hat nämlich ein Voice-Biometrie-System Sylvies Stimmmerkmale vom Beginn des Gesprächs an analysiert und mit dem bereits von einem früheren Anruf her gespeicherten Voice-Print verglichen. Sylvie konnte als Kundin in wenigen Sekunden eindeutig identifiziert werden, und auf dem Bildschirm hat Markus grünes Licht für die weitere Gesprächsführung erhalten.



Schnell und sicher identifiziert und verifiziert

Voice-Biometrie ist das einzige biometrische Verfahren, das auch aus der Ferne funktioniert: Für andere Methoden wie Fingerabdruck, Iriserkennung oder gar einen DNA-Vergleich braucht es zwingend einen direkten Kontakt zur Person. Die Sprecher-Erkennung mit Voice-Biometrie ist eine sehr sichere und effiziente Methode, Personen anhand der individuellen Merkmale ihrer Stimme zu identifizieren und so sicherzustellen, dass ein Anrufer tatsächlich die Person ist, die er zu sein angibt.

Beim ersten Anruf erstellt das System einen «Stimmabdruck», der alle identifizierenden Merkmale der Stimme erfasst. Dafür sind etwa 40 Sekunden Gespräch nötig. Dieser Voice Print steht dann für die Identifikation bei künftigen Anrufen bereit. Es braucht etwa 10 bis 15 Sekunden, bis der Anrufer identifiziert ist. Er muss dabei keinen vordefinierten Text sprechen, sondern kann frei kommunizieren – die Identifizierung findet im Hintergrund statt, ohne dass der Anrufer etwas davon merkt. Und die Methode ist kaum störungsanfällig, die Stimme wird auch erkannt, wenn der Sprecher zum Beispiel erkältet ist.

Die Methode kommt auch für sensitive Bereiche wie Gesundheitswesen und Finanzwirtschaft infrage, denn die Stimme kann während des Anrufs laufend weiter analysiert werden – Betrug etwa durch Austausch des Sprechers im Verlauf des Gesprächs wird sofort erkannt. Voice-Biometrie eignet sich überdies auch als zusätzliche Sicherheitsstufe, wenn es im Verlauf eines Gesprächs um besonders vertrauliche Angelegenheiten geht.

Der Voice Print ist keine Audioaufzeichnung und enthält keine personenbezogenen Daten – gespeichert werden nur Metadaten. Die Verbindung zwischen Person und Voice Print ist nicht offensichtlich. Trotzdem sollten die betroffenen Kunden ihre Zustimmung zur Sprechererkennung geben können – idealerweise durch explizite Zustimmung per Opt-in oder über eine klar kommunizierte Opt-out-Möglichkeit. In der EU ist die Opt-in-Variante bereits Vorschrift.


Unmittelbarer Nutzen

Durch Identifizierung per Voice-Biometrie lässt sich die Gesprächslänge bei telefonischen Kundenanfragen stark reduzieren: Identifikation und Verifikation nehmen typischerweise rund 30% der Gesamtdauer in Anspruch und erfolgen bei Voice-Biometrie vollständig im Hintergrund. Ein grosses Call-Center mit beispielsweise 3,8 Millionen Anrufen pro Jahr spart bei einer durchschnittlichen Gesprächsdauer von 300 Sekunden durch Voice-Biometrie jedes Jahr bis 4200 Arbeitstage ein.

Kommen zusätzliche Voice-Technologien – siehe Box – hinzu, kann die Bearbeitungszeit auf die Hälfte schrumpfen. Auch der Vorteil für die Anrufer liegt auf der Hand: Sie müssen keine lästigen Sicherheitsfragen über sich ergehen lassen, sich keine PIN-Nummern, Passwörter, Kundennummern oder Vertragsnummern merken und werden schneller bedient.Voice-Biometrie unterstützt zudem die Betrugserkennung (Fraud Detection) und ermöglicht, unerwünschte Anrufer abzuweisen (Blacklisting).

Eine Voice-Biometrie-Lösung eignet sich grundsätzlich überall dort, wo ein Contact/Call Center im Einsatz steht und lohnt sich bereits ab wenigen hundert Kontakten pro Monat. Swisscom nutzt Voice-Biometrie seit mehreren Monaten für die eigene Hotline und hat sehr gute Erfahrungen gemacht.

Interessierten Kunden bietet Swisscom die Lösung für ihr eigenes Call-Center an. Am Anfang steht dabei stets ein Proof-of-Concept. Dieser kann unabhängig von der bestehenden Call-Center-Infrastruktur betrieben werden, so dass der Kunde die Leistungen prüfen kann. Dazu gehören nicht nur die Anrufer Identifikation per Voice-Biometrie, sondern auch Funktionen wie Speech-to-Text und AVR – und die Swisscom-Lösung versteht sogar Schweizerdeutsch. Das beherrschen vergleichbare Angebote nicht.


Sprecher-Erkennung und Spracherkennung


Bei der Voice-Biometrie geht es um die Erkennung der individuellen Merkmale der Stimme einer Person. Zusammengenommen ergibt sich ein Stimmabdruck, mit dem sich die Person eindeutig identifizieren, validieren und authentifizieren lässt. Und zwar völlig unabhängig vom gesprochenen Inhalt.

Voice-Biometrie ermöglicht somit die Sprecher-Erkennung. Spracherkennung oder Voice Recognition ist etwas Anderes: Dabei wird erkannt, in welcher Sprache gesprochen wird, und der gesprochene Inhalt wird analysiert und in Text umgewandelt. Mit Voice Recognition arbeiten Anwendungen wie IVR (Interactive Voice Response, automatisches Sprachdialogsystem), AVR (Automatic Voice Recognition) und Speech-to-Text (Umwandlung der gesprochenen Inhalte in Text).




Mehr zum Thema