Voice Cloning – Ich bin dann mal weg

Von Mischa Hammann

Das war gruselig. Wer immer noch glaubt, Künstliche Intelligenz würde unser aller Leben (und damit auch das Marketing) nicht maßgeblich verändern, der sollte sich die Zeit für diesen Artikel und das daran angeschlossene Voice Cloning Experiment nehmen.

Google arbeitet mit Hochdruck an Produkten, denen Voice AI zu Grunde liegt. Diese sollen uns in Zukunft in den unterschiedlichsten Bereichen helfen. Wir werden suchen mittels Spracheingabe, kaufen ein über Alexa und Co. oder fragen unsere digitalen Assistenten nach den ToDos oder dem Wetter. Längst gehören die Stimmen von Siri und Alexa bei vielen von uns zum Alltag.

Voice Cloning durch Fortschritt unaufhaltsam

Auch die Kinderkrankheiten dieser Geräte nehmen durch die Fortschritte auf Gebieten wie dem Natural Language Processing oder semantischer Contexterkennung ab.

Doch zu einem echten Dialog gehört nicht nur das Hören sondern auch Verstehen und Sprechen. Und das erhöht die Komplexität der geforderten Fähigkeiten von Maschinen enorm. Doch auch auf diesen Gebieten schreitet die Entwicklung in atemberaubenden Tempo voran. Google Duplex beispielsweise – ein KI-System zur Erledigung von Aufgaben am Telefon – ist bereits so lebensecht, dass darüber eine Ethik-Diskussion entbrannt ist, ob und wie Menschen darüber informiert werden müssen, ob sie mit einem Menschen oder einer Maschine sprechen.

Wer jetzt den Kopf schüttelt und meint , das wäre Sience Fiction, dem empfehle ich, sich einmal die beiden Audiofiles in diesem Google AI Blog-Beitrag anzuhören. Intonation, Verzögerungen, Versprecher etc., das alles gepaart mit Hintergrundgeräuschen und einer absolut natürlichen Stimme. Wer kann hier noch feststellen, ob das am anderen Ende der Leitung ein Mensch ist oder eine Maschine?

KI gestützte verbale Kommunikation ist keine Zukunftsmusik

Wir sind im Bereich der Künstlichen Intelligenz also bereits an einen Punkt gelangt, an dem Maschinen weitgehend natürlich mit uns sprechen. Von freier Konversation und Small Talk sind wir sicher noch ein Stück entfernt, aber in klar abgegrenzten Bahnen, wie Terminvereinbarung oder ähnlichem finden Gespräche mit Robotern und KI bereits heute statt.

In dieser Entwicklung steckt unglaublich viel Potenzial für Unternehmen und Produkte. Insofern sind auch die Auswirkungen auf das Marketing von großer Bedeutung, denn letztlich funktioniert jede Form von Marketing über irgendeinen Weg der Kommunikation. Und wo sich Kommunikation und Wahrnehmung verändern, muss ich auch das Marketing verändern. Wir leben als Marketer also in spannenden Zeiten.

Die Schattenseiten von Voice Cloning

Zeit für ein „Aber“. Rufe ich in einem Restaurant an oder beim Friseur, kenne ich in den meisten Fällen nicht den Menschen am anderen Ende der Leitung. Es ist eine fremde Person für mich und entsprechend sachlich wird auch die Kommunikation verlaufen. Was aber, wenn ich die Stimme kenne? Wenn sich der vermeintliche Mensch am anderen Ende der Leitung stimmlich in jede beliebige Person verwandeln kann?

Im Science Fiction Klassiker Terminator 2 – Tag der Abrechnung aus dem Jahr 1991 imitiert der Killer-Cyborg T-1000 täuschend echt das Aussehen und die Stimme der Menschen, die er berührt und zumeist bereits terminiert hat. Das war schon damals gruselig.

In echt aber ist das wirklich unheimlich. Denn zumindest was die Stimme betrifft, ist das nun kein Science Fiction mehr. Lyrebird – ein kleines Kanadisches KI-Unternehmen – hat eine künstliche, intelligente Software entwickelt, die in kürzester Zeit in der Lage ist, einen ziemlich perfekten Klon der eigenen Stimme zu erstellen. Schon nach 30 Sätzen, gesprochen in ein durchschnittliches Mikrofon ertönt „meine“ Stimme aus den Lautsprechern meines Computers. „Ich“ lese Sätze vor.

Noch klingt es etwas blechern, die Maschine bräuchte mehr Proben und ich mehr Geduld beim einsprechen. Außerdem ist mein Englisch nicht perfekt. Aber meine Stimme ist unverkennbar. Ich kann „mir“ in den Mund legen, was ich will.

Das Marketingpotenzial dieser Software möchte ich an dieser Stelle gar nicht weiter vertiefen. Aber gerade diese Software zeigt eindrucksvoller als viele andere, wozu KI heute bereits in der Lage ist. Sie ist ein guter Gradmesser, mit welcher Geschwindigkeit der Zug des leider so überstrapazierten Begriffs der Künstlichen Intelligenz Fahrt aufnimmt. Und wir sollten bedenken: Der Zug wird nie wieder so langsam sein, wie heute.