Suchen

Voice-Technologie

Warum ist Voice das nächste große Interface?

| Autor/ Redakteur: Max Elster * / Annika Lutz

2018 – ein Jahr, in dem die Begriffe „Alexa“, „Hey Google“ und „Siri“ einen exklusiven Bekanntheitsgrad bekommen konnten. Das Thema ist längst in jeder Geschäftsführung angekommen und auf so gut wie jeder Digitalisierungsagenda zu finden gewesen. Doch ist es wirklich die nächste große Revolution in Zeiten des Internets? Oder doch nur ein kurzer Hype?

Firma zum Thema

Voice-Technologie erhält Einzug in den (Unternehmens-)Alltag – dies bringt auch einige Herausforderungen mit sich.
Voice-Technologie erhält Einzug in den (Unternehmens-)Alltag – dies bringt auch einige Herausforderungen mit sich.
( Bild: gemeinfrei / CC0 )

Laut einer Pindrop Umfrage, die 500 IT und Wirtschaftsentscheider in USA, Frankreich, Deutschland und Großbritannien angefragt hatten, rechnen 84 Prozent der Unternehmen damit, Voice Technologien in Zukunft mit Kunden einzusetzen.

Smart Speaker, wie der Amazon Echo, der Google Home oder auch der Apple Homepod lassen sich schon heute in vielen Wohnungen und Wohnzimmer der diversen Haushalte in Deutschland und international auffinden. Über 11 Millionen Deutsche nutzen aktuell einen Smart Speaker. In Amerika sind es mittlerweile über ein Drittel, die regelmäßig mit einem Sprachassistenten interagieren. Die Zahlen sprechen für sich – somit für eine Revolution und nicht für ein Hype. Doch was steckt hinter den Zahlen? Warum deutet dies auf einen Interface-Wechsel hin? Im Grunde genommen steckt hinter dem ganzen Thema nun im ersten Schritt der Gedanke, dass der Mensch die eigene Sprache nutzen kann, um damit Befehle auszuführen. Bisweilen war es so, dass eine E-Mail getippt wurde – in Zukunft kann es sein, dass jeder die Mail einsprechen wird, um Zeit zu sparen. Im Folgenden werden einige Punkte erläutert, um den Hintergrund dieser Dynamik der Voice Technologie deutlicher zu machen.

Wandel von Web über Social Media zu Voice

Rückblickend ist es immer so gewesen, dass das bisherige Interface entschieden hat, inwiefern ein Unternehmen die Chance hatte, mit den eigenen Kunden zu interagieren. Das World Wide Web, welches wesentlich 1989 von dem britischen Wissenschaftler Tim Berners-Lee erfunden wurde, sollte eine Möglichkeit schaffen, Informationen zwischen Universitäten und Wissenschaftlern weltweit zu teilen. Aufbauend auf dieser Grundidee hatten mittelfristig auch Unternehmen Ende der 90er / Anfang der 2000er die Chance, sich selber im Internet zu präsentieren, um darüber Kunden oder Interessenten zu gewinnen. Sichtbarkeit war das passende Stichwort zu der Zeit. Dennoch gab es keine direkte Möglichkeit, mit den Kunden, schon gar nicht in Echtzeit, zu interagieren.

Social Media im nächsten Schritt, unterstützt durch Plattformen wie Facebook, Twitter, LinkedIn, XING oder auch Instagram, ermöglichte es erstmalig, dass Unternehmen online die Möglichkeit hatten, mit Kunden direkt zu interagieren und zeitnah auch auf gezielte Fragen zu antworten. Zudem liefert Social Media die Möglichkeit, eine Antwort teilbar zu machen, um diese Hunderten von anderen Nutzern oder Unternehmen zur Verfügung zu stellen. Social Media eröffnete als Interface ganz neue Möglichkeiten, digital, effizient und einfach mit den Endkunden in Kontakt zu kommen, um auch das Feedback der Nutzer zu verwenden für Produkt- oder auch Prozessverbesserungen. Vorteile, die eine Webpräsenz alleine durch eine Webseite nicht ermöglicht.

Doch was verändert sich nun durch das neue Interface Voice? Unternehmen stehen erneut vor einigen Herausforderungen, ähnlich wie in Zeiten der Web- oder der Social-Media-Phase. Grundsätzlich ist es unumstritten, dass Voice ein Interface darstellt, welches Unternehmen die Chance gibt, auf authentische und menschennahe Art und Weise mit den Kunden zu interagieren und Sprache als Tool zu nutzen für einen einfacheren Verkaufsprozess beispielsweise. Ein Beispiel: eine Frau sucht nach einer neuen Hose. Diese soll grau sein, von einer bestimmten Marke und der für sie passenden Größe. Sie fragt den Amazon Sprachassistenten: “Alexa, welche graue Hose kannst du mir von Marke x mit meiner Größe empfehlen?” Alexa öffnet in Folge dessen möglicherweise in Zukunft den Zalando Store und gibt dem User die Möglichkeit, die Hose direkt über die eigene Sprache in wenigen Schritten zu kaufen. Der Kaufprozess wird um ein vielfaches verkürzt.

Doch hat ein Unternehmen in der Vergangenheit jemals darüber nachgedacht, wie die eigene Marke klingen soll? Womöglich nicht. Unternehmen müssen sich in 2019 erstmals Gedanken darüber machen, wie ihre Marke klingen soll. An welche Stimme, an welche Geräuschkulissen und an welche Sprachinteraktion sollen Menschen denken, wenn sie einem Unternehmen „zuhören“? Eine Frage, die Unternehmen in Zukunft beschäftigen wird und auch beschäftigen sollte.

Der Fortschritt der Sprachtechnologie

Der Grund, warum genau jetzt das Thema Voice ein relevantes ist, liegt nicht in der Willkür der US-amerikanischen Großkonzerne. Sprachtechnologie im Wesentlichen hat sich in den letzten zwei bis drei Jahren erheblich verbessert. Die Erkennungsrate der Wörter liegt mittlerweile in Deutsch als auch in der englischen Sprache bei über 90 Prozent. Dies bedeutet, dass im Grundsatz über 90 Prozent der eingesprochenen Worte erkannt werden. Dies klingt möglicherweise für den ein oder anderen nicht viel, ist jedoch technologisch ein Riesensprung gewesen. Technologie bestimmt hier somit weiterhin den Weg. Je schneller die Technologie der Sprache verbessert, optimiert und angepasst wird an die Menschen, desto schneller können wir auch mit fortgeschritteneren Applikationen rechnen. Wann hier jedoch mit einer 100 prozentigen Erkennungsrate gerechnet wird, ist noch unklar.

Bereitstellung der Plattformen

Ein sehr wesentlicher Grund, warum das Thema Voice nahezu in allen Unternehmen eine Relevanz hat, ist die auch in diesem Bereich vorgelebte Plattformökonomie. Plattformen, wie Amazon oder auch Google haben mit dem Launch ihrer eigenen Assistenten beziehungsweise Smart Speaker ganz eigene neue Plattformen aufgebaut und entwickelt. Diese Plattformen ermöglichen es den Unternehmen, dieses Thema nun auch zielgruppengerecht, schnell und effizient zu testen. Die Einfachheit und Funktionalität der Smart Speaker von heute eröffnen Unternehmen viele Türen, um mit Kunden über Marketingmethoden (beispielsweise Content) anderweitig in Kontakt zu kommen. Die Deutsche Bahn beispielsweise startete schon früh den eigenen Deutsche Bahn Skill, um hier ihren Endnutzern die Möglichkeit zu geben, Bahnverbindungen auch nebenbei über einen Sprachassistenten abzufragen. Mittlerweile hat die Deutsche Bahn ein mehrköpfiges Team, welches sich ausschließlich um den Deutsche Bahn Alexa Skill kümmert.

Darüber hinaus ist zu sagen, dass die Simplizität für jedermann verständlich ist. Voice ermöglicht es erstmalig in der Geschichte der Menschheit, dass sowohl alte, als auch junge Menschen mit Technologie agieren können. Kinder und auch ältere Menschen können über die eigene Sprache mit einem Gerät interagieren, welches vor einigen Jahren noch undenkbar gewesen wäre. Die Masse an potenziellen Nutzern und Kunden ist über Sprache ist größer!

Vor- und Nachteile der neuen Plattform Voice

Grundsätzlich ist zu sagen, dass Voice den Unternehmen eine eigene Persönlichkeit oder auch Platz für Humor geben kann. Der Mensch ist in der Lage, dies eher zu verstehen und in einen entsprechenden Kontext zu setzen. Im Speziellen bei weitestgehend noch eher durchschnittlichen Voice-Applikationen kann es anfangs helfen, die Möglichkeiten von einer eigenen Voice-spezifischen Unternehmenspersönlichkeit und einem passenden Humor nicht zu unterschätzen, um dem Nutzer positiv in Erinnerung zu bleiben. Darüber hinaus ist es eindeutig, dass es für einen Menschen deutlich einfacher ist, einen sprachbasierten Befehl abzugeben. Der eigene Komfort und die eigene Effizienz stehen hier im Vordergrund. Nutzer haben nun die Möglichkeit, das Wetter schnell abzufragen oder nach einem Song zu fragen, ohne überhaupt das Handy herauszuholen.

Zusammengefasst fühlt es sich somit nach einer ganz neuen, menschenähnlichen Erfahrung an, die es ermöglicht, dass der Kunde sich nicht in einen neuen Prozess hineindenken muss, sondern diesem klar ist, wie Sprache funktioniert.

Auf der anderen Seite liefert Voice auch einige Schwierigkeiten und Herausforderungen. Ein sehr wesentliches Thema ist die Erkennbarkeit. Wer entscheidet nun letztendlich, welche Voice-Applikation aufgerufen werden soll oder nicht? Wenn ich nach einem T-Shirt frage, öffnet sich dann nun potenziell die Zalando Applikation oder bekomme ich ein T-Shirt von Amazon vorgeschlagen? Fragen, die bisweilen nicht geklärt sind. Letztendlich liegt die Macht bei den Anbietern der Sprachassistenten, aber auch die werden sich an die Wünsche und Anforderungen des Nutzers anpassen müssen. Dazu kommt, dass es gerade in den Anfangszeiten umso wichtiger ist, dass die Nutzer erkennen, dass Sprachtechnologie noch nicht perfekt funktioniert. Die Technologie ist, wie vorhin schon angesprochen, noch nicht weit genug, um alles optimiert zu verstehen. Nutzer müssen sich darauf einstellen, um nicht enttäuscht zu werden. Zuletzt spielt die Komponente der Visualisierung weiterhin eine Rolle, die im Kontext von Voice noch nicht überall aufgegriffen wurde. Im Voice-Kontext spricht man hier oft von Voice+. Dies bedeutet, dass neben der Komponente Sprache dem Nutzer weiterhin auch die Möglichkeit gegeben werden sollte, über einen Bildschirm zusätzlich noch weitere Einblicke zu bekommen. Amazon, Google und auch Apple haben darauf reagiert, und eigene Smart Speaker entwickelt, die auch einen Bildschirm integriert haben. Dies gibt den Nutzern jetzt schon die Möglichkeit, das Gerät nicht nur für Sprachkommandos, sondern auch für visuelle Themen zu nutzen.

Was ist möglich für Unternehmen?

Viele Unternehmen nutzen bisweilen schon das Call-Center oder erste Chat Bots um mit Kunden in Kontakt zu kommen. Jedoch hat der Kunde hier meist ein konkretes Anliegen. Eine intensive Kundenbeziehung beruhend auf interessanten Inhalten und Werten ist jedoch eine Seltenheit. Sprache liefert hier eine Chance, Unternehmen authentisch an die Endkunden zu binden – und das über Inhalte, die einen direkten Mehrwert bieten. Eine Interaktion, wenn erst einmal auch nur über eine technisch gesteuerte Stimme, wird wieder möglich. Das bedeutet, dass wir in Zukunft bei Problemen mit dem Laptop., mit der Spülmaschine oder mit dem Auto nicht mehr das Call-Center anrufen werden, sondern Alexa, den Google Assistant, Siri oder ähnliche Assistenten fragen werden. Konkret ist es empfehlenswert, wenn sich Unternehmen frühzeitig damit beschäftigen, inwiefern sie Sprachassistenten für die Kundenbindung nutzen könnten und wie dies einen Impact haben sollte auf die Entwicklung des Unternehmens.

* Max Elster ist Geschäftsführender Gesellschafter der AmpliVoice GmbH.

Dieser Beitrag ist ursprünglich auf unserem Partnerportal Marconomy erschienen.

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45873162)