Pick-by-Voice Wie zuverlässig ist die Spracherkennung mit Schutzmaske?

Redakteur: Jürgen Schreier |

Die Corona-Pandemie sieht umfangreiche Schutzmaßnahmen am Arbeitsplatz vor. So gehört das Tragen von Schutzmasken in Logistikeinrichtungen inzwischen zum Standard. Doch wie kommt die Spracherkennung von Pick-by-Voice-Systemen damit klar?

Anbieter zum Thema

Das Kommissionieren mit Mund-Nasenbedeckung ist in Logistikeinrichtungen mittlerweile Standard.
Das Kommissionieren mit Mund-Nasenbedeckung ist in Logistikeinrichtungen mittlerweile Standard.
(Bild: Ehrhardt + Partner Group)

Angesichts der Corona-Pandemie treffen immer mehr Logistiker Vorkehrungen, um den eigenen Betrieb aufrechtzuerhalten und ihre Mitarbeiter zu schützen. Das Tragen einer Maske bzw. einer Mund-Nasen-Bedeckung gehört – genauso wie im privaten Bereich – mittlerweile in vielen Lägern zur Standardausrüstung.

Welchen Einfluss aber haben diese Schutzmaßnahmen beispielsweise auf die Spracherkennung beim Arbeiten mit Pick-by-Voice? topsystem, ein Unternehmen der EPG (Ehrhardt + Partner Gruppe), hat sich diese Frage gestellt und Lydia Voice in einem computergestützten Testaufbau auf die Erkennersicherheit mit Maske geprüft.

Sprecherunabhängige Spracherkennung im Vorteil

„Das Ergebnis gleich vorweg: Beim sprachgeführten Arbeiten mit Maske zeigen sich einmal mehr die Vorteile des sprecherunabhängigen Systems Lydia Voice, gegenüber Systemen, die auf einem personenbezogenen Sprachprofil basieren“, sagt Tim Just, CEO von topsystem. „Wir haben sehr viel Entwicklungsarbeit in die aktuelle Version unserer Sprachsoftware gesteckt und das macht sich in der Krise bezahlt: Wir helfen Logistikunternehmen mit unserer Technologie dabei, ihren Betrieb aufrechtzuerhalten und trotz Sicherheitsmaßnahmen keine Produktivitätseinbußen in der Kommissionierung hinnehmen zu müssen.“

Bei der Spracherkennung von topsystem, die auf einem neuronalen Netzwerk basiert, sind leichte Abweichungen nur bei einem Maskentyp erkennbar.
Bei der Spracherkennung von topsystem, die auf einem neuronalen Netzwerk basiert, sind leichte Abweichungen nur bei einem Maskentyp erkennbar.
(Bild: Ehrhardt + Partner Group)

Die aktuelle Version Lydia Voice 8, mit der der Test durchgeführt wurde, basiert auf neuronalen Netzen und arbeitet nach dem Deep-Learning-Konzept. Dadurch konnte die Erkennersicherheit um 25 Prozent gesteigert werden, was vor allem für Mitarbeiter mit Dialekt oder starkem Akzent von entscheidendem Vorteil ist.

„Jetzt zeigt sich, dass diese präzise Erkennung selbst mit einem Mund-Nasen-Schutz ohne Anpassungen im System sehr gut möglich ist. Zudem ist kein Sprachtraining – und mit Maske demnach auch kein Nach-Training – notwendig, wie dies bei sprecherabhängigen Pick-by-Voice-Lösungen der Fall sein kann“, ergänzt Tim Just.

Standardisierter Testaufbau

Im Testaufbau wurde standardisiert und computergestützt ermittelt, inwieweit das Tragen einer N95-, FFP2-, Papier- oder Stoffmaske Auswirkungen auf die Spracherkennungsrate mit Lydia Voice in der aktuellen Version hat. Getestet wurde zunächst mit drei verschiedenen Headset-Typen. Die Ergebnisse liegen bei allen Varianten mit Maske bei annähernd derselben Erkennungsrate im Vergleich zum Kommissionieren ohne Maske.

Selbst unter Verwendung von FFP2-Masken, die eigentlich dem medizinischen Fachpersonal vorbehalten sind, sind mit Lydia Voice so gut wie keine messbaren Einbußen zu verzeichnen. Auch das Kommissionieren mit der Lydia VoiceWear besteht den Masken-Test:

Beim Kommissionieren mit der Lydia VoiceWear gab es bei medizinischen FFP2-Masken minimale Veränderungen.
Beim Kommissionieren mit der Lydia VoiceWear gab es bei medizinischen FFP2-Masken minimale Veränderungen.
(Bild: Ehrhardt + Partner Group)

In einem weiteren Versuchsaufbau wurden vergleichbar gute Ergebnisse wie mit Headset erzielt. N95-, Stoff- und Papiermasken haben auch hier kaum messbaren Einfluss auf die Qualität der Spracherkennung, sodass keine Produktivitätseinbußen zu verzeichnen sind.

Leichte Einschränkungen bei FFP2-Masken und Lydia VoiceWear

„Lediglich bei der Nutzung von FFP2-Masken in Kombination mit der Lydia VoiceWear sind leichte Veränderungen zu spüren – aber immer noch im tolerierbaren Bereich“, sagt Tim Just hinzu. „Diese Abweichung ergibt sich aus der Tatsache, dass FFP2-Masken die akustischen Signale konstruktionsbedingt stärker beeinflussen.“

(ID:46621890)