Expertenbeitrag

 Robert Grünwald

Robert Grünwald

Geschäftsführer , Novustat

Big Data Analytics IoT & Big Data Analytics intelligent nutzen: Darauf sollten Sie achten

Autor / Redakteur: Dr. Robert Grünwald / Marlene Mahlo

Die Entwicklungsgeschwindigkeit des Internet der Dinge und Big Data ist enorm und hat Auswirkungen auf alle IoT Analytics-Bereiche eines Unternehmens. Wir zeigen Ihnen die Besonderheiten beim Einsatz von IoT Big Data Analytics für einen Drilldown oder eine Optimierung der Datenmengen.

Anbieter zum Thema

Die Geräte und Sensoren des IoT produzierten stellen häufig auch für Big-Data-Analysen eine große Herausforderung dar.
Die Geräte und Sensoren des IoT produzierten stellen häufig auch für Big-Data-Analysen eine große Herausforderung dar.
(Bild: gemeinfrei / Pixabay )

Durch die Verknüpfung der Geräte und Sensoren mithilfe diverser Kommunikationsprotokolle wie beispielsweise Bluetooth, BLE, ZigBee oder GSM entstehen sekündlich hohe Datenmengen. Ein typisches IoT-System generiert mehrere Millionen Megabyte pro Sekunde. Für die Verarbeitung dieser hohen Datenmengen werden IoT Data Analytics-Technologien eingesetzt. Die Verarbeitung dieser Datenmengen mithilfe der Technologien von IoT Big Data Analytics ist eine große Herausforderung, weil IoT-Geräte unter unterschiedlichen Umgebungsbedingungen ferngesteuert operieren und IoT-Daten auch über hohe Distanzen mithilfe diverser Netzwerktechnologien übermittelt werden.

Herausforderungen für IoT Big Data Analytics

Die großen Herausforderungen liegen in Datenvolumen, Problemen mit Zeit und Raum sowie der Datenqualität. In eine Organisation eingehende Daten können durch Millionen von IoT-Geräten und diversen Sensoren sehr hohe Volumina erreichen. Unternehmen und Analysesysteme für Big Data müssen nach oben skalierbar sein. Falls sich IoT-Geräte in diversen Zeitzonen und geografischen Standorten befinden, muss man diese Informationen bei der Auswertung ebenfalls berücksichtigen. Dadurch allerdings steigen wiederum das Datenvolumen und die Komplexität der Informationen. Bei der Generierung der Daten für IoT Data Analytics muss die Datenqualität sichergestellt werden, weil die Resultate der Analyse von der Vertrauenswürdigkeit und Integrität der Daten abhängig sind. IoT Big Data Analytics sollte außerdem Batch-Analytics und (Pseudo-) Echtzeitanalysen umfassen.

Sicherstellung der Datenqualität

Unvollständige oder fehlerhafte Daten können den Einblick in Fertigungsprozesse verzerren, die technische Fehler, Über- oder Unterproduktion und Produktmängel zur Folge haben können. Mithilfe von Data Profiling können IoT-Datenvolumina auf Daten-Duplikate, unvollständige oder fehlerhafte und fehlende Daten untersucht werden. Die jeweiligen Richtlinien für die Datenintegrität und -vertrauenswürdigkeit sollte der Datenverantwortliche im Unternehmen definieren. Anhand dieser Regelungen werden die IoT-Daten priorisiert und ggf. bereinigt.

Batch Analytics

Um IoT-Aufgaben bewältigen zu können, die auf hohen Datenmengen basieren, ist es von Vorteil, Batch Analytics zu nutzen. Die Datensätze kann man dabei aus verteilten Speichern mit Hadoop MapReduce oder In-Memory-Berechnungen mit Apache Spark verarbeiten. Apache Pig und Hive werden für Datenabfragen und -analysen verwendet. Diese Daten werden dezentral auf Commodity-Servern ausgeführt.

Echtzeitanalysen

Echtzeitanalysen beziehen sich auf Systeme, die von einer sofortigen Rückmeldung abhängig sind. Szenarien für die Echtzeitanalyse sind beispielsweise die Betrugserkennung, Sicherheitsverletzungen oder andere Anomalien in einem IoT-System.

Fazit

Die Datenmengen, die das IoT und die damit verbundenen Geräte und Sensoren produzieren, stellen eine Herausforderung für Datenanalysesysteme dar. Nicht nur die hohen Datenmengen, sondern auch die diversen genutzten Kommunikationsprotokolle, Standort und Zeit sowie die diversen Zeitzonen und geografischen Standorte müssen als Informationen in die bereits bestehenden Datenvolumina einfließen, um verwendbare Resultate mithilfe der Technologien von IoT Analytics und Echtzeiteinblicke in IoT-Daten erhalten zu können.

(ID:46193618)