Big Data bezeichnet sehr große, komplexe und schnell wachsende Datenmengen, die mit herkömmlichen Methoden kaum noch zu erfassen, zu speichern oder zu analysieren sind. Es geht dabei nicht nur um die Menge an Daten, sondern auch um deren Vielfalt und Geschwindigkeit.
Merkmale von Big Data
- Volume (Datenmenge)
- Riesige Datenmengen, z. B. aus sozialen Netzwerken, Sensoren, Online-Shops oder Maschinen.
- Velocity (Geschwindigkeit)
- Daten entstehen und verändern sich in Echtzeit (z. B. Finanztransaktionen, Live-Sensordaten, Streaming).
- Variety (Vielfalt)
- Unterschiedliche Datenarten:
- Strukturiert (Tabellen, Datenbanken)
- Unstrukturiert (Texte, Bilder, Videos, Audio)
- Semi-strukturiert (z. B. JSON-Dateien, Log-Daten).
- Unterschiedliche Datenarten:
(Manchmal ergänzt durch weitere V’s wie Veracity = Zuverlässigkeit der Daten oder Value = Wert der Daten.)
Beispiele für Big Data:
- Soziale Medien: Milliarden von Posts, Likes, Kommentaren.
- E-Commerce: Kaufverhalten, Klicks, Kundenprofile.
- Industrie 4.0 / IoT: Sensordaten von Maschinen, Fahrzeugen oder Smart-Home-Geräten.
- Medizin: Genomdaten, Patientendaten, Bilddiagnostik.
Nutzen von Big Data:
- Analyse von Mustern und Trends (z. B. im Konsumverhalten).
- Vorhersagen (Predictive Analytics, z. B. Wetter, Nachfrageprognosen).
- Optimierung von Prozessen (z. B. in Logistik oder Produktion).
- Personalisierung von Angeboten (z. B. Netflix-Empfehlungen).
Kurz gesagt:
Big Data bedeutet: sehr viele, sehr vielfältige und sehr schnell entstehende Daten, deren Verarbeitung spezielle Technologien und Methoden benötigt, um daraus Erkenntnisse und Wert zu gewinnen.