Als BIG DATA werden Datenmengen bezeichnet, welche beispielsweise zu groß, zu komplex, zu schnelllebig oder zu schwach strukturiert sind, um sie mit manuellen und herkömmlichen Methoden der Datenverarbeitung auszuwerten. Im Zusammenhang mit AI verwendet man den Begriff häufig, da Daten gerne als “Treibstoff der KI” bezeichnet werden. Oft wird BIG Data mit 4 Dimensionen beschrieben (IBM und Gentsch), das sind:
Volume: die Menge der anfallenden Daten
Velocity: die Daten werden mit hoher Geschwindigkeit erzeugt und müssen in Echtzeit gespeichert und aufbereitet werden
Variety: ist die Datenvielfalt (Video, Audio, Bilder, Texte)
Veracity: die Qualität und Glaubhaftigkeit der Daten