Daten richtig vernetzen, Big Data und Künstliche Intelligenz

Daten und Datenanalyse im Mittelstand

Was sind Daten und wie können Sie als kleines und mittelständisches Unternehmen von Ihren Daten profitieren? Wir zeigen Ihnen in einem kurzen Überblick die verschiedenen Arten von Daten sowie die Analysemethoden und technischen Hilfsmittel.

Was sind Daten?

Zugegeben, jeder Mensch hat eine gewisse Vorstellung davon, was Daten sind, wenn er danach gefragt wird. Doch der Begriff Daten meint ein breites Feld von Informationsarten mit unterschiedlichem Komplexitätsgraden. Während eine Excel-Tabelle Ihnen durch einfache Mathematik Werte ausrechnen und daraus Graphen erstellen kann, scheitert die gleiche Software daran, wenn Sie ihr die Aufgabe geben, Hunde von Katzenbildern zu unterscheiden. Dennoch sind sowohl die Zahlen als auch die Abbildungen auf den Bildern Daten.

Unsere ganze Welt besteht aus Daten oder besser gesagt Informationseinheiten. Einfach gesagt sind Daten alles, was man speichern, kopieren und bearbeiten kann. Dazu gehören Texte, Bilder, Zahlen, Videos, Tabellen, Datenbanken, Audiofiles und vieles mehr. Sie sind dabei nicht auf die reine Speicherung auf einem Computer beschränkt, sondern auch Papier, Magnetbändern, Film, Vinyl, selbst Grabsteine werden zu Datenträger, sobald Informationen auf ihnen gespeichert werden.

Datenkategorien

Um Daten zu verstehen und damit mit ihnen arbeiten zu können, muss man sie in zwei grundlegende Datentypen unterscheiden: metrische Daten und kategoriale Daten.

Metrische Daten

Metrische bzw. quantitative Daten sind die klassischen, numerischen Daten, die sich mathematisch verarbeiten lassen. Wir können zum Beispiel mehrere Messwerte (Gehälter eines Berufes) nehmen und daraus einen Durchschnitt (Durchschnittseinkommen) bilden.

Kategoriale Daten

Bei kategorialen Daten lässt sich die mathematische Berechnung nicht direkt durchführen. Bei kategorialen Daten handelt es sich um Gruppen oder Mengen mit denselben Eigenschaften. So können wir eine Reihe von Gegenständen sammeln, die rot sind, jedoch lässt sich damit kein Durchschnitt errechnen, der eine Aussagekraft hätte. Diese Daten müssen daher quantifizierbar gemacht werden, damit sie von einem Computer berechnet werden können.

Weitere Unterscheidungen

Darüber hinaus können wir Daten auch noch in andere Kategorien unterteilen. So können sie:

  • Strukturiert (Daten mit gleichartiger Struktur)
  • Semistrukturiert
  • Unstrukturiert (Daten ohne formalisierte Struktur)

sein. Auch der Grad ihrer Beständigkeit ist eine Kategorie, wo wir zwischen transiente (flüchtig) und persistenten (dauerhafte) Daten unterscheiden. Eingabedaten sind zu speichernde Daten und Ausgabedaten gespeicherte Daten.

Datenbegriffe kurz erklärt

Im Bezug auf Daten sind inzwischen viele Begriffe im Umlauf, die verschiedene Kategorien, Technologien, Auswertungsmethoden und Berufe meinen. Wir wollen Ihnen hier einen kurzen Überblick über einzelne Begriffe aus verschiedenen Bereichen geben.

Big Data

Darunter versteht man Massendaten, die zu groß, zu unbeständig oder zu unstrukturiert sind, um sie mit herkömmlichen Methoden der Datenverarbeitung auszuwerten. Jedoch kann die Auswertung dieser Daten ganz neue Erkenntnisse erbringen. Sie werden zum Beispiel bei der Risikobewertung verwendet.

Open Data

Unter Open Data versteht man sämtliche Datenbestände, die im Interesse der Allgemeinheit ohne Einschränkungen zur weiteren Nutzung zugänglich gemacht werden. Dabei handelt es um Daten, die nicht dem Datenschutz unterliegen.

Meta Daten

Metadaten sind strukturierte Daten, die Informationen über Merkmale anderer Daten enthalten. Dabei kann es sich zum Beispiel um den Autorennamen auf einem Buchtitel handeln. Besonders bekannt sind Metadaten bei Bilddateien und Webseiten.

Blockchain

Blockchain ist eine Methode, mit der Daten verschlüsselt werden können. Eine Blockchain ist eine kontinuierlich erweiterbare Liste von Datensätzen (Blöcken), die mittels kryptographischer Verfahren miteinander verkettet sind. Jeder Block enthält einen kryptographisch sicheren Hash (Streuwert) des vorhergehenden Blocks, einen Zeitstempel und Transaktionsdaten.

Algorithmus

Ein Algorithmus ist ganz allgemein eine Reihe von Anweisungen, die Schritt für Schritt ausgeführt werden, um eine Aufgabe zu bewältigen. Vor allem in der Mathematik und in der Informatik sind sie ein wichtiges Thema. Der bekannteste Algorithmus ist der Suchalgorithmus von Google. Aber auch in anderen Bereichen finden sie Anwendung.

Künstliche Intelligenz (KI/AI)

Im Gegensatz zu einfachen Algorithmen sind KIs so gebaut, dass sie mehr oder weniger Probleme durch Lernen lösen können. Diese Intelligenz unterscheidet sich jedoch deutlich von der des Menschen, die allenfalls nur simuliert werden kann. Mehr über Künstliche Intelligenz erfahren Sie hier.

Data Science

Data Science fasst eine Reihe von wissenschaftlichen Methoden zusammen, um Wissen aus Daten zu extrahieren. Die wissenschaftliche Fachrichtung verwendet Techniken und Theorien aus den Fächern Mathematik, Statistik und Informationstechnologie.

Data Engineering

Der Begriff bezeichnet alle Methoden des Informationsmanagements. Ein Data Engineer kümmert sich um die Prozesse rund um die Generierung, Speicherung, Pflege, Aufbereitung, Anreicherung und Weitergabe von Daten.

Datenvisualisierung

Ein weiteres Instrument, um Erkenntnisse aus Daten zu erhalten, ist die Datenvisualisierung. In ihrer einfachsten Form kennen wir sie als Graphen und Diagramme. Jedoch hat sie sich inzwischen weiterentwickelt. So sind heute zum Beispiel 3D-Darstellung möglich. Auch Szenarien- und Prozessdarstellungen sowie interaktive Möglichkeiten sind inzwischen denkbar. So lässt sich zum Beispiel die Auswirkung von Starkregen auf die Kanalisation einer Stadt simulieren, um so herauszufinden, wo Versickerungsmöglichkeiten geschaffen werden müssen.

Auch Konstruktionsdaten (CAD) lassen sich z.B. mit Virtuell Reality visualisieren, um durch die Interaktionsmöglichkeiten einen Entwurf besser zu veranschaulichen. So lassen sich u.a. auch Konstruktionsfehler schneller ausfindig machen. Datenvisualisierung hat deshalb ihre Stärke, da die Vorstellungskraft des Menschen besser stimuliert wird als durch bloße Zahlen und mathematische Formeln.

Lernen Sie Datenvisualisierung von Konstruktionsdaten kennen.

Datenanalyse für kleine und mittelständische Unternehmen

Auch Sie können mit Ihrem Unternehmen von Daten profitieren. So lassen sich zum Beispiel mit ihnen Prognosen erstellen oder fehlende Effizienzen herausfiltern. Es gibt viele Datenanalysemethoden, die Unternehmen dabei helfen, das Potenzial ihrer Daten zu entdecken und ihr Geschäftsprozess zu beschleunigen.

Clusteranalyse

Unter Clusteranalysen versteht man Verfahren zur Entdeckung von Ähnlichkeitsstrukturen in Datenbeständen. Die Datenanalysemethode hilft Unternehmen, ihre Geschäftsergebnisse und ihre Kunden zu verstehen, um bessere Entscheidungen treffen zu können.

So funktioniert Clustering

Datenklassifizierung

Datenklassifizierung ist ein Prozess, in dem strukturierte oder unstrukturierte Daten analysiert und aufgrund ihres Typus und Inhalts in Kategorien eingeordnet werden. Mithilfe der Datenklassifizierung können Unternehmen entsprechende Geschäftsprozesses digitalisieren.

Ausreißererkennung

Die Ausreißerkennung ist eine Datenanalysemethode, die ungewöhnliches Verhalten aufdecken soll. Diese Datenanalysemethode wird in vielen Bereichen eingesetzt. Zum Beispiel in der Betrugserkennung im Finanzbereich, bei der medizinische Diagnose im Gesundheitswesen und zur Produktionsüberwachung in der Fertigungsindustrie.

Regressionsanalyse

Eine statistische Methode, die die Beziehung zwischen zwei oder mehr Faktoren untersucht, z.B. das Verhältnis zwischen der Anzahl der Werbeaktivitäten und dem Verkauf. Diese Technik wird zur Vorhersage, Zeitreihenmodellierung und Ermittlung von Kausaleffekten zwischen den Faktoren verwendet.

Ihre Experten im Bereich "Daten und Datenanlyse":

Prof. Dr. Martin Leucker
Teilprojektleiter Interoperabilität

Prof. Dr. Martin Leucker

Dr. Jinghua Groppe
Datenanalyse und Data Science

Dr. Jinghua Groppe

Sie wollen das Beste aus Ihren Daten herausholen?