Datenexploration: Unterschied zwischen den Versionen
Thomas (Diskussion | Beiträge) Die Seite wurde neu angelegt: „== Datenexploration == Die '''Datenexploration''' ist ein wichtiger Schritt in der Datenanalyse und im maschinellen Lernen. Sie dient dazu, ein tiefes Verständnis von Datensätzen zu gewinnen, bevor man sie für weitere Analysen oder Modellierungen verwendet. === Ziele der Datenexploration === * '''Verständnis der Datenstruktur''': Erkennen von Datentypen, Beziehungen zwischen Variablen und der allgemeinen Organisation des D…“ |
Thomas (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
||
(Eine dazwischenliegende Version desselben Benutzers wird nicht angezeigt) | |||
Zeile 19: | Zeile 19: | ||
* '''Dimensionsreduktion''': Reduzierung der Anzahl der Variablen in einem Datensatz, um die Komplexität zu verringern und die Leistung von Modellen zu verbessern. | * '''Dimensionsreduktion''': Reduzierung der Anzahl der Variablen in einem Datensatz, um die Komplexität zu verringern und die Leistung von Modellen zu verbessern. | ||
=== | === Prozess der Datenexploration === | ||
[[Datei:Prozess Datenexploration.png|mini]] | |||
Die Datenexploration setzt häufig folgende Arbeitsschritte voraus: | |||
* | * Rohdaten aus einer Datenquelle einlesen | ||
* | * Daten anpassen, bereinigen oder vorauswerten. | ||
* Ergebnis visualisieren. | |||
* | |||
=== Weiterführende Ressourcen === | === Weiterführende Ressourcen === |