Datenbereinigung und -formatierung
Die Datenbereinigung und -formatierung macht den größten Teil eines Data Science Projekts aus. Dabei stellt man sich vor allem folgende Fragen:
- Sind die Daten richtig (treten beispielsweise falsche Schreibweisen oder Tippfehler auf)?
- Sind Daten doppelt in der Datenbank vorhanden?
- Fehlen bestimmte Daten?
- Liegen die Daten im richtigen Format vor?
- Sind Daten in mehreren Dateien abgelegt? Wenn ja, wie hängen die Dateien zusammen?
Abhängig davon, was die Antworten auf diese Fragen sind, müssen unterschiedliche Operationen auf den Daten ausgeführt werden.
Aufgabe - Datenbereinigung und -formatierung unseren Datensatz
Lade dir das
Bearbeite die Aufgaben im Jupyter Notebook.
- Jupyter-Notebook für die Datenbereinigung und -strukturierung Variante 1
- Jupyter-Notebook für die Datenbereinigung und -strukturierung Variante 2
Bearbeite die Aufgaben im Jupyter Notebook.