Datenbereinigung und -formatierung
Die Datenbereinigung und -formatierung macht den größten Teil eines Data Science Projekts aus. Dabei stellt man sich vor allem folgende Fragen:
- Sind die Daten richtig (treten beispielsweise falsche Schreibweisen oder Tippfehler auf)?
- Sind Daten doppelt in der Datenbank vorhanden?
- Fehlen bestimmte Daten?
- Liegen die Daten im richtigen Format vor?
- Sind Daten in mehreren Dateien abgelegt? Wenn ja, wie hängen die Dateien zusammen?
Aufgabe - Datenbereinigung und -formatierung unseren Datensatz
Lade dir das
Bearbeite die Aufgaben im Jupyter Notebook.
- Jupyter-Notebook für die Datenbereinigung und -strukturierung Variante 1
- Jupyter-Notebook für die Datenbereinigung und -strukturierung Variante 2
Bearbeite die Aufgaben im Jupyter Notebook.