Daten beschreiben - Variante II
Datensatz II: Datensatz herunterladen
- Lade dir den MovieLens-Datensatz von grouplens, einem Forschungslabor der University of Minnesota, die ihre Datensätze für Lernzwecke zur Verfügung stellen, herunter.
- Entpacke den Datensatz.
- Für unsere Zwecke benötigst du nur die Dateien movies.csv, ratings.csv und README.txt. Die anderen Dateien kannst du löschen.
Aufgabe 1 - Aufbau des Datensatzes
- Öffne die beiden Dateien movies.csv und ratings.csv in Excel oder einem anderen Tabellenkalkulationsprogramm. Auf welches Problem stößt du?
- Öffne die beiden Dateien movies.csv und ratings.csv im Texteditor.
- Erläutere den Aufbau der Daten. Lese zur Beantwortung dieser Fragen den entsprechenden Abschnitt in der Datei README.txt.
- Was steht in den einzelnen Spalten?
- Wie sind die Zeilen aufgebaut?
- Wie hängen die beiden Dateien movies.csv und ratings.csv zusammen?
Aufgabe 2 - Informationen in mehreren Datensätzen
Sammle Argumente dafür, warum es sinnvoll ist, zwei seperate Dateien für die Filmdaten und die Bewertungsdaten anzulegen.
Beachte dabei die folgenden Szenarios:
- Ein Nutzer bewertet einen Film.
- Der Name eines Films wird geändert.
- Ein neuer Film kommt hinzu, der noch nicht bewertet wurde.
- Die Regisseure sollen für alle Filme die schon in den Daten sind zusätzlich gespeichert werden.