Wahl der Attribute
Hinweis: Die Daten sind fiktiv.Du siehst hier drei Punktdiagramme. Wie zuvor entsprechen die grünen Punkte allen pünktlichen und die roten Punkte allen verspäteten Verbindungen.
Du kannst die Diagramme hier herunterladen: Diagramm 1 Diagramm 2 Diagramm 3
Aufgabe 1 - Einschätzung
In den obigen Punktdiagrammen ist je eine weitere Verbindung (blau) eingezeichnet (vergrößere ggf. die Darstellung).
- Bestimme mit der 3-Nächste-Nachbar-Klassifikation, ob es sich um eine pünktliche oder verspätete Verbindung hält.
- Diskutiere, welches der Diagramme für die K-Nächste-Nachbar-Klassifikation am besten geeignet ist.
Aufgabe 2 - erneute Einschätzung
Vielleicht ist dir schon aufgefallen, dass in den obigen Punktdiagrammen die erklärenden Attribute nicht angegeben sind. Es handelt sich bei den drei blauen Verbindungen
um die gleiche Verbindung. Allerdings sind in den Punktdiagrammen andere erklärende Attribute abgetragen. Betrachte dir nun die obigen Diagramme mit den
Beschriftungen der Attribute.
Über die Punktdiagramme ist vorgegeben, welche erklärenden Attribute zur Klassifikation genutzt werden. Das sind:
Du kannst die Diagramme hier herunterladen: Diagramm 1 Diagramm 2 Diagramm 3
- Bewerte, ob du mit diesem Wissen die Verbindung genauso wie in Aufgabe 1 klassifizieren würdest.
- Begründe, welches der Diagramme du für die Klassifikation nutzen würdest.
- im ersten Punktdiagramm: geplante Reisezeit & geplante kürzeste Umstiegszeit.
- im zweiten Punktdiagramm: geplante Reisezeit & Alter der reisenden Person
- im dritten Puntkdiagramm: geplante Reisezeit & Reisetag
geplante Reisezeit (min) | geplante kürzeste Umstiegszeit (min) | Reisetag | Alter der reisenden Person | Klasse |
---|---|---|---|---|
50 | 5 | 3 | 31 | unpünktlich |
84 | 4 | 201 | 45 | unpünktlich |
91 | 5 | 5 | 61 | pünktlich |
... | ... | ... | ... | ... |
Aufgabe 3 - Auswahl der erklärenden Attribute
- Erkläre, woran ein Zusammenhang zwischen zwei Attributen und der Klassenzugehörigkeit grafisch erkennbar ist. Nutze für deine Erklärungen gerne die
drei obigen Punktdiagramme.
Die Attribute beeinflussen die Lage der Punkte im Punktdiagramm. - Erläutere, wie du einen Zusammenhang zwischen drei Attributen und der Klassenzugehörigkeit erkennen kannst.
- Begründe woran du einen Zusammenhang zwischen einem Attribut und der Klassenzugehörigkeit erkennen kannst. Benötigst du dafür ein Punktdiagramm?
Wir betrachten nun ein dreidimensionales Punktdiagramm.
Grafisch betrachten wir hier nurnoch eine Art Zahlenstrahl. Du kannst aber auch über die Tabelle argumentieren.
Merke: Das Modell nutzt die Attribute, die auf Basis der Datengrundlage die besten Vorhersagen generieren. Dies müssen nicht unbedingt thematisch sinnvolle
Attribute sein. Deshalb ist ein Modell immer nur so gut wie die zugrundeliegenden Daten!
Aufgabe 4 - Repräsentative Datengrundlage
In der Fachsprache nennt man eine 'gute Datengrundlage' repräsentativ.
- Recherchiere die Definition des Begriffs 'repräsentativ'.
- Gib je ein Beispiel für eine repräsentative Datenerhebung und ein Beispiel für eine nicht-repräsentative Datenerhebung an.