i

Nächste-Nachbar-Klassifikation

Hinweis: Die Daten sind fiktiv.

Im Zuge einiger Analysen hat die Echte Bahn EB die Daten von 100 im Fernverkehr reisenden Personen erhoben. Für jede Person wurde notiert, ob diese pünktlich an ihrem Ziel ankam (grün) oder nicht (rot). Außerdem wurde unter anderem die geplante Reisezeit und die geplante kürzeste Umstiegszeit notiert. Die Ergebnisse wurden in einem Punktdiagramm festgehalten: Punktdiagramm

Aufgabe 1 - Einschätzung

Eine Person möchte folgende Verbindungen buchen:
  1. von Bonn Hbf nach Berlin Hbf mit einer geplanten Reisezeit von 311 Minuten und einer geplanten kürzesten Umstiegszeit von 23 Minuten
  2. von Kaiserslautern Hbf nach Karlsruhe Hbf mit einer geplanten Reisezeit von 87 Minuten und einer geplanten kürzesten Umstiegszeit von 9 Minuten
  3. von Bamberg Hbf nach Dresden Hbf mit einer geplanten Reisezeit von 174 Minuten und einer geplanten kürzesten Umstiegszeit von 3 Minuten
Begründe mit Hilfe des Punktdiagramms, ob die Person pünktlich an ihrem Ziel ankommen wird.

Nächste-Nachbar-Klassifikation

Die Nächste-Nachbar-Klassifikation ist ein Methode, anhand derer neue Elemente einer Klasse zugeordnet werden können. In unserem Beispiel haben wir zwei Klassen: pünktlich und nicht pünktlich. Für die bereits vergangenen Fahrten von 100 beobachteten Personen wurde die geplante Reisezeit sowie die geplante kürzeste Umstiegszeit notiert und grafisch dargestellt. Die geplante Reisezeit und die geplante kürzeste Umstiegszeit werden als erklärende Attribute bezeichnet. Soll ein neues Element klassifiziert werden, so suchen wir nach dem nächstliegenden Element. Dieses ist dem neuen Element bezüglich der erklärenden Attribute besonders ähnlich und wird deshalb auch 'nächster Nachbar' genannt. Wir ordnen das neue Element der gleichen Klasse zu, wie der seines nächsten Nachbarn.

Aufgabe 2 - Nächste-Nachbar-Klassifikation

Bestimme mit Hilfe der Nächste-Nachbar-Klassifikation, ob die gelisteten Verbindungen püntlich oder unpünktlich sein werden. Diskutiere, wie gut du die Prognose einschätzt.
  1. geplante Reisezeit: 300 Minuten, geplante kürzeste Umstiegszeit 5 Minuten
  2. geplante Reisezeit 150 Minuten, geplante kürzeste Umstiegszeit 12 Minuten
  3. geplante Reisezeit 350 Minuten, geplante kürzeste Umstiegszeit 15 Minuten

K-Nächste-Nachbar-Klassifikation

Oftmals ist es nicht sinnvoll, nur den nächsten Nachbarn zu betrachten, da es immer wieder 'Ausreißer' in den Daten gibt. Bei der K-Nächste-Nachbar-Klassifikation werden die k nächsten Nachbarn betrachtet. Soll ein neues Element klassifiziert werden, so suchen wir nach den k nächstliegenden Elementen, die bezüglich der erklärenden Attribute besonders ähnlich sind. Das neue Element bekommt dann die Klasse, die die Mehrheit der k nächsten Nachbarn haben.
Die K-Nächste-Nachbar-Klassifikation ist ein Klassifikationsverfahren, bei dem ein neues Element einer Klasse in Abhängigkeit davon zugeordnet wird, welche Klasse die k nächsten Nachbarn haben. Die k nächsten Nachbarn sind jene, die bezüglich der erklärenden Attribute den geringsten Abstand zu dem neuen Element haben.

Hinweis: Mehr dazu, was 'geringster Abstand' genau bedeutet, findest du im Abschnitt "Abstandsmaß".

Suche

v
14.5.1.3.2.1
inf-schule.de/projekte/datascience/projekt_empfehlungssysteme/modellentwicklung/knn_erlernen/knn_grundlagen
inf-schule.de/14.5.1.3.2.1
inf-schule.de/@/page/zNPMlZXqQvBKYI9i

Rückmeldung geben