Fachkonzept - SQL-Join
Ein Wissensspeicher
Verbinden von Datensätzen in SQL
Will man in SQL Daten aus mehreren Tabellen ausgeben, so werden sog. "Joins" gebildet. Dabei muss der Programmierer angeben, wie die Tabellen miteinander verbunden werden sollen.
Die Abarbeitung eines Joins kann man sich in mehreren Schritten vorstellen:
1. Schritt: Auswahl der Tabellen
Zunächst werden im FROM
-Teil alle Tabellen angegeben, die die auszugebenden Daten enthalten. Die Reihenfolge
spielt dabei keine Rolle, z.B.:
SELECT *
FROM benutzer, bild
Das Ergebnis ist unerwartet (nicht alle Attribute gezeigt):
Statt nur passende Daten auszugeben, wird jeder Benutzer mit allen Bildern "gekreuzt"; es entsteht ein
sog. cross join der Tabellen benutzer
und bild
("jeder mit jedem").
2. Schritt: Angabe der Verbindung
Gut erkennbar ist, dass die beiden Attribute PNR (einmal aus der benutzer
-Tabelle, einmal aus der bild
-Tabelle)
nicht zueinander passen. Diese Verbindung der Tabellen muss explizit bei der Abfrage im SQL-Befehl angegeben werden.
Um Doppeldeutigkeiten der Attributnamen zu vermeiden, wird jedem Attribut der Tabellenname vorangestellt:
SELECT *
FROM benutzer, bild
WHERE benutzer.PNR = bild.PNR
Dies liefert (fast) das gewünschte Ergebnis:
Um zwei Tabellen miteinander zu verbinden (engl. to join), muss im WHERE
-Teil des SQL-Befehls eine
Joinbedingung angegeben werden.
Diese legt fest, dass nur "passende" Datensätze ausgegeben werden, bei denen der Fremdschlüssel der
abhängigen Tabelle zum Primärschlüssel der übergeordneten Tabelle passt (sog. inner join).
3. Schritt: Einschränken des Ergebnisses
Im letzten Schritt kann noch die Anzahl der Datensätze durch weitere Bedingungen eingeschränkt werden. Außerdem sollte die Liste der Attribute eingegrenzt werden (z.B. um die doppelten Angaben aus Fremd- und Primärschlüssel zu entfernen):
SELECT benutzer.PNR, benutzer.Name, benutzer.Vorname,
bild.Kategorie, bild.Name
FROM benutzer, bild
WHERE benutzer.PNR = bild.PNR
AND benutzer.Ort = 'Trier'
ORDER BY benutzer.Name
Beachte, dass jetzt bei allen Attributen die zugehörige Tabelle vorangestellt wird.
Bei Bedingungen sollten niemals interne Werte der künstlichen Schlüsselattribute verwendet werden.
Bedingungen der Form bild.PNR=1012
sind sehr fehleranfällig (z.B. wenn
intern einmal Schlüssel geändert werden) und können durch Joins ersetzt werden - auch wenn
dadurch die Anfrage minimal länger dauert.