In der Datenanalyse mit Tableau kommt es oft vor,​ dass die Datenverschmelzung und die Datenverknüpfung verwechselt werden. Nachfolgend werden die Unterschiede der beiden Methoden dargestellt.

Was ist Datenverschmelzung (Data Blending)?

Die Datenverschmelzung ist eine Methode zum Kombinieren von Daten, die eine Datenquelle mit​ ​einer anderen Datenquelle ergänzt.
Dabei kombiniert Tableau Daten aus einer Tabelle, die einer bestimmten Datenquelle (primäre Datenquelle) zugeordnet sind, mit einer Datenspalte aus einer anderen Datenquelle (sekundäre Datenquelle). Für jede Datenquelle wird eine Abfrage im Arbeitsblatt an die Datenbank gesendet. Die Ergebnisse werden dann zusammen mit den aggregierten Daten an Tableau zurückgesendet. Die Ergebnisansicht verwendet alle Zeilen aus der primären Datenquelle und die aggregierten Zeilen aus der sekundären Datenquelle, basierend auf der Dimension der Verknüpfungsfelder.​​

Beispiel:

Tabelle 1: Team 2014

TeamCoachGames Won in 2014
BadgersJim17
BearsTom24
FalconsRyan28
KnightsSally36
LightningSusan16
LionsNina26
NinjasHannah16
TigersRob43

Hier sieht man ein aggregiertes Ergebnis, d.h. in einer Zeile sieht man das Ergebnis von allen Spielen im Jahr 2014.

Tabelle 2: Games

Home TeamAway TeamDateRuns for Home TeamRuns for Away TeamWinning Team
BadgersBears01.01.201587Badgers
BearsFalcons01.01.201575Bears
FalconsKnights01.01.2015310Knights
KnightsLightning01.01.201543Knights
LightningLions01.01.201535Lions
LionsNinjas01.01.2015610Ninjas
NinjasTigers01.01.201568Tigers
TigersBadgers01.01.201589Badgers
BadgersFalcons04.01.201523Falcons
BearsKnights04.01.201542Bears
FalconsLightning04.01.201508Lightning
KnightsLions04.01.2015106Knights
LightningNinjas04.01.201535Ninjas
LionsTigers04.01.201518Tigers
NinjasBadgers04.01.2015210Badgers
TigersBears04.01.201595Tigers
BadgersKnights07.01.201565Badgers
BearsLightning07.01.201586Bears

Hier sieht man in jeder Zeile das Ergebnis von jedem Spiel.
Nachdem man die Datenverschmelzung aktiviert hat, bekommt man folgendes Ergebnis:

Wann wird die Datenverschmelzung in Tableau genutzt?

Eine Benutzung der Datenverknüpfung (Data Join) würde in diesem Fall wenig Sinn ergeben. Der Grund dafür ist, dass es in der Tabelle Games in jeder Zeile ein Ergebnis pro Spiel gibt. In der Tabelle Team2014 gibt es ein aggregiertes Ergebnis pro Jahr. Würde man diese beiden Tabellen miteinander verknüpfen (Datenverknüpfung), würde Tableau das Ergebnis von der Tabelle Team2014 duplizieren und in die Tabelle Games schreiben. Dies wird mit der Datenverschmelzung vermieden. Achtung: Bei einer Datenverschmelzung geht es nur um eine Linksverknüpfung, d.h. man sollte im Voraus überlegen, welche Tabelle als primäre Tabelle ausgewählt wird.
​​Hier ist ein Beispiel wie man Datenverschmelzung hinzufügt:

Auf dem Arbeitsblatt gehen Sie wie folgt​ ​vor:
-> Daten
-> Beziehung bearbeiten
-> Beziehung hinzufügen

Was ist Datenverknüpfung (Data Join)?

​​Die in Tableau analysierten Daten bestehen häufig aus mehreren Tabellen, die über bestimmte Felder miteinander verbunden sind. Das Verknüpfen ist eine Methode zum Kombinieren der zugehörigen Daten in diesen gemeinsamen Feldern.
​Werden Daten über den rechten Join ​(​Rechtsverknüpfung) ​​verknüpft, dann sendet Tableau eine Abfrage an die Datenbank, in der die Verknüpfung erfolgt. Bei einer ​​Rechtsverknüpfung werden alle Zeilen aus der rechten Tabelle zurückgegeben​ und​ zusätzlich​​ werden alle Zeilen aus der linken Tabelle, die mit der rechten übereinstimmen, ebenso zurückgegeben.

Beispiel:
Tabelle: Team 2013

Baseball TeamCoachGames Won in 2013
BadgersScott17
BearsBill23
FalconsMike28
KnightsSally39
LightningSusan16
LionsNina29
NinjasLisa17
TigersRob42

 

Tabelle: Team 2014

TeamCoachGames Won in 2014
BadgersJim17
BearsTom24
FalconsRyan28
KnightsSally36
LightningSusan16
LionsNina26
NinjasHannah16
TigersRob43

In beiden Tabellen ist das Gesamtergebnis für das jeweilige Jahr in einer Zeile erfasst.

Wann ​wird die ​Datenverknüpfung​ in Tableau genutzt​?

Falls Tabellen mit der gleichen Tabellenstruktur und Logik gegeben sind, kann die Datenverknüpfung eingesetzt werden.
Tableau bietet drei Arten von Verknüpfung:

​Linksverknüpfung (LEFT JOIN)

Wenn Sie die Verknüpfung “Links” verwenden, enthält die erzeugte Tabelle alle Werte aus der linken Tabelle und die entsprechenden Übereinstimmungen aus der rechten Tabelle.
Ist für einen Wert in der linken Tabelle keine entsprechende Übereinstimmung in der rechten Tabelle vorhanden, wird ein NULL-Wert im Datenraster angezeigt.

Rechtsverknüpfung (RIGHT JOIN)

Wenn Sie die Verknüpfung “Rechts” verwenden, enthält die erzeugte Tabelle alle Werte aus der rechten Tabelle und die entsprechenden Übereinstimmungen aus der linken Tabelle.
Ist für einen Wert in der rechten Tabelle keine entsprechende Übereinstimmung in der linken Tabelle vorhanden, wird ein NULL-Wert im Datenraster angezeigt.

Innenverknüpfung (INNER JOIN)

Wenn Sie die Verknüpfung “Innen” verwenden, enthält die erzeugte Tabelle Werte, die Übereinstimmungen in beiden Tabellen haben.

Vollständig außen (FULL OUTER JOIN)

Wenn Sie die Verknüpfung “Vollständig außen” verwenden, enthält die erzeugte Tabelle alle Werte aus beiden Tabellen.
Ist für einen Wert in einer der beiden Tabellen keine entsprechende Übereinstimmung in der anderen Tabelle vorhanden, wird ein NULL-Wert im Datenraster angezeigt.

Hier ist ein Beispiel wie man Datenverknüpfung erstellt:
​​Im Panel “Datenquelle” ​werden bestimmte Blätter aus​gewählt​ und ​über ​die Innen-, Rechts- oder Linksverknüpfung​ zusammengefügt​. Das sind sogenannte Joins.

Zusammenfassung

Datenverschmelzung

Datenverknüpfung

Es handelt sich um LinksverknüpfungEs gibt folgende Typen der Verknüpfung:

  • Linksverknüpfung
  • Rechtsverknüpfung
  • Innenverknüpfung
Datenverschmelzung soll benutzt werden, wenn Tabellenstruktur und Logik nicht identisch sindDatenverknüpfung soll benutzt werden, wenn Tabellenstruktur und Logik identisch sind

 

Probieren Sie es selbst, die obenstehenden Tabellen in Tableau nachzubauen, um die Unterschiede zu verstehen. Anbei eine Excel Datei: Link zur Exceldatei