Best practices Datenvisualisierung mit (Negativ-)Beispielen aus Berichten des Wirtschaftsministeriums [deutsch]

In einer Republik gehört es zu den Aufgabe der Regierung, die für sie entscheidungsrelevanten Daten transparent zu kommunizieren. Eine hochwertige Darstellung der Evidenzgrundlage für politische Entscheidungen in Berichten und Pressemitteilungen erzeugt Vertrauen beim interessierten (Fach-)Publikum, dass die zugrundeliegende Evidenz ausreichend verstanden wurde, dass zuständige Mitarbeiter bei Ministerien klar und nachvollziehbar denken und dass man nicht davor zurückschreckt, die Öffentlichkeit an diesem Denken teilhaben zu lassen. Dieser Beitrag beschäftigt sich mit der visuellen Präsenation von Daten in einer ausgewählten Publikation. Am Anfang steht die Prämisse Edward Tuftes:
"When we reason about quantitative evidence, certain methods for displaying and analyzing data are better than others. Superior methods are more likely to produce truthful, credible, and precise findings." (Tufte, 1997, S.27)

Der Jahreswirtschaftsbericht (im Folgenden JWB) wird zu Beginn eines jeden Jahres durch das Bundeswirtschaftsministerium (BMWK, vorher BMWi) veröffentlicht. Per Gesetz hat er u.a. den Zweck "gesamtwirtschaftliche Orientierungsdaten" zur Verfügung zu stellen und ihre Bedeutung im Hinblick auf wirtschaftspolitische Ziele zu erläutern. 

Der Bericht verwendet dafür Texte, Tabellen und Datengrafiken. Von letzteren werden hier einige ausgesuchte einer konstruktiven Kritik unterzogen. Es wird jeweils ein Alternativentwurf vorgeschlagen, der die Probleme adressiert.

Hinweis: Die den Grafiken zugrundeliegenden Rohdaten sind nicht immer (frei) erhältlich. Für die Alternativentwürfe wurden daher die Daten direkt aus den jeweiligen Plots abgelesen. Die abgebildeten Größen (insbes. auch die auf GitHub zusammen mit dem verwendeten R Code zur Verfügung gestellten) entsprechen somit nicht exakt der vom BMWK verwendeten Datengrundlage.

Beispiel 1: Ladesäulen für E-Autos im Zeitverlauf

Die folgende Grafik stammt aus dem JWB 2022, S.41, dort im Zusammenhang mit Absichtsbekundungen im Bereich E-Mobilität:

  
Was ist an dieser Grafik auszusetzen?
  1. Der dargestellte exponentielle Anstieg erzeugt ein Problem für die Skalierung der vertikalen Achse: Abschnitte von jeweils 10.000, die für die hohen Werte der neueren Jahre angemessen sein mögen, sind viel zu grob, um die geringen Werte früherer Jahre abzulesen. Testfrage: Ist der Wert zum Stichtag 31.12.2012 a) ca. 500, b) ca. 1500 oder c) ca. 2500?
  2. Der Ausweis eines Stichtags (31.12.) legt nahe, dass es sich um jährliche Bestandsaufnahmen handelt. In der Tat dürften die unterjährigen Verläufe unbekannt und hier linear interpoliert sein. Das stört nicht per se, doch eine zeitlich diskrete statt kontinuierliche Darstellung scheint ehrlicher.

Der Alternativentwurf spart sich redundante Nennungen des Stichtags. Dem Bestandscharakter der gezeigten Größen wird ein Säulendiagramm eher gerecht - der exponentielle Charakter der Entwicklung kommt dennoch klar zum Vorschein. Da die Anzahl der abgebildeten Datenpunkte gering ist, können diese direkt beschriftet werden; so entgeht man dem Skalenproblem und entlastet die Leser. Die Achsenabschnitte können bei Bedarf dennoch angedeutet werden, am unaufdringlichsten durch Segmentierung m.H. des Whitespace (Tufte, 1983, S.128).

Alternativentwurf zu JWB 2022, S.41

Take-Away: Lass die Daten diktieren, welche Darstellung sich eignet!

Beispiel 2: COVID-Unterstützungsleistungen und Netzausbau (Nicht-Grafiken)

Eine Nicht-Grafik ist eine in grafischer Form präsentierte Sammlung von Datenpunkten, die durch die grafische Aufbereitung keinen Mehrwert erhält. Ein Mehrwert besteht in der Regel im Verdichten von Informationen und / oder im Sichtbarmachen von in den Daten enthaltenen Mustern.

Umgekehrt heißt das: Wenn der Umfang darzustellender Informationen gering ist, bieten Datengrafiken meist keinen Vorteil gegenüber dem bloßen Nennen der entsprechenden Werte in textlicher oder tabellarischer Form. Sie können aufgrund der geringeren Genauigkeit sogar nachteilig wirken. Die folgenden beiden Beispiele enthalten nur fünf bzw. vier Datenpunkte:

Grafik: BMWK Jahreswirtschaftsbericht 2022, S.24

Grafik: BMWK Jahreswirtschaftsbericht 2022, S.35

Als Alternative bieten sich kleine Tabellen an. Die sind zwar nicht so schön bunt, bündeln Informationen im vorliegenden Fall aber effektiver. Testfragen: Wie viel Mal höher sind ausgezahlte Zuschüsse im Verhältnis zu ausgezahltem Kurzarbeitergeld / übernommenen SV-Beiträgen? Wie viel Prozent der Netzausbauvorhaben befinden sich im Bau? Wie viel Prozent sind zusammen genommen im Betrieb oder in Planfeststellung? 

Man versuche, die Fragen erst anhand der obigen Grafiken, dann mittels der Tabellen zu beantworten. (Wer damit anfängt, ein Lineal auf den Bildschirm zu legen, hat verloren.)

Alternativentwurf zu JWB 2022, S.24

Alternativentwurf zu JWB 2022, S.35

Take-Away: Grafiken sind nicht immer die geeignetste Art, quantitative Informationen zu transportieren.

Beispiel 3: Arbeitsmarktdaten im Zeitverlauf

Die folgende Abbildung versucht, mehrere Zeitreihen in ein Diagramm zu komprimieren. Das Ergebnis ist allerdings nicht nur unelegant, sondern auch offen für Fehlinterpretationen:

Grafik: BMWK Jahreswirtschaftsbericht 2022, S.70

Das offensichtliche Problem besteht in der unbeholfenen Platzierung einer zweiten vertikalen Achse. Neben dem ästhetischen Aspekt ist noch mindestens das Folgende zu bedenken:

  1. Leser werden sich schwer damit tun, die Kurven spontan den richtigen Achsen zuzuordnen. Dies umso mehr, als nicht etwa die beiden blauen Kurven zu einer gehören und die rote zur anderen; vielmehr müssen rot und hellblau links, dunkelblau rechts gelesen werden.
  2. Schwerwiegender ist der Umstand, dass die beiden Achsen, obwohl in gleicher Einheit gemessen, unterschiedlich skaliert sind. Während die linke Skala von unten bis oben 2,5 Mio. Personen umfasst, sind es rechts nur 1,2 Mio. Das bedeutet, dass die Zunahme (oder Abnahme) der Beschäftigung um einen bestimmten Betrag stets ca. 2,1mal so hoch erscheint wie die Zunahme (oder Abnahme) von Arbeitslosigkeit oder Unterbeschäftigung um denselben Betrag. Diese Verhältnis ist willkürlich und könnte je nach Belieben auch halb oder doppelt so groß sein. Ein wesentliches Prinzip der Visualisierung von Evidenz, nach dem die abgebildete Variation den Daten, nicht dem Design entspringen sollte (z.B. Tufte, 1983, S.60f.) ist damit verletzt.

Die einfachste Lösung wäre, zwei Grafiken statt einer anzufertigen. Sollen die Zeitreihen unbedingt im selben Diagramm abgebildet sein, sollte eine einheitliche Skalierung verwendet werden. Liegen die Reihen wie hier um Größenordnungen auseinander, kann das problematisch sein. Eine Möglichkeit besteht dann z.B. darin, statt der absoluten Werte monatsweise Veränderungen abzutragen:

Alternativentwurf zu JWB 2022, S.70, Version 1

In dieser Darstellung sind nun außerdem die einer gemeinsamen Interpretationsgruppe ('Zunahme = schlecht' vs. 'Zunahme = gut') angehörenden Reihen durch eine gemeinsame Farbgruppe (blau vs. rot) gekennzeichnet. Veränderungen per Zeitabschnitt abzubilden hat einen Nachteil: Es wird nicht ersichtlich, wann z.B. nach einer Arbeitsmarktkrise das Vorkrisenniveau (in absoluten Zahlen) wieder erreicht ist. Eine entsprechende Darstellung lässt sich erreichen, indem die im Original abgebildeten Verläufe jeweils auf ein einheitliches Basisjahr indexiert werden:

Alternativentwurf zu JWB 2022, S.70, Version 2

Beide Versionen haben Vor- und Nachteile. Die Variation in den indexierten Reihen hängt stark von der Größenordnung des Bezugs ab; außerdem sollte das Basisjahr klug gewählt sein. Im Zweifelsfall sind zwei Grafiken besser als eine.

Take-Away: Opfere die Integrität einer Darstellung nicht dem Bestreben, Platz zu sparen!

Beispiel 4: Emissionen von Treibhausgasen im Ländervergleich

 Mit der folgenden Grafik gehen wir zurück zum Jahreswirtschaftsbericht 2020:

Grafik: BMWK Jahreswirtschaftsbericht 2020, S.10
 Was fällt auf?

  1. Die horizontale Achse erscheint auf den ersten Blick gewöhnlich. Man muss zweimal hinschauen, um zu erkennen, dass zwar alle Achsenabschnitte gleich lang sind, aber der dadurch repräsentierte Zeitraum am Anfang nur vier Jahre beträgt (statt fünf wie danach), am aktuellen Rand sogar nur zwei. Die Achse ist nicht "zeitecht".
  2. Beachten wir die gewählten Farben. Für die meisten von uns sind sie kräftig und ausreichend voneinander verschieden, um zwischen Legende und Verlaufskurve hin und her zu wechseln. Man sollte allerdings die Möglichkeit einer Farbenfehlsichtigkeit des Lesers im Hinterkopf haben. Das betrifft mindestens das Paar Protanopie / Deuteranopie, die am weitesten verbreitet sind (bis zu 10% der männlichen Bevölkerung).

Eine gute Möglichkeit, ein Farbschema vorläufig auf Barrierefreiheit zu testen, sind online-Simulatoren für Farbenfehlsichtigkeit wie z.B. Coblis. Die Seite erlaubt es, ein Bild hochzuladen und zu simulieren, wie es auf Betrachter mit einer entsprechenden Farbschwäche wirkt. Wenden wir z.B. den Filter für eine ausgeprägte Rotschwäche an, sind die Kategorien 'Indien' / 'Asien und Ozeanien, ohne China und Indien' kaum noch vernünftig zu unterscheiden.

JWB 2020, S.10 mit simulierter Rotblindheit (via Coblis)

Barrierefreie Farbskalen sind mittlerweile gut etabliert: für kontinuierliche Verläufe zum Beispiel die bekannte Viridis-Palette, für diskrete Farbskalen einige der Brewer-Paletten. Sie können das Problem aber häufig nicht völlig lösen: eine Einschränkung des wahrnehmbaren Farbspektrums limitiert notwendig die Anzahl an Farben, die klar voneinander unterschieden werden können.

Für den Alternativentwurf wurde eine Palette von Paul Tol aus dem R-Paket khroma verwendet; sie erlaubt bis zu neun verschiedene Farben. Da bei den hier verwendeten acht geografischen Regionen (unter denen im Übrigen Deutschland nicht einmal getrennt ausgewiesen ist) die Unterschiede je nach Schwere der Fehlsichtigkeit trotzdem klein werden können, empfiehlt es sich, nicht allein auf die Legende zu bauen und Kurven direkt zu beschriften.

Alternativentwurf zu JWB 2020, S.10

Alternativentwurf mit simulierter Rotblindheit (via Coblis)

Der Alternativentwurf korrigiert außerdem die Zeitachse - mit dem Effekt, dass Verläufe am rechten Rand nicht mehr so stark danach aussehen, als erreichten sie jeweils ein Plateau.

Take-Away: Verwende nach Möglichkeit Hilfsmittel für Barrierefreiheit!

Schlussbemerkung

Die vorgeschlagenen Alternativentwürfe sind exemplarisch zu verstehen. Sie sind nicht das Non plus ultra und könnten in jedem Fall noch weiteren Feinschliff vertragen, etwa in puncto Schriftgröße, Seitenverhältnis, Achseneinteilung etc. Die Vorschläge sollen aufzeigen, wie bestimmte charakteristische Schwächen einer Darstellung auf der Design-Ebene adressiert werden können. Sie sollen zum Nachdenken und zur Diskussion anregen, um dem zu begegnen, was John Tukey die "tabula rasa fallacy for display" nannte (Tukey, 1990, S.332).

Hinweise zur Umsetzung

Alle Alternativentwürfe sind mit dem R Paket ggplot2 erstellt; Code und Datenbasis können auf meiner GitHub-Seite heruntergeladen werden.

Literatur

E.R. Tufte, The Visual Display of Quantitative Information, Graphics Press, 1983.

E.R. Tufte, Visual Explanations: Images and Quantities, Evidence and Narrative, Graphics Press, 1997.

J.W. Tukey, "Data-based graphics: Visual display in the decades to come," Statistical Science, vol.5, no.3, S.327-339, 1990.

Kommentare

Beliebte Posts aus diesem Blog

On the reversibility of Voronoi geomasking

Herfindahl-Hirschman-Index als Maß für die Diversität von Herkünften auf Gemeindeebene [deutsch]

Derivation of the expected nearest neighbor distance in a homogeneous Poisson process