Herfindahl-Hirschman-Index als Maß für die Diversität von Herkünften auf Gemeindeebene [deutsch]

In einem kürzlich erschienenen Sammelband präsentierte Prenzel (2024) eine Auswertung zur sog. kulturellen Diversität der deutschen Bevölkerung, operationalisiert als inverses Konzentrationsmaß (Fraktionalisierung) verschiedener Geburtsländer. Berechnet wurde das Maß mit Ergebnissen des Zensus 2011, die in diesem Fall jedoch räumlich nicht sehr tief gegliedert vorlagen. 

Für den Zensus 2022 sind die erforderlichen Daten nun deutlich detaillierter auf Ebene der Gemeinden verfügbar. Es soll daher im Folgenden eine kurze Replikation der Auswertung von Prenzel mit neueren Daten und höherer räumlicher Auflösung gezeigt werden. Außerdem werden weitere Analysen angerissen, die durch die höhere räumliche Auflösung erst möglich werden.

Konzentrationsmaß 'Fraktionalisierung'

Es ist naheliegend, "Diversität" als Gegenbegriff zu Homogenität zu verstehen. Zur Quantifizierung bieten sich daher Konzentrationsmaße an. Die von Prenzel (2024, S.78) verwendete Kennzahl der 'Fraktionalisierung' entspricht dabei dem bekannten Herfindahl-Hirschman-Index (HHI) (Hirschman, 1945 sowie Herfindahl, 1950).

Der HHI ist definiert als die Summe quadrierter Anteile. Im hier betrachteten Fall: Für eine Region mit $N$ Einwohnern aus $M$ verschiedenen Geburtsländern berechnen wir \[HHI := \sum_{j=1}^M \left(\frac{N_j}{N}\right)^2\] wobei $N_j$ die Anzahl Einwohner aus dem $j$ten Geburtsland bezeichnet (mit $j = 1, \ldots, M$). Der Index nimmt Werte im Bereich $\left[\frac{1}{M}, 1\right]$ an, wobei $HHI = 1$ dem Fall entspräche, dass alle Einwohner dasselbe Geburtsland aufweisen (maximale Konzentration), $HHI = \frac{1}{M}$ dem, dass alle Geburtsländer genau gleich häufig vertreten wären (maximale Fraktionalisierung). 

Ein hoher HHI weist demnach ganz allgemein eine Konzentration der Wohnbevölkerung auf ein oder wenige Geburtsländer aus, ein niedriger HHI eine Bevölkerung, die hinsichtlich dieses Merkmals sehr divers ist.

Datenverfügbarkeit

Mit Hinblick auf die räumliche Auflösung der Ergebnisse des vergangenen Zensus 2011 schreibt Prenzel (2024, S.82): "So ist zum Beispiel aus wirtschaftsgeographischer Perspektive die Verfügbarkeit granularer räumlicher Daten, die benötigt werden, um regionale Unterschiede in Deutschland zu untersuchen, nach wie vor sehr schlecht."  

Da die Auszählung nach einzelnen Geburtsländern beim Zensus 2011 aus Gründen des Datenschutzes erst ab der Ebene der Regierungsbezirke aufwärts verfügbar war, konnten auch nur für diese groben Geografien Fraktionalisierungsindizes berechnet werden. Die Autorin bemerkt: "Kleinere geographische Gebiete sind anhand dieser (absolut anonymen und öffentlich verfügbaren) Datenquelle nicht möglich und präzisere Muster (wie z.B. mögliche Stadt-Land-Unterschiede) sind nicht abzubilden." (Prenzel, 2024, S.79)

Beim Zensus 2022 kam in Deutschland die sog. Cell-Key-Methode zur Wahrung der Vertraulichkeit statistischer Angaben zum Einsatz. Dieses Verfahren erlaubt die Veröffentlichung von Ergebnissen mit größerem Detailgrad unter Wahrung des Datenschutzes (Enderle & Kleber, 2024). Die von Prenzel (2024) verwendeten Angaben zu Bevölkerungszahlen nach Herkunftsländern liegen infolgedessen nunmehr auf Ebene der mehr als 10000 Gemeinden in Deutschland vor. Dadurch wird es möglich, die Auswertung nicht nur zeitlich zu aktualisieren, sondern auch räumlich zu vertiefen.

Aktualisierte und erweiterte Ergebnisse

Mit Ergebnissen des Zensus 2022 ergibt sich für Deutschland insgesamt ein HHI der Geburtsländer i.H.v. 0,66. Doch wie von Prenzel (2024) angedeutet, verbirgt sich hinter dieser Kennzahl eine erhebliche Heterogenität von Regionen. Die folgende Karte zeigt Ergebnisse auf Gemeindeebene.

Herfindahl-Hirschman-Index (HHI) des Geburtslandes für deutsche Gemeinden auf Basis der Ergebnisse vom Zensus 2022

Wie von Prenzel vermutet, zeigen sich die Großstädte und ihre Ballungsräume als "diverser" als der ländliche Raum. Auch ist ein klarer Unterschied zwischen den alten und den neuen Bundesländern unverkennbar.

Der Methode von Prenzel folgend, lassen sich die Regionen (hier: Gemeinden) auch in Quantile einteilen. So ergibt sich eine Gruppe der 25% "diversesten" Gemeinden, eine der 25% "am wenigsten diversen" und zwei Zwischengruppen. Das ergibt das folgende Bild:

HHI des Geburtslandes (in Quantilen) für deutsche Gemeinden auf Basis der Ergebnisse vom Zensus 2022

Eine weitere Möglichkeit ist die Darstellung relativ zum nationalen HHI. In der folgenden Karte ist für jede Gemeinde die Differenz ihres Indikatorwerts zum nationalen Wert abgebildet. Dabei stehen Abweichungen nach oben für Gemeinden, die weniger "divers" sind als die Nation insgesamt, solche nach unten für das Gegenteil.

HHI des Geburtslandes (Differenz zum nationalen Durchschnitt) für deutsche Gemeinden auf Basis der Ergebnisse vom Zensus 2022

Die Verfügbarkeit von Einwohnerzahlen nach Geburtsland auf Gemeindeebene erlaubt es ferner, auch Indikatoren für Kompositregionen zu errechnen, die aus Gemeinden zusammengesetzt sind. Ein Beispiel dafür sind die Typisierungen des Bundesinstituts für Bau-, Stadt- und Raumforschung (BBSR). 

So können wir zum Beispiel den HHI bestimmen über alle Gemeinden eines bestimmten Gemeindetyps (in Klammern jeweils die Differenz zum nationalen HHI):

  • Großstadt: 0,57 (-0,09)
  • Mittelstadt: 0,65 (-0,02)
  • Größere Kleinstadt: 0,71 (+0,05)
  • Kleine Kleinstadt: 0,77 (+0,11)
  • Landgemeinde: 0,83 (+0,17)

Oder wir interessieren uns für Gemeinden nach ihrer Lage:

  • sehr zentral: 0,59 (-0,07)
  • zentral: 0,69 (+0,03)
  • peripher: 0,76 (+0,10)
  • sehr peripher: 0,85 (+0,18)

Oder wir wollen der Frage nachgehen, ob "Diversität" einen Zusammenhang mit der Bevölkerungsentwicklung (2017-2022) in Gemeinden zeigt:

  • überdurchschnittlich wachsend: 0,65 (-0,01)
  • wachsend: 0,64 (-0,03)
  • keine eindeutige Entwicklungsrichtung: 0,66 (-0,01)
  • schrumpfend: 0,75 (+0,08)
  • überdurchschnittlich schrumpfend: 0,82 (+0,15)
Ein weiteres Beispiel für Kompositregionen sind Wahlkreise für die Bundestagswahl. Wir können unseren "Diversitäts"-Index für alle deutschen Wahlkreise bestimmen und ihn in Verbindung mit den Ergebnissen der jüngsten Bundestagswahl darstellen:

Herfindahl-Hirschman-Index (HHI) des Geburtslandes auf Basis der Ergebnisse vom Zensus 2022 und Zweitstimmenanteil ausgewählter Parteien bei der Bundestagswahl 2025 für deutsche Wahlkreise

Dabei fällt zum Beispiel auf, dass in Wahlkreisen, in denen die Diversität der Geburtsländer niedrig ist (HHI hoch), tendenziell unterdurchschnittlich stark GRÜNE und SPD gewählt wird. AfD und BSW hingegen verzeichnen in solchen Wahlkreisen überdurchschnittlich hohe Stimmenanteile.

Schlussbemerkung

Räumlich und sachlich tiefer gegliedertes Zahlenmaterial erlaubt es nicht nur, dieselbe Auswertung granularer vorzunehmen. Vielmehr ergeben sich dadurch auch neue Auswertungsmöglichkeiten, hier etwa im Zusammenhang mit der Geografie von Wahlkreisen. Mit Anderson (1972) gesprochen: More is different!

Im Fall des deutschen Zensus wurde die Auswertungstiefe 2022 im Vergleich zu 2011 durch die Anwendung einer innovativen Methode der statistischen Geheimhaltung deutlich vergrößert. Das zeigt, dass solche Methoden wichtige Ermöglicher sein können: sie verbessern den Datenzugang und verbreitern das Analysespektrum.

Hinweise zur Umsetzung

Die Anzahl von Einwohnern nach Geburtsland auf Gemeindeebene sind über die Zensusdatenbank abrufbar (Tabellencode: 1000A-1016). Angaben zur Raumtypisierung nach Gemeindetyp, Lage und Bevölkerungsentwicklung stammen vom BBSR, die zur Zuordnung von Wahlkreisen und zu den Ergebnissen der Bundestagswahl 2025 von der Website der Bundeswahlleiterin. Shapefiles für Karten sind beim Bundesamt für Kartografie und Geodäsie (BKG) zu finden.

R-Code zur Replikation des Gezeigten können wie stets auf meiner GitHub-Seite heruntergeladen werden.

Literatur

P.W. Anderson, "More is different: Broken symmetry and the nature of the hierarchical structure of science," Science, vol. 177, no. 4047, S.393-396, 1972. Link

T. Enderle, B. Kleber, "Geheimhaltung mit der Cell-Key-Methode im Zensus 2022," WiSta - Wirtschaft und Statistik, vol. 6/24, S.82-91, 2024. Link

O.C. Herfindahl, Concentration in the Steel Industry, 1950.

A.O. Hirschman, National Power and the Structure of Foreign Trade, 1945. 

P. Prenzel, "'Kann man das überhaupt messen?' - Der Bedarf an detaillierten räumlichen Bevölkerungsdaten in der Wirtschaftsgeographie," in: D.S. Valentiner & K. Goldberg (Hrsg.), Zensus 2022 - Volkszählung zwischen Recht, Politik und Sozialwissenschaften, S.65-86, 2024. Link

Kommentare

Beliebte Posts aus diesem Blog

On the reversibility of Voronoi geomasking

Derivation of the expected nearest neighbor distance in a homogeneous Poisson process