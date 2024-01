Im Dezember 2023 sind 98.554 Menschen in Deutschland verstorben. Nach vorläufigen Ergebnissen des Statistischen Bundesamtes (Destatis) verstarben im vergangenen Jahr hierzulande insgesamt 1.020.907 Menschen. Bezogen auf das Vorjahr entspricht dies einem Rückgang um 4,3 Prozent. Obwohl im Vergleich zu 2019 fast 8,7 Prozent mehr Menschen starben, ist von Übersterblichkeit keine Rede. Betrachtet man lediglich die Dezemberzahlen, starben 2023 sogar 18 Prozent mehr als 2019.

Als Gründe für diese Entwicklung führen die Statistiker aus Wiesbaden vor allem die Grippewellen ins Feld. Diese wiesen seit der Corona-Krise ein verändertes zeitliches Muster auf und beeinflussten insbesondere die Entwicklung am Jahresbeginn und -ende. Eine Übersterblichkeit im Sommer gab es im „wärmsten Jahr seit Beginn der Wetteraufzeichnungen“ (ebenfalls) nicht.

Übersterblichkeit herbeigerechnet

Neben mehr oder weniger plausiblen Vermutungen können auch statistische Phänomene eine Übersterblichkeit herbeiführen. Eines davon ist die gewählte Methode. So spricht das Statistische Bundesamt immer dann von Übersterblichkeit, wenn die aktuellen Sterbezahlen größer sind als die Sterbezahlen der Vorjahre.

Allerdings lassen sowohl eine alternde Bevölkerung als auch wachsende Bevölkerungszahlen die Sterbefallzahlen auf natürliche Weise steigen. Genau diese Situation liegt in Deutschland in den letzten Jahren vor. Hier führt also nicht die Realität, sondern die gewählte Methode zur Übersterblichkeit.

Angesichts dessen ist es unumgänglich, dass das Statistische Bundesamt durch den direkten Vergleich der Verstorbenen von Jahr zu Jahr eine (geringe) Übersterblichkeit feststellen muss. Warum es diese 2023 offenbar nicht gegeben hat, dazu später mehr.

„Mehr Verstorbene“ bedeutet nicht immer „Übersterblichkeit“

Eine andere Möglichkeit, die Übersterblichkeit zu ermitteln, ist, die Anzahl der Todesfälle ins Verhältnis zur Bevölkerung zu setzten, um die sogenannte Sterberate zu erhalten. Dabei spielt es keine Rolle, wie groß eine Bevölkerung ist, ob sie schrumpft oder wächst, denn dies fließt unmittelbar in die Berechnung ein.

Zur Beurteilung der Sterblichkeit reicht es jedoch nicht, nur die Gesamtzahlen zu betrachten, sondern es muss auch die Bevölkerungsstruktur berücksichtigt werden. Zwei Rechenbeispiele verdeutlichen dies:

In einer Beispielstadt leben eine Million Menschen, von denen im Laufe eines Jahres 10.000 Einwohner sterben. Im benachbarten Beispieldorf leben nur 1.000 Leute, von denen binnen eines Jahres zehn sterben.

Obwohl in der Stadt 1.000-mal mehr Menschen gestorben sind, ist es nicht angebracht, von einer Übersterblichkeit zu sprechen, denn dort wohnen auch 1.000-mal mehr Menschen. Sterberaten berücksichtigen dies, indem sie die Anzahl der Verstorbenen zur Anzahl der Lebenden in Beziehung setzen. Im Beispiel erhalten wir in beiden Fällen ein Prozent.

In einem anderen Beispiel leben in Jungdorf und Altdorf jeweils 1.000 Einwohner. In Jungdorf leben 900 junge und 100 alte Menschen, in Altdorf ist es umgekehrt. Auch hier zählt man am Ende eines Jahres die Verstorbenen, wobei in Jungdorf zehn Alte und neun Junge und in Altdorf 90 Alte und ein Junger zu betrauern sind.

Daraus ergeben sich zunächst Sterberaten von 1,9 und 9,1 Prozent, dennoch ist die Sterblichkeit unter Berücksichtigung der Altersstruktur in beiden Dörfern identisch. Es starben jeweils ein Prozent der Jungen und zehn Prozent der Alten.

Keine sichtbare Übersterblichkeit im Jahr 2020

Die Ermittlung der Sterberaten für Deutschland folgt denselben Regeln. Anhand der Zeitreihen des Statistischen Bundesamtes zur Bevölkerungsentwicklung und den Verstorbenen lassen sich für jedes Jahr und jeden Jahrgang die Sterberaten berechnen. Dargestellt werden diese anschließend in sogenannten Heatmaps, wobei prinzipiell gilt: je intensiver die Farbe, desto höher die Sterberate. Für die Jahre 2010 bis 2022 ergibt sich folgendes Bild:

Die Zeilen entsprechen den Altersjahren von 1 bis 86+ und die Spalten entsprechen den 13 Kalenderjahren von 2010 bis 2022. Die Farben deuten die Sterberaten an. Konkret erfolgt die Einfärbungen zeilenweise, also innerhalb der einzelnen Altersjahre. Ein dunkelblaues Feld im unteren, „jungen“ Bereich beschreibt demzufolge weniger Sterbefälle als ein dunkles Feld im oberen, „älteren“ Bereich.

Die zeilenweise Auswertung erlaubt jedoch, die Sterblichkeit von Menschen eines bestimmten Alters über die Jahre hinweg zu vergleichen. Sie erlaubt außerdem, jene Jahre zu erkennen, in denen die altersspezifische Sterberate am höchsten war. Ebenfalls erkennbar ist:

Abnehmende Sterberaten im Laufe der Zeit. Das Bild wird von links nach rechts tendenziell heller.

2019 und 2020 waren – optisch – die Jahre mit den niedrigsten Sterberaten. Die Spalten sind am wenigsten farbig.

2021 und 2022 zeigen sich gegenüber den beiden Vorjahren erhöhte Sterberaten.

Die erhöhten Sterberaten der Jahre 2021 und 2022 scheinen nicht so hoch zu sein wie die von 2013 oder früher.

Den „Treppen“ nachgehen

Es zeigt sich zudem eine auffällige mehrzeilige Diagonale, die den Jahrgängen 1941 bis 45 zuzuordnen ist. Warum 1945 Geborene dabei eine sehr geringe Sterberate („helle Treppenstufen“) und die 1944 Geborenen eine sehr hohe Sterberate („dunkle Treppenstufen“) haben, ist unklar.

Mögliche Ursachen gibt es zahlreich. In den Kriegsjahren arbeiteten viele Frauen, teils hochschwanger, in Fabriken und waren entsprechenden Arbeits- und Umweltbelastungen ausgesetzt. Ihre Kinder gebaren sie oft zu Hause statt im Krankenhaus und/oder in Anwesenheit von Hebammen statt Ärzten. 1944 war außerdem Penicillin erstmals in Deutschland verfügbar, ebenso die erste Impfung gegen die echte Grippe.

Dieses Treppenmuster zeigt sich jedoch auch in anderen Ländern und wiederholt sich, in abgeschwächter Form sowie in zeitlichem Zusammenhang mit der Ölkrise, mit den Jahrgängen 1972/73. Rückschlüsse auf bestimmte Ursache lassen die Daten prinzipiell nicht zu.

Was war vor 2013?

Die visuellen Beobachtungen – außer den Treppen – lassen sich auch mathematisch erfassen und überprüfen. Dazu werden die Einfärbungen jeder Zeile der Heatmap in Zahlen umgesetzt. Der kleinste Wert jeder Zeile erhält dabei den Wert 1, die zweitkleinste den Wert 2 und so weiter, bis der größte Wert jeder Zeile die Zahl 13 erhält. Diese kann man auch als Platzierung beziehungsweise Rangfolge betrachten, wobei jeweils das Jahr mit der geringsten Sterberate „gewinnt“.

Im Rahmen einer sogenannten Ranganalyse werden die Platzierungen für jedes Kalenderjahr aufsummiert. Diese Summe lassen sich wiederum „platzieren“. Demnach erhält 2019 – das Jahr mit der kleinsten Summe – den ersten Rang und markiert das Jahr mit den geringsten Sterberaten. Rang 13 und damit die höchsten Sterberaten hat das Jahr 2010.

In dieser Zusammenfassung zeigt sich:

Tendenziell nehmen die Ränge der Rangsummen im Zeitverlauf ab. Das reflektiert den im Zeitverlauf abnehmenden Trend der beobachteten Sterberaten.

2019 war ein Jahr mit außergewöhnlich geringen Sterberaten und erhält mit Rangsumme 360 den Rang 1.

Den nächsthöheren Rang 2 erhält mit der unwesentlich höheren Rangsumme von 362 das Jahr 2020.

Das Jahr 2021 erhält mit einer Rangsumme von 568 den mittleren Rang 7.

Das Jahr 2022 erhält mit einer unwesentlich geringeren Rangsumme von 565 den mittleren Rang 6.

Die höchsten Rangsummen weisen die Jahre bis einschließlich 2013 auf. Dies unterstützt wiederum den mehrjährigen Trend. Die Häufung hoher Sterberaten in diesen Jahren ist somit nicht auf ein besonderes Ereignis zurückzuführen, sondern mathematisch bedingt. Unter Berücksichtigung früherer Daten würde diese Auffälligkeit verschwinden und stattdessen wiederum zu Beginn jener Zeitreihe auftreten.

Was ist eigentlich „Übersterblichkeit“?

Auch wenn die Ranganalyse für das Jahr 2020 einen sehr guten zweiten Rang liefert, könnte dennoch gefragt werden, ob sich dieses Ergebnis möglicherweise durch den Trend abnehmender Sterberaten erklären lässt.

Vielleicht, so könnte die Vermutung lauten, sieht das Jahr 2020 lediglich aufgrund des Trends vergleichsweise gut aus. Und wie steht es um die Jahre 2021 und 2022? Sind die Ränge 7 und 6 im Mittelfeld möglicherweise nicht durch eine Übersterblichkeit erklärbar, sondern durch ganz gewöhnliche statistische Schwankungen der beobachteten Sterberaten?

Zur Beantwortung dieser Fragen muss zunächst das Konzept „Übersterblichkeit“ definiert werden: Übersterblichkeit bedeutet eine höhere Sterberate als erwartet. Was aber ist die „erwartete Sterberate“?

Um diese zu bestimmen, wird für jedes Altersjahr, also für die beobachteten Sterberaten jeder der 86 Zeilen der obigen Heatmap, ein eigener Trend berechnet. Das heißt, es werden beispielsweise lediglich die 55-Jährigen aller Jahre betrachtet. Sowohl für 54- als auch 56-Jährige – sowie für jedes andere Alter – erfolgen jeweils eigene Berechnungen.

Dabei werden für die Ermittlung der sogenannten Regressionsfunktionen nur die Daten von 2010 bis 2019 berücksichtigt. Schließlich soll untersucht werden, ob sich die Jahre 2020 bis 2022 vom Trend der Vergangenheit auffällig unterscheiden. Für die erwähnten 55-Jährigen ergibt dies folgendes Bild:

Das Diagramm verdeutlicht:

Die Sterberaten der 55-Jährigen in Deutschland in den Jahren 2010 bis 2019 weisen eine gleichmäßige, stets fallende Tendenz auf. Das Bestimmtheitsmaß von 0,989 unterstreicht dies.

Im Jahr 2019 starben prozentual die wenigsten 55-Jährigen.

2020 starben nur geringfügig mehr als im Vorjahr, eine ähnliche Entwicklung zeigte sich 2011 und 2012.

2021 und 2022 weichen als einzige Werte deutlich vom langjährigen Trend ab.

Deutschland 2020 bis 2022

Derartige Trends und Diagramme lassen sich für alle Altersjahre berechnen, ihre Gesamtheit lässt sich jedoch nicht übersichtlich darstellen. Im nächsten Schritt soll daher die Abweichung der Sterberaten vom Trend untersucht werden. Diese lassen sich wiederum in einer Heatmap abbilden.

Dazu werden die Daten auf den Regressionsfunktionen als die erwarteten Sterberaten interpretiert und die Differenzen zwischen beobachteten und erwarteten Sterberaten für jedes Jahr und für jedes Altersjahr gebildet. Auf diese Weise werden die abnehmenden Sterberaten im Zeitverlauf berücksichtigt und der Trend herausgerechnet.

Wir sehen:

Der Trend ist erwartungsgemäß verschwunden.

Deutlich erkennbar sind auffällig hohe Differenzen zwischen den beobachteten und den erwarteten Sterberaten in den Jahren 2021 und 2022.

Die „Treppen“ sind noch vorhanden, ihre Ursachen bleiben unklar.

Zur Quantifizierung der Abweichungen zwischen den beobachteten und den erwarteten Sterberaten wird wieder eine Ranganalyse durchgeführt. Statt der Sterberaten werden allerdings die Differenzen zwischen beobachteten und erwarteten Sterberaten betrachtet.

Zunächst bestätigt sich das Bild der Heatmap mit intensiv gefärbten Jahren 2021 und 2022. Die Ränge der Abweichungen sind hierbei jedoch wenig aussagekräftig. Einerseits können sich negative und positive Abweichungen ausgleichen. Andererseits kann die Rangfolge nicht ausdrücken, ob sich zwei benachbarte Werte um eins oder 100 unterscheiden.

Gott würfelt nicht, der Zufall schon

Die eigentliche Frage, die sich stellt, lautet: Wie hoch ist die Wahrscheinlichkeit, dass jene summierten Abweichungen zufällig entstanden ist? Mit anderen Worten: Liegen sie im Rahmen der statistischen Schwankungen oder spielen andere Ursachen eine Rolle?

Wenn die summierten Abweichungen so hoch sind, dass ein zufälliges Zustandekommen unwahrscheinlich ist, dann definieren wir dies als Übersterblichkeit – wenn die Rangsummen sehr klein sind, deutet dies analog auf Untersterblichkeit hin.

Um die Abweichungen zu untersuchen, werden also nicht die Ränge der Rangsummen betrachtet, sondern die Wahrscheinlichkeit für das Auftreten dieser Rangsummen. Dazu muss zunächst eine sogenannte Nullhypothese formuliert werden. Im Rahmen dieser wird angenommen, dass die Differenzen zwischen den beobachteten und den erwarteten Sterberaten für jedes Altersjahr rein zufällig und unabhängig voneinander entstanden sind.

Bildlich gesprochen bedeutet dies, dass die Ränge auch ausgewürfelt sein könnten. Da der Datensatz dreizehn Jahre umfasst, hätte der benötigte Würfel dreizehn Seiten. Handelt es sich dabei um einen „fairen“ Würfel, dann ist jede Augenzahl gleich wahrscheinlich und tritt durchschnittlich einmal unter 13 Würfen auf. Daraus ergibt sich die bei jedem einzelnen Wurf zu erwartende Augenzahl 1 · 1/13 + 2 · 1/13 + 3 · 1/13 + … + 13 · 1/13 = 7.

Alea iacta est – der Würfel ist gefallen

Anhand des Würfels kann berechnet werden, wie wahrscheinlich es ist, dass ein Wert auftritt, der größer oder gleich der in Tabelle 2 aufgeführten Rangsummen der Abweichungen ist. Wenn diese Wahrscheinlichkeit kleiner ist als ein zuvor festgelegtes Signifikanzniveau – im Rahmen der Testtheorie üblicherweise fünf Prozent – ist die Nullhypothese abzulehnen und von Übersterblichkeit auszugehen.

Wenn die berechnete Wahrscheinlichkeit dagegen größer als das vorgegebene Niveau ist, dann halten wir es für möglich, dass sich die beobachtete Rangsumme durch zufällige Schwankungen erklären lässt und sprechen nicht von Übersterblichkeit.

Werden obige Rangsummen in einer Häufigkeitsverteilung, einem sogenannten Histogramm, dargestellt, sieht dies wie folgt aus:

Die Wahrscheinlichkeit besagt, dass der Erwartungswert der Rangsummen im Rahmen der Nullhypothese – die Summe nach 86 Mal würfeln, so viele Zeilen umfassen die Heatmaps – etwa 86 · 7 = 602 betragen sollte. Das Histogramm zeigt:

Das Jahr 2020 befindet sich mit seiner Rangsumme von 581 in der Nähe des Zentrums der Verteilung und kann daher als unauffälliges Jahr eingeschätzt werden.

Das Jahr 2021 besitzt mit dem Wert 838 die bei Weitem größte Rangsumme seit 2010 und muss als ein Jahr mit Übersterblichkeit in Betracht gezogen werden.

Die Rangsumme des Jahres 2022 übertrifft die Rangsumme von 2021 mit dem Wert 915 noch einmal deutlich, also muss das Jahr 2022 ebenfalls als ein Jahr mit Übersterblichkeit in Betracht gezogen werden.

„Zufällige Übersterblichkeit“ unwahrscheinlicher als ein Lotto-Sechser

Auch diese Beobachtungen können überprüft werden. Zur Veranschaulichung soll wieder der 13-er Würfel dienen. Für 2020 lautet die entsprechende Frage: Wie wahrscheinlich ist es, dass nach 86 Würfen mit diesem Würfel eine Augenzahl von größer gleich 581 auftritt? Zur Erinnerung, eine hohe Wahrscheinlichkeit deutet auf Zufall hin, eine niedrige auf Übersterblichkeit.

Im Fall eines fairen Würfels besagt die Mathematik, dass die Summe der Augenzahlen nach einer großen Anzahl Würfen näherungsweise normalverteilt ist. Dafür gibt es Formeln. Im konkreten Fall ergibt sich daraus: Die Wahrscheinlichkeit, nach 86 Würfen eine Augenzahl größer gleich 581 zu erhalten, beträgt 72 Prozent. Dies liegt weit über dem festgelegten Signifikanzniveau von fünf Prozent. Demzufolge gab es 2020 in Deutschland keine Übersterblichkeit.

Für das Jahr 2021 und die Rangsumme 838 ergibt sich die Wahrscheinlichkeit von 3,2 · 10−11 oder 0,0000000032 Prozent. Zum Vergleich: Die Wahrscheinlichkeit, sechs Richtige im Lotto zu erzielen, beträgt 7,15 · 10−8. Mit anderen Worten, das Erwürfeln einer Summe von größer gleich 838 und damit eine durch Zufall zu erklärende Übersterblichkeit 2021 ist mehr als 2.000-mal unwahrscheinlicher, als sechs Richtige im Lotto zu erhalten.

Dass also Werte größer oder gleich 838 durch zufällige Schwankungen der beobachteten Sterberaten entstanden sind, ist praktisch ausgeschlossen. Das gilt selbstverständlich auch für Werte größer gleich 915 und damit für die Übersterblichkeit im Jahr 2022. Der Vollständigkeit halber soll die Wahrscheinlichkeit dennoch angegeben werden: Sie ist so klein, dass Taschenrechner und Statistikprogramme lediglich Null anzeigen.

Da der Zufall als Erklärung für Rangsummen größer gleich 838 im Jahr 2021 und insbesondere für Rangsummen größer gleich 915 im Jahr 2022 nicht plausibel erscheint, muss sich die Übersterblichkeit auf andere, noch zu klärende Ursachen zurückführen lassen. Die hier angegebenen Ergebnisse sollten als Alarmsignal interpretiert werden und eine Ursachenanalyse nach sich ziehen.

Und 2023?

Für das Jahr 2023 liegen die oben verwendeten Daten aus der Genesis-Datenbank des Statistischen Bundesamtes bis jetzt nicht vor. Aktualisierungen erfolgten in der Vergangenheit etwa um die Jahresmitte des Folgejahres. Gleichzeitig bieten die Statistiker aus Wiesbaden mit der Sonderauswertung der Sterbefälle einen sehr aktuellen Datensatz, mit dem die Analyse fortgesetzt werden kann.

Dazu bleibt anzumerken, dass bisher die Anzahl der Lebenden eines Altersjahres sowie die Anzahl der Verstorbenen dieses Altersjahres am Ende des jeweiligen Kalenderjahres betrachtet wurden. Aufgrund des Fehlens der Bevölkerungsdaten für Ende 2023 müssen die Sterberaten im Folgenden auf die Anzahl der Lebenden am Jahresanfang bezogen werden. Dadurch werden Geburtstage sowie Zu- und Wegzüge im Laufe des Jahres nicht erfasst.

Eine zweite Änderung betrifft die Altersjahre, die durch die in der Sonderauswertung verwendeten Altersgruppen ersetzt werden müssen. Die Heatmaps weisen infolgedessen jedoch weniger Zeilen auf.

Beide Anpassungen beeinflussen das Bild kaum, sodass das Grundmuster der Sterberaten vergleichbar ist. Sowohl zu Beginn der Datenreihe als auch 2021 und 2022 sind höhere Sterberaten zu verzeichnen. 2019 und 2020 sind sie eher niedrig.

Die anschließende Berechnung der Regressionsfunktionen und die Darstellung der Abweichungen entfernt wiederum den zeitlichen Trend der bis 2019 sinkenden Sterberaten. Die Übersterblichkeit 2021 und 2022 bleibt erhalten.

Da diese Heatmaps einerseits 14 statt 13 Spalten (Jahre), andererseits aber nur 14 Zeilen (Altersgruppen) umfassen, ist der direkte Vergleich mit den zuvor berechneten Wahrscheinlichkeiten nicht möglich. Der neue Würfel hätte 14 Seiten und würde 14 Mal geworfen. Letzteres schränkt die Aussagekraft ein.

Übersterblichkeit? Auf hohem Niveau leicht sinkend!

In beiden Diagrammen wird jedoch sichtbar, dass die Sterberaten 2023 sowie die Abweichung der Sterberaten 2023 vom langjährigen Trend zurückgehen. Dennoch liegen sie deutlich über den Werten von 2019.

Das Statistische Bundesamt bezieht sich nicht auf die Sterberaten und schreibt: „Ausgehend von einem entsprechend hohen Niveau von 1,07 Millionen Gestorbenen im Jahr 2022 sind die Sterbefallzahlen 2023 erstmals seit 2019 im Vorjahresvergleich wieder gesunken.“

Durch den Vergleich der Anzahl der Verstorbenen mit den – nachweislich – unnatürlich erhöhten Sterbefallzahlen der Vorjahre findet man in Wiesbaden daher keine Übersterblichkeit. Zwei ebenfalls in der Pressemitteilung veröffentlichte Tabellen zeigen indes, dass die Zahl der Sterbefälle 2023 um mehr als 81.000 größer ist als 2019 – nur etwa die Hälfte ist durch die Bevölkerungsentwicklung erklärbar. Auch die monatlichen Sterbefallzahlen liegen vor allem im Frühjahr und Spätherbst mehr als zehn Prozent über denen von 2019.

