In der Wochenzeitung „Der Freitag“ erschien im Mai 2021 ein Artikel, der sich kritisch mit der Inzidenz als Grundlage für Anti-Corona-Maßnahmen auseinandersetzte (https://www.freitag.de/autoren/der-freitag/irrtum-inzidenz). Der Autor bezog sich dabei auch auf einen (nach eigener Aussage) „Mathematik-Studenten“, der folgende Rechnung anstellte:
„Landkreis A und Landkreis B haben jeweils 50.000 Einwohner und jeweils ein Prozent Infizierte. Landkreis A testet 5.000 Einwohner und findet rund 50 Infizierte. Landkreis B testet 2.000 Einwohner und findet rund 20 Infizierte. Damit läge Landkreis A bei einer Inzidenz von 100, Landkreis B jedoch bei einer Inzidenz von 40. Dies, obwohl beide Landkreise ein Prozent Infizierte haben. ´Rückschlüsse auf das Pandemiegeschehen lässt dieser Inzidenzwert nicht zu´, folgert der Student.
In diesen wenigen Sätzen gelingt es dem „Mathematik-Studenten“, gleich vier gravierende Statistik-Fehler zu produzieren – eine wirklich reife Leistung, mit der ich mich im folgenden beschäftigen werde.
1. Der erste Fehler findet sich schon in der Grundkonzeption des Textes. Denn sich einer fiktiven Grundgesamtheit (Anzahl von Infizierten in einer fiktiven Region) durch eine fiktive Stichprobe (Anzahl von Tests) zu nähern, kann nur dazu dienen, das Rechenverfahren zu demonstrieren, hier also zu zeigen, dass der Autor die Grundrechenarten beherrscht. Daraus Schlussfolgerungen über reale Gegebenheiten zu ziehen, ist hingegen statistisch nicht zu rechtfertigen und damit haltlos.
2. Auch die Aussage, dass man durch Testen die angeführten Zahlen von Infizierten findet, ist einfach nur falsch; sie suggeriert nämlich, dass es sich bei den Tests um Zufallsstichproben handelt, bei einer Verdopplung der Anzahl von Tests komme es also zu einer Verdopplung der Zahl von Infizierten. Bei den heute durchgeführten Tests handelt es sich aber gar nicht um Zufallsstichproben, sondern in erster Linie um Menschen mit Symptomen, um Kontaktpersonen von Erkrankten und Menschen mit hoher Wahrscheinlichkeit des Kontakts mit Erkrankten (etwa Beschäftigte in entsprechenden Berufen oder Reisende). Je geringer die Anzahl der Tests ist, desto größer ist also die relative Wahrscheinlichkeit, Infizierte zu finden.
3. Aber auch wenn es sich um Zufallsstichproben handelte, ist das Ergebnis nicht schlüssig. Denn laut RKI beträgt die Testkapazität mit PCR-Tests in Deutschland rd. 350.000 pro Tag. Da ein negativer Test eine Gültigkeit von etwa 3 Tagen hat, können in diesem Zeitraum ca. 1 Mio Personen getestet werden, also grob geschätzt zwischen 1 und 2 % der Bevölkerung. Das bedeutet für den fiktiven Landkreis des Studenten zwischen 500 und 1000 Personen. Sind dann – nach der von ihm angeführten Quote – etwa 1 % der getesteten Personen positiv, ergibt das eine Trefferquote von absolut 5 bis 10 Personen. Um aber diese Personen zu finden, ist eine Zufallsstichprobe nicht angebracht. Hier müsste eine komplex zusammengesetzte, geschichtete Stichprobe gewählt werden. Eine Zufallsstichprobe ist ein untaugliches Instrument.
4. Der vierte ist zugleich der gravierendste Fehler. Denn das Beispiel suggeriert, dass es bei den Tests darum geht, die Häufigkeit des Vorkommens von Infektionen zu ermitteln. Wie bereits angeführt, ist dies mitnichten der Zweck der Tests; vielmehr geht es darum, für einzelne Individuen zu ermitteln, ob sie infiziert sind. Eine Schlussfolgerung auf die Grundgesamtheit ist schon von der Grundkonzeption der Tests her überhaupt nicht vorgesehen. Die Inzidenz stammt somit quasi von der Restrampe der Tests; wenn man sie schon mal gemacht hat, kann man ja über die Rückmeldung an das jeweiligen Individuum hinaus auch noch eine scheinbar gut fundierte Aussage über die Verteilung von Infektionen in der Bevölkerung insgesamt machen. Was aber nicht statthaft ist bzw. mit einer gründlich reflektierten Einschätzung der Gefahren eines theoretisch nicht unterfütterten Data-Minings verbunden sein müsste.
5. Wie einleitend beschrieben, geht es hier nur um vier Fehler. Was ist dann der fünfte? Der fünfte Fehler ist keiner des „Mathematik-Studenten“, sondern kann zumindest seinen letzten erklären helfen. Der Fehler ist, für politische Entscheidungen eine Zahl, die zu einem ganz anderen Zweck ermittelt wurde, als entscheidend anzusehen und keinerlei tatsächliche Erhebung über die Verteilung von Infektionen vorzunehmen. Wie dies passieren könnte, kann an vielen Beispielen aufgezeigt werden. Da ist etwas die Praxis in Großbritannien, Kohortenstudien vorzunehmen, was zu einer relativ genauen Einsicht in die Häufigkeit von Infektionen führt. Auch das Modell des Landkreises Berchtesgadener Land, aus den Abwässern auf die Virusverteilung zu schließen, scheint eine aussagekräftige Maßnahme zu sein, wird aber ebenso wie das britische Modell von politischer Seite abgelehnt. Auf die Frage, warum das so ist, kann neben den Verweisen auf zusätzlichen Aufwand und das heißt zusätzliche Kosten (die aber gegenüber den Schäden der Pandemie vernachlässigbar sind) nur eine Antwort gegeben werden: Der Verweis darauf, dass man es halt nicht genauer weiß, eröffnet die Möglichkeit, beliebige Inzidenzzahlen als Grenzwerte zu definieren und damit den jeweils favorisierten Lobbygruppen und deren Interessen entsprechen zu können. Zu viel mehr können sie nicht dienen.
Schreibe einen Kommentar