Die Dunkelziffer

Zur richtigen Einschätzung der Verbreitung des COVID-19 Virus' bedarf es präziser Schätzung der Infektionszahlen. Hierfür gibt es verschiedene Ansätze, zB die Auswertung von medizinischen Tests, durchgeführt an einer Stichprobe der Bevölkerung. Da nicht alle Infizierten getestet werden, liegt die Anzahl der bestätigten Fälle weit unter der tatsächlichen Anzahl der Infizierten.

Unsere Idee

Wir schlagen vor, die vergangenen Infektionszahlen rückwirkend von den heutigen Todesfällen berechnen. Diese können dann Anhand eines Wachstumsmodells in die Gegenwart/Zukunft projiziert werden. Warum macht das Sinn? Die Todeszahlen sind (ganz im Gegensatz zu den Infektionszahlen) fast gänzlich erfasst, und stellen somit eine sehr verlässliche Datenquelle dar.

Eine detaillierte Beschreibung unserer Methode findet ihr hier.

Welche Daten brauchen wir?

Als input für unser Modell brauchen wir für jedes Land und jeden Tag

  • (1) die Anzahl der Verstorbenen innerhalb jeder Altersklasse (0-9, 10-19, ... , 80+),
  • (2) einen guten Schätzer für die Todeswahrscheinlichkeit innerhalb jeder Altersklasse.

Im Moment berechnen wir (2) Anhand von Daten von Südkorea, wo viele Stichproben-Tests durchgeführt wurden.

Das Produkt

Unser Methode ist in R implementiert, und zu einer interaktiven Shiny-App verarbeitet (siehe Link unten).

Herausforderungen

  • Für viele Länder sind leider nicht die Daten (1), sondern nur die Gesamtanzahl der Todesfälle verfügbar. Unter zusätzlichen Annahmen (siehe Dokument im Anhang) lassen sich die Anzahl der Tode innehalb verschiedener Altersklassen Anhand der Altersverteilung des Landes schätzen. Wir glauben jedoch, dass die Verfügbarkeit der richtigen Werte unsere Schätzungen markant verbessern!
  • Aufgrund begrenzter Zeit, haben wir es leider nicht geschafft, die Infektionszahlen in die Gegenwart zu extrapolieren. Wir werden in den kommenden Tagen weiter an dieser Lösung arbeiten.

Built With

+ 1 more
Share this project:

Updates

posted an update

Also, hier mal ein Vorschlag zum Ablauf:

Wir brauchen wie gesagt Daten zu Todesfälle/Altersgruppe/Land. Bisher haben wir leider noch keinen Datensatz gefunden, der diese Information global zusammenfasst. Wir werden sie daher wohl separat aus verschiedenen Ländern zusammen sammeln müssen. Links zu relevanten Datensätzen können hier eingetragen werden:

https://docs.google.com/spreadsheets/d/1ta2k0JLH-2fbTrpSptxa5wTo5Al3aLQ-b5H7vBVgd0M/edit#gid=0

Die Daten zu Todesfälle/Altersgruppe/Land müssen dann separat berechnet werden und hier eingetragen werden:

https://docs.google.com/spreadsheets/d/13Y_2AAaGF88WSiqw8ieqbXWp__WVC455OA8lSU4Nd2s/edit#gid=0

Und bitte alles reproduzierbar :) Also unbedingt die Scripts mit denen ihr Datensätze bearbeitet aufbewahren.

Log in or sign up for Devpost to join the conversation.