Inspiration
In Zeiten von Corona und anderen Krisensituationen ist ein Anstieg von Fake News zu verzeichnen. Gerade durch beliebte Social Media Plattformen kommt es zu einer Verbreitung von Desinformationen (vgl.) denen die User hilflos gegenüberstehen. Diese Hilflosigkeit führt dazu, dass es neben der Corona-Epidemie aktuell zu einer “Infodemie” (vgl.) kommt und schlimmstenfalls unbedachte Internet-User verheerende Fake News liken und teilen. Das hat auch Twitter erkannt und will laut aktuellen Medienberichten neue Methoden im Kampf gegen Fake News testen (vgl.). Gegen diesen Zustand wollen wir angehen und sagen: genug damit! Genauso wie wir gegen das Virus nur zusammen ankommen, wenn sich jeder an die aktuellen Vorgaben der Bundesregierung hält, kommen wir nur zusammen gegen Desinformationskampagnen, Bots und Co. an, wenn jeder Internetuser - unabhängig von den individuellen technischen Vorkenntnissen - mit wenig Aufwand Nachrichten auf ihren Wahrheitsgehalt kontrollieren kann. Unsere Lösung lautet also: Jeder User sollte selbst zum „Faktenchecker“ werden und dadurch seinen gesellschaftlichen Beitrag zum Kampf gegen die Fake News-Flut leisten.
Selbst die Weltgesundheitsorganisation betont, dass sie nur die “häufigsten Gerüchte identifizieren können, die der Gesundheit der Bevölkerung potenziell schaden, wie z.B. falsche Präventionsmaßnahmen oder Heilungen und diese Mythen dann mit evidenzbasierten Informationen widerlegen” (vgl.). Die medizinisch richtigen Informationen werden auf den eigenen sozialen Medienkanälen zur Verfügung gestellt - es würde auch einfach einen viel zu großen Aufwand verursachen, jeden einzelnen Tweet zu kommentieren. Die überlebens notwendigen Informationen erreichen daher oftmals nicht die Internetuser - und es verbreiten sich erschreckend absurde Gerüchte, wie z.B. dass es schon helfen würde Knoblauch zu essen (vgl.). Solche anschaulichen Gerüchte verbreiten sich besonders gut, wenn Freunde, Bekannte oder Nachbarn sich helfen wollen, indem die vermeintlich richtigen Informationen mit den Liebsten geteilt werden. Es kommt regelrecht zu Ballungszentren der Desinformation und das Problematische ist, dass sich die Betroffenen dessen nicht bewusst sind. Diese Ballungszentren werden in Form einer Karte visualisiert, dies soll mehr Bewusstsein bezüglich der Verbreitung von Fake News für den Internetuser schaffen.
What it does
Um unser Ziel umzusetzen, haben wir uns folgende Lösung überlegt: In einem ersten Schritt können Internetuser die URL des zu überprüfenden Contents in unsere WebApp auf coronafaktencheck.de eingeben. Unsere KI gleicht die Nachrichten mit den aktuell zur Verfügung stehenden Fachinformationen ab und teilt dem User direkt mit, welche Teile „fake“ sind und welche nicht. In einem zweiten Schritt wird den Usern auf einer Deutschlandkarte dargestellt, wo gerade Fake News-Artikel verbreitet werden. Hierbei wollten wir ein möglichst visuell ansprechendes Angebot für sämtliche Nutzer gestalten, um mehr Betroffene zur Nutzung zu animieren.
How we built it
Die Lösung ist als Webanwendung aufgesetzt mit einer 3-Tier Architektur. Das Frontend wurde mit React implementiert und durch Widgets im Material UI-Design gestaltet. Außerdem haben wir eine interaktive Map zur Darstellung der Verteilung der Fake News auf der Grundlage von MapBox GL JS erstellt. Die Verarbeitung der Anfragen geschieht in selbst entwickelten Komponenten auf der Basis von Python und dem Pytorch Framework sowie FastApi. Der Kern der Analyse und des Abgleichs mit echten Nachrichten bildet das BERT Modell, welches den State-of-the-Art in vielen Aufgaben in der natürlichen Sprachverarbeitung darstellt. Weiterhin ist das Modell auch in der Lage, Wörter im Kontext zu verstehen, sodass eine detaillierte Analyse der Texte möglich ist.
Challenges we ran into
Zusätzlich fiel uns die Auswahl einer geeigneten Datengrundlage für die Schulung der KI nicht leicht. Mangels weiterer Quellen konnten wir uns “nur” auf die Daten des Robert Koch-Instituts stützen. Darüber hinaus forderte die derzeitige Netzauslastung uns eine Vielzahl an kreativen Workarounds ab.
Accomplishments that we're proud of
Ein wichtiger Meilenstein des Projektes war das Sammeln von deutschen Fake News, die wir zu einem Corpus kompiliert haben. Dieser kann für weitere Projekte eine sehr wertvolle Ressource darstellen. Wir haben einen Datensatz erstellt, welcher für kommende Grundlagenforschung im Bereich Fake-News dienen kann.
Des weiteren haben wir in unserer Anfangs Planung entschlossen, unseren KI-Corpus ausschließlich mit den Informationen des Robert Koch-Institutes zu schulen.
Weiterhin haben wir eine hochqualitative Datenbasis für validierte Fakten zum Coronavirus aufgebaut (Daten aus dem corona tracker und FAQ vom RKI). Dazu ist im Besonderen zu erwähnen, dass das ganze System auf Deutsch ausgelegt ist und wir keinerlei english Daten zum training der Modelle verwendet haben.
Unser Bert-Modell macht es möglich, Textabschnitte zu markieren die bereits gecheckt wurden und nicht fake sind. Hierdurch können wir differenziert darstellen, welche Teile einer Aussage falsch sind und welche eventuell stimmen. Bspw. könnten Benutzer nachvollziehen, dass bspw. die Aussage ”von 43 Infizierten starben 2 leute” nur teilweise richtig ist, weil von “43 Infizierten nur eine Person verstorben ist”.
What we learned
Die Datensammlung von deutschen Daten war schwieriger als gedacht und es liegen wenige verlässliche Datensätze zu Corona vor. Im Projektverlauf auf Twitter Fake News festgelegt und andere Kanäle außen vor gelassen; Dies bietet großen Raum für zukünftige Projekte. Technisch gesehen haben wir uns mit einigen für uns neuen Technologien beschäftigt, z.B.: -Twitter API kennengelernt sowie tweepy -Frontend und Backend Verbindungen -Bert Modell -Fast API -Maps und React App
Wir haben zu dem begeistert festgestellt, dass ein virtueller Hackathon durchaus realistisch ist und super funktioniert. Ein Mentoring hat auch remote sehr gut funktioniert und man ist in der Lage von unterschiedlichen Skills im Team zu lernen. Besonders hat uns dieser Hackathon gezeigt, dass Krisen eine Solidarität erzeugen können, die uns sehr berührt. Zusammen können wir etwas bewegen!
What's next for CoronaCheck.ai
In der Zukunft können wir uns vorstellen die Verbreitung von Fake News nicht nur in Form von Tweets zu visualisieren, sondern auch weitere Social Media Plattformen anzubinden. Desweiteren wollen wir die Verbreitung von Fake News durch Retweets noch besser sichtbar machen.
Weitere Funktionen könnten bspw. darin liegen, Interenetuser über aktuell kursierende Fake News über Corona vorzuwarnen. Außerdem bietet es sich an, zukünftig unser Modell für den Kampf gegen sämtliche Fake News zu trainieren.
Für uns steht fest, dass wir dieses Herzensprojekt in Zukunft weiter führen möchten, um ein allgemeines Bewusstsein, auch über die Corona Krise hinaus, für Fake News zu schaffen. Für eine starke Gesellschaft, gegen Hysterie und Panik und mehr Miteinander Füreinander.
Log in or sign up for Devpost to join the conversation.