Du sitzt alleine zuhause und versuchst dich und andere so gut wie möglich vor dem Coronavirus zu schützen. Poldis Mama sagt Ibuprofen ist gefährlich, und der Bericht eines chinesischen Arztes sagt heißes Baden hilft. Der Präsident der USA meint das wäre im Sommer eh alles wieder vorbei, und irgendwo auf Twitter hast du irgendwas von Bleichmittel gelesen. Das klingt alles irgendwie nicht ganz richtig? Wir räumen auf mit Fake News!
Unsere Submission zum #WirVsVirus #Hackathon im Bereich 01_021_Krisenkommunikation.
Daten in unserem Github: https://github.com/yh08/factcheckers_with_attitude.git
Checkt unser Video auf Youtube: https://www.youtube.com/watch?v=5T4A9_oilqY
Und natürlich vielen vielen Dank an unsere zahlreichen fleißigen Helfer! Ohne die Community wäre dieses Projekt so nicht möglich gewesen.
Unsere Top5 Data Helper: LC_3107 (15,2%) MR_2208 (13%) Ulli Waltinger (11,1%) dk_1408 (9,3%) Nadine Sauermann (8,6%)
Und weitere Helfer: Malte Zietlow
Inspiration
Bei der Geschwindigkeit mit der uns heute täglich Nachrichten zur Corona-Krise erreichen ist es häufig schwierig Fake News zu erkennen. Durch die schnelle Verbreitung können Angst und Unsicherheit zu fatalen Folgen, wie Diskriminierung oder Massenpanik führen. Mittels eines Fake News Detectors wollen wir unseren Usern in dieser Situation schnell und unkompliziert Klarheit verschaffen.
What it does
Basierend auf einem Datensatz von verifizierten Nachrichten, Satirenachrichten und Fake News, wird der Algorithmus auf die Identifizierung von Fake News zum Coronavirus trainiert. User können aktuelle Nachrichten einlesen und erhalten einen Score, der deren Glaubwürdigkeit approximiert.
How I built it
Unser AI-System basiert auf einem Deep Language Model, welches mithilfe von Supervised Learning die Unterschiede zwischen echten und falschen Nachrichten in unserem Datensatz zu erkennen erlernt. Zum Ende des Hackathons können unsere Modelle zu einer ca. 90%igen Wahrscheinlichkeit Fake News von seriösen Nachrichten unterscheiden.
Challenges I ran into
Je größer der Datensatz, desto akkurater das Modell. Ein signifikanter Teil der Bearbeitungszeit wurde also durch die Suche nach Beispielnachrichten bestimmt. Dabei kamen unter Anderem Webcrawler sowie vorher verifizierte Datenpakete zum Einsatz. Die explizite Suche nach Fake News stellte sich als komplizierter heraus als von vornherein angenommen. Bevor eine Nachricht von einer unabhängigen Stelle als fake eingestuft wird kann sie nur schwer in den Datensatz aufgenommen werden. Eine erste Anlaufstelle stellten hier Zusammenfassungen etablierter Medien dar. Eine große Hilfe erhielten wir durch die Community, der wir baten uns sowohl falsche als auch wahre Nachrichten zuzuschicken. Die engagierten Helfer lieferten uns insgesamt 170 Nachrichten, die in unseren Datensatz mit eingebunden wurden. Die gesamte Größe des Datensatzes beläuft sich auf ca. 1317 Artikel.
Accomplishments that I'm proud of
What I learned
What's next for Factcheckers with Attitude

Log in or sign up for Devpost to join the conversation.