Pra você entender em poucas palavras

A distribuição desenfreada de boatos ou falsas informações pode causar muitos problemas à população, como o inadequado uso de medicamentos sem prescrição médica, por exemplo. O momento de pandemia ainda torna mais crítica e perigosa a propagação de tanta desinformação. Assim, faz-se necessária a busca por uma ferramenta de auxílio a essa problemática.

Nossa proposta foi inspirada não só nas inúmeras notícias e casos sendo relatados, mas também nas pesquisas que estão sendo feitas atualmente, na expertise da nossa equipe em análise de redes complexas e na Operação Serenata de Amor, que tem como objetivo a fiscalização dos gastos públicos por parte dos parlamentares brasileiros.

Será feita uma fiscalização do conteúdo das mensagens postadas por influenciadores nas redes sociais. Caso o conteúdo esteja associado aos termos de um assunto predeterminado, Vera, nosso bot de verificação, dispara na rede social uma mensagem aos usuários alertando que o conteúdo da mensagem é suspeito e pede que o usuário participe do processo de checagem. Essa fiscalização será 24 horas por dia. O diferencial da Vera é que esta checagem de informação será feita no momento em que o influenciador fizer a publicação, portanto a Vera poderá impedir a disseminação de uma informação falsa.

Hoje em dia, temos uma variedade de APIs disponíveis para checagem de semântica do texto, varreduras de notícias, portais de FakeNews de grandes agências de comunicação, pesquisas científicas na área de linguagem e mineração de texto. Vera nasce justamente para automatizar a utilização destas APIs e métodos, ou seja, ela irá unir as medidas já existentes de combate a Fake News e facilitar o uso para o usuário comum.

A Vera inicialmente fiscalizará os influenciadores no Twitter, chamado @verafalou. O usuário só precisa seguir o perfil da Vera para receber as checagens “ao vivo”.

Nos ajude a divulgar #chamaavera

Se a Vera falou é Verdade! #chamaavera

Uma etapa colaborativa e muito importante é tornar a Vera grande, ou seja, ela conseguir alcançar muitas pessoas nas redes sociais. Criamos a hashtag #chamaavera para denunciar tweets em que o conteúdo parece ser falso e para ajudar a divulgar a nossa robozinha favorita do combate a FakeNews. No Twitter o usuário poderá ver o histórico de checagem que a Vera realizou, quais os influenciadores que a Vera estará fiscalizando e claro, poderá sugerir perfis que não estejam na lista. Então, quanto maior for a Vera, melhor será seu combate à informações falsas.

Metodologia

Separamos em três etapas o processo de desenvolvimento e funcionamento da Vera. A imagem abaixo ilustra as etapas e em seguida iremos falar mais sobre cada uma.

Alt text

1. Processamento de Dados

Esta etapa consiste em coletar, através de API, um grande volume de twitters postados por vários usuários na rede. Este grande volume de dados faz-se necessário para identificar quem são os influenciadores.

O Twitter possui vários tipos de mensagens compartilhadas sobre diversos assuntos, portanto precisamos filtrar as mensagens para coletar usuários que estão postando sobre o assunto de nosso interesse. No nosso caso, filtramos palavras que remetem ao assunto da pandemia. Assim nossa coleta terá apenas usuários que estão falando ou compartilhando publicações sobre a pandemia. As palavras foram definidas a partir de uma consulta ao Google Trends.

Após a definição das palavras chaves, utilizamos uma API de coleta disponível no git. Deixamos por horas executando a coleta para termos um número alto de tweets e usuários.

Os dados que coletamos contém o usuário e o twitter postado, e também os usuários que retweetaram a mensagem. Desta forma, conseguimos construir um grafo de influência, onde os nós são os usuários e as arestas são as interações de retweet. Um usuário que possui uma mensagem muito retweetada, terá várias arestas no grafo. Após a construção, obtivemos um grafo com 94633 nós e 137820 arestas.

2. Análise de Influenciadores

Após a construção do grafo, a segunda etapa identifica os influenciadores na rede. Identificar os influenciadores é importante para a sabermos quem a Vera irá fiscalizar.

Com o grafo em mãos, utilizamos métricas de centralidade para identificar quem são os nós mais importantes. Como exemplo, temos o PageRank que identifica os nós que estão sendo bastante citatos por outros nós. Desta forma, a alta centralidade representa que o usuário é bastante retweetado. Outra medida utilizada é o Closeness, que identifica os nós que são centrais na nossa rede, ou seja, os usuários que tem muitos outros usuários próximo dele. Assim, conseguimos dizer que estes usuários com alta centralidade são influenciadores.

Com o grafo mudando ao longo do tempo, podemos ter uma alteração dos influenciadores ao longo do tempo. Isso faz sentido, pois sempre temos influenciadores aparecendo e até influenciadores que são deixados de lado (isso tem acontecido na pandemia, né?).

3. Vera

Agora que possuímos a lista de influenciadores, podemos pedir a Vera para fiscalizar essas pessoas.

Como irá funcionar a fiscalização?

Possuímos na internet vários sites de investigação de fake news, por exemplo, G1, E-farsas, Lupa, Pública entre outros. Temos também trabalhos na área de processamento linguagem para identificar se a frase é falsa ou não, por exemplo o trabalho de FaceCheck feito pela USP e outros parceiros. Não é só isso, temos APIs disponíveis no git para varredura de notícias na internet para identificar se um determinado texto foi dito por algum canal de comunicação e também APIs para busca em artigos científicos. Uau, temos muitas ferramentas já disponíveis para auxiliar na identificação de fake news.

Assim, surge a Vera que é uma robozinha que irá facilitar a utilização de todas essas ferramentas. Quando um influenciador postar algo, ela automaticamente irá verificar se o que foi dito já foi investigado pelos canais de comunicação, varrer as notícias publicadas por grandes sites de notícias, verificar através de processamento de linguagem e claro, buscar em artigos científicos.

Após todo esse processo de busca, ela informará ao usuários se o tweet do influenciador tem referência a alguma notícia ou a algum artigo científico. Caso a Vera não encontre, ou encontre fatos que dizem algo diferente, ela dirá que tem a possibilidade de ser fake news e pedir para o usuário investigar melhor as informações. Incrível, não?

A Vera filtrará os tweets feitos pelos investigados, pois nem sempre eles estão falando sobre assuntos do interesse da Vera. Utilizaremos o mesmo filtro que utilizamos para gerar a nossa rede de influência.

Outro ponto muito importante é que a Vera acabou de nascer, estamos empenhados e motivados a não só utilizar o que já existe de pronto na internet. Queremos desenvolver os seus próprios métodos de varredura de informação, de processamento de linguagem, mineração de textos, aprimorar sua inteligência artificial após possuirmos histórico de dados para o treinamento. Iremos deixar a Vera gigante e acessível a todos na internet, basta segui-la.

Nossa jornada até aqui

Os motivos pelos quais estamos orgulhosos: Considerando o espaço curto de tempo e o fato de ser nosso primeiro Hackathon, ficamos orgulhosos pela forma em que nos organizamos para desenvolver o trabalho. Uma vez definindo o problema, fomos capazes de atacar diferentes frentes a fim de agilizar o desenvolvimento. Em momentos de dúvidas, conseguimos nos reunir para resolvê-las e deixar o processo o mais claro possível para todos. A coleta do volume de dados que conseguimos, a construção de uma base de dados orientada a grafos usando o Neo4J e toda a ideia envolvendo a Vera (inclusive o nome), são os principais aspectos pelos quais nos orgulhamos. Além disso, nenhum de nós tinha experiência ou havia ainda trabalhado de fato no tema, apesar do interesse. Além de desafiador, isso nos levou a refletir sobre questões que ainda não havíamos considerado durante todo o tempo de implementação do projeto e certamente atuar nesse assunto abriu nossos horizontes.

Tivemos alguns desafios... um dos maiores foi, num primeiro momento, definirmos qual problema atacar. Os desafios propostos, e que nós sabíamos que poderíamos atuar de acordo com as nossas habilidades, são relevantes para o momento e cada um possui um determinado alcance. No entanto, nos deparamos com a preocupação sobre a continuação do projeto no ‘pós-pandemia’, o que acabou guiando nossa decisão pelo tema das fake news. Outros desafios, relacionados à implementação do projeto e análises que realizamos, compreendem a limitação de processamento computacional com os equipamentos que utilizamos, por exemplo, para o processamento de métricas importantes do grafo de usuários que construímos.

Mas também aprendemos... que organização e uma boa comunicação são essenciais para o desenvolvimento de soluções em tão pouco tempo. Além disso, aprendemos detalhes sobre a problemática das Fake News que antes não tínhamos total conhecimento, desde os impactos delas nas pessoas em tempos de pandemia, até o papel de pessoas influentes em sua possível disseminação.

Segundo a metodologia para classificação do nível de maturidade tecnológica aplicável aos projetos de inovação, o TRL (Technology Readiness Levels), nossa solução hoje está situada em TRL4. A tecnologia se encontra na fase de prova de conceito, os componentes tecnológicos básicos podem ser integrados para trabalharem conjuntamente, como descrito no diagrama do projeto. As análises dos componentes envolvidos foram realizadas a nível de laboratório, coletando dados e identificando os influenciadores para, no futuro, podermos aplicá-la em ambiente relevante.

O futuro

Expansão:

Imagina se a Vera fiscalizasse não só o Twitter, mas também o Instagram, Facebook, grupos abertos do Whatsapp e até o YouTube? Incrível, não? Pois é, a Vera tem potencial para isso, ela só precisa da sua ajuda.

Para o Instagram, Facebook e grupos do Whatsapp basta só uma pequena expansão para chegarmos nestas redes sociais. Para o YouTube, a ideia seria utilizar métodos que transformem a fala dos influenciadores em textos e assim conseguir analisar tudo que foi dito naquele vídeo de youtube que você utiliza para se informar.

Ambiente Colaborativo:

Já está em desenvolvimento o site da Vera. Este site conterá o histórico das mensagens que foram checadas de cada influenciador que ela estará fiscalizando. Com o tempo e histórico de dados, a Vera conseguirá rankear estes influenciadores criando um indicador de Veracidade para cada um deles. Aliás, se você queria saber qual foi a inspiração para o nome, aí está.

Através do site os usuários poderão consultar informações estatísticas dos influenciadores. Poderá encontrar bons influenciadores sobre política, saúde, economia e etc. Claro, poderá também saber quem são os influenciadores ruins.

No site, os usuários também poderão se cadastrar para ajudar no combate a FakeNews. Poderão não só sugerir influenciadores e ajudar na checagem das informações falsas, mas também ajudar com os métodos de varreduras, mineração de texto, IA, entre outros métodos utilizados pela Vera para fazer tudo isso funcionar.

Equipe HackCovid à Vera

Nossa equipe é composta por alunos de pós-graduação. Nosso conhecimento reúne as áreas de computação, matemática, física e administração e atualmente atuamos em projetos voltados para ciência de dados.

  • Claudio Barros
  • Haron Fanticelli
  • Henrique Mello
  • Maria Luiza Mondelli
  • Nathália Barbosa
  • Victor Dornellas
+ 20 more
Share this project:

Updates