Sophia : le "CoronaCheck" d'EURECOM pour contrer les "corona fake news"
La pandémie de coronavirus génère un flot ininterrompu de "fake news" sur son origine, sa diffusion, ses effets, son traitement. Or la surcharge d'informations sur Internet rend impossible une vérification humaine. D'où l'intérêt de l'initiative de l'équipe du professeur Paolo Pappotti à EURECOM qui se sert de la puissance de l'Intelligence Artificielle pour vérifier automatiquement les allégations statistiques sur le coronavirus.
L'épidémie de coronavirus et l'anxiété qu'elle soulève sont un terrain idéal pour les "fake news". Avec la propagation du virus COVID-19, la désinformation sur son origine, sa diffusion, ses effets, connait actuellement un pic. Les affirmations erronées et trompeuses sont répandues sur les réseaux sociaux, mais aussi par les politiciens et les gouvernements, comme Trump qui affirmait que le taux de mortalité était plus faible que le taux effectif. (Photo DR : le professeur Paolo Pappoti qui pilote l'initiative).
Faire face à "l'infodémie"
Eviter la propagation de ces "corona fake news", c'est l'objet du "CoronaCheck" d'EURECOM à Sophia Antipolis. La grande école du numérique, qui se positionne désormais comme un acteur clé de l'IA, vient ainsi de mettre en place le premier système de vérification des faits pour les déclarations statistiques sur les coronavirus.
Étant donné le grand nombre de déclarations inexactes sur Internet, les vérificateurs de faits humains doivent les identifier, collecter les données pertinentes et effectuer les analyses nécessaires pour valider ou rejeter une déclaration. Malheureusement, avec la surcharge d'informations sur Internet, nous sommes maintenant confrontés à ce que l'O.M.S. appelle "Infodémie". Elle rend impossible pour l'homme de vérifier manuellement chaque demande.
Vérifier automatiquement les allégations statistiques sur le coronavirus
L'idée aussi a été de construire des systèmes qui vérifient automatiquement les allégations statistiques sur le coronavirus. L'équipe du professeur Papotti à EURECOM, France et du professeur Trummer à l'Université de Cornell USA, s'y sont attelés. A partir d'outils technologique sur lesquels elles travaillaient déjà ensemble, elles ont monté un système de vérification dédié au coronavirus qui enflamme la planète.
Ce travail est rendu public aujourd'hui avec la publication de CoronaCheck (https://coronacheck.eurecom.fr/), un site web où, pour toute allégation statistique donnée, telle que "le 12 mars, les nouveaux cas n'ont augmenté que de 5% aux Etats-Unis", le système est capable de démontrer à partir des données officielles si elle est vraie ou fausse.
Un système basé sur la sémantique
À partir d'une phrase, les systèmes utilisent des classificateurs de texte pour construire des fragments de requête qui sont ensuite exécutés sur les sources de données sous-jacentes. Le résultat des requêtes est utilisé pour étiqueter automatiquement la phrase comme correcte ou fausse. Le système prend déjà en charge une grande variété de demandes dans tous les pays touchés par le virus et soutient les demandes concernant les cas avérés, les guérisons et les décès.
En outre, le système apprend, grâce aux commentaires des utilisateurs, comment traiter les nouvelles demandes et exploiter les nouveaux ensembles de données. Les données sont collectées chaque jour à partir de sources officielles notamment l'OMS, les CDC, l'ECDC, le NHC, le DXY, et les rapports des médias locaux. Elles sont traitées par des modèles d'IA à la pointe du progrès en matière de compréhension du langage naturel et de génération de requêtes.
"Nous invitons tout le monde à utiliser notre système"...
"Nous invitons tout le monde à utiliser notre système pour augmenter le nombre de demandes que nous pouvons vérifier automatiquement. Notre objectif est de maintenir le système libre et ouvert afin d'aider les utilisateurs, tels que les journalistes, à vérifier les déclarations statistiques", déclare le professeur Paolo Papotti, chef du groupe "Qualité de l'information" au sein du département des sciences des données d'EURECOM.
"Nous envisageons l'adoption de CoronaCheck par les réseaux sociaux pour identifier et vérifier automatiquement les déclarations diffusées en ligne et les soutenir dans la lutte contre la désinformation en ligne". La version actuelle est en langue anglaise, mais une version française est en cours de développement. Quant à l'initiative, elle est soutenue par une Bourse de Recherche Google et par l’ANR (Agence nationale de la Recherche).
- Contact : paolo.papotti@eurecom.fr ou communication@eurecom.fr