Un système de détection des fake news vise à aider les utilisateurs à détecter et à filtrer les variétés de nouvelles potentiellement trompeuses. La prédiction des chances qu'une information soit intentionnellement trompeuse est basée sur l'analyse de nouvelles véridiques et trompeuses vues précédemment. La rareté des nouvelles trompeuses, disponibles sous forme de corpus de modélisation prédictive, est un obstacle majeur dans le traitement du langage naturel (NLP) et la détection des tromperies. Cet article examine trois types de fausses nouvelles, chacune par opposition aux reportages sérieux, et évalue leurs avantages et leurs inconvénients en tant que corpus pour l'analyse de texte et la modélisation prédictive. Le filtrage, le contrôle et la vérification de l'information en ligne continuent d'être essentiels pour les sciences de l'information (SIL) car les frontières entre les nouvelles traditionnelles et l'information en ligne s'estompent.