C’est un outil qui va plaire aux historiens et aux amateurs de presse. Library of Congress Labs vient de déployer Newspaper Navigator.
Cet outil en ligne est gratuit pour tous. Il permet d’explorer plus de 1,5 million d’images historiques de journaux américains, grâce à une intelligence artificielle.
Ces journaux couvrent une période allant de 1789 à 1963.
Il existe des recherches plein texte pour les documents mais la reconnaissance d’images est une autre affaire. Newspaper Navigator répond à ce besoin.
Comment fonctionne Newspaper Navigator ?
L’utilisateur commence par entrer un mot-clé qui renvoie une sélection de photos.
Ensuite, on peut choisir les photos sur lesquelles effectuer la recherche, ce qui permet de découvrir des images associées qui étaient auparavant indétectables par les moteurs de recherche.
Il suffit ensuite d’approfondir les recherches. Vous téléchargez, recherchez plus d’informations sur le journal qui a publié ou encore, vous lisez l’intégralité du titre.
Pour créer Newspaper Navigator, le développeur a créé un algorithme pour trier 16 millions de pages de journaux Chronicling America à la recherche de photographies, illustrations, cartes, dessins animés, bandes dessinées, publicités, etc.
Le code utilisé dans le projet est open source pour une réutilisation sans restriction. Le code de l’ensemble de données est accessible ici .
Résultat, vous pouvez explorer 1,5 million d’images tirées des publications de journaux historiques. Pour expérimenter c’est ici