Plus d'un million de pages de journaux anciens consultables en ligne

4 millions de pages ont été numérisées
4 millions de pages ont été numérisées - © Bibliothèque Royale de Belgique

Consulter d’anciens journaux belges archivés par la Bibliothèque Royale de Belgique depuis son canapé, c'est désormais possible. Plusieurs millions de pages ont été numérisées ces deux dernières années et une partie est désormais consultable en ligne. La numérisation, qui œuvre à la conservation d'un patrimoine, ouvre aussi à de nouveaux types de recherche.

C’est un projet gigantesque. 4 millions de pages ont été numérisées. Gigantesque et compliqué vu la nature du support. " Avec les journaux, la difficulté c’est leur taille. Ce sont des grands documents. Il faut donc des grandes machines et puis le papier est très fragile, ce qui rend les manipulations délicates" explique Frédéric Lemmers, le coordinateur de la numérisation des collections. Une numérisation qui se fait en plusieurs étapes. D'abord, il faut faire une image de la page, la retravailler. " Ensuite, il y a l’OCR (ndlr : Optical Character Recognition). Autrement dit, sur base d’une image de bonne qualité, on extrait le texte pour en faire un fichier texte. Et c’est ce fichier qui va ensuite être indexé dans un moteur de recherche ". Ce qui ouvre la voie à d'autres types de requêtes que les traditionnelles recherches " calendrier " par titre. " C’est une sorte de Google basé sur un corpus de journaux belges " détaille Marc D'Hoore, conservateur de la section journaux et média contemporain. " Et vous cherchez ce que vous voulez. Potentiellement, cela révolutionne les thématiques et les méthodes de recherche. Ça ouvre la voie à des recherches d’ordre lexicographique ou encore statistique."

Aujourd'hui sont accessibles en ligne uniquement les journaux libres de droits. Des titres de 1831 jusqu'à 1918 comme De Nieuwe Standaard, L’Indépendance Belge ou encore L’Echo De La Presse. 350 000 pages sont déjà consultables aujourd'hui en ligne , 1,2 million d'ici la fin de l'année. Le reste du catalogue numérique, dont les titres sont toujours soumis à des droits d’auteur, est accessible dans les murs de la bibliothèque royale.

Pierre Vandenbulcke

Newsletter info

Recevez chaque matin l’essentiel de l'actualité.

OK