
Re-transcripro n'assure pas directement la numérisation des
documents anciens.
Toutefois, nous travaillons
régulièrement avec un prestataire qui assure un service
de qualité : Digiscrib.
La numérisation
La numérisation est la création de la représentation graphique d'un support papier ou d'un objet compréhensible par l'ordinateur. Entre autres, elle est utilisée pour la conversion d'un support papier au format binaire, donnant naissance à une oeuvre virtuelle, qui peut être stockée et manipulée sur un support numérique (Ordinateur, CDROM, eBook, PDA, etc).
Cette oeuvre virtuelle peut ensuite être traitée pour l'adapter à des besoins particuliers, pour la corriger, ou pour l'océriser afin de convertir l'image en données, et pouvoir ainsi l'indexer dans des bases de données.
L'intérêt de cette dématérialisation d'un support papier ou d'un objet est multiple :
- Sauvegarder le patrimoine,
- Faciliter la manipulation des ouvrages et documents,
- Faciliter l'indexation, le classement, et la recherche d'information,
- Rendre accessibles des ouvrages et des documents très protégés,
- Diffuser des ouvrages et des documents sur Internet.
Ainsi renaît l'oeuvre délicate ou inaccessible au grand public, puisque chercheurs ou simples lecteurs ont accès à l'oeuvre numérisée, dans sa qualité, sa typographie, ses couleurs et son contenu parfaitement préservés.
Digiscrib est une société spécialisée dans la numérisation des livres et documents.
Les locaux de la société Digiscrib ont été adaptés pour accorder un soin particulier aux livres, aux documents, ou à tout autre type de support papier.
Les oeuvres sont traitées uniquement avec des gants 100% coton. Elles sont stockées et numérisées dans des pièces assurant une température et un taux d'humidité constants. Quand elles ne sont pas en phase de numérisation, elles demeurent stockées à l'abri dans une armoire forte ignifuge. Les locaux de la société respectent les exigences de la Bibliothèque Nationale de France.
Une attention toute particulière est portée aux étapes de la manipulation de l'oeuvre. L'armoire forte et le scanner sont dans la même pièce, limitant ainsi le déplacement de l'oeuvre de pièce en pièce, avec des risques de changement de température et d'humidité. L'oeuvre est, si possible, numérisée en une seule fois, évitant ainsi des surmanipulations humaines entre son lieu de stockage, l'armoire forte, et le scanner.
La société Digiscrib dispose des dernières technologies de pointe en matière de numérisation, systèmes informatiques et logiciels.
Afin de garantir des résultats optimaux et de grande qualité, Digiscrib s'associe à des grands fabricants de matériel de numérisation, comme Zeutschel et Ricoh.
 |
Digiscrib possède des équipements parfaitement adaptés pour les fonds anciens ou les documents délicats, comme l'OS12000 de Zeutschel : scanner équipé d'un balayage (numérisation) de l'ouvrage sans contact, sur plateau compensateur pour le respect de la reliure de l'ouvrage, proposant une haute résolution (600 dpi) ; des logiciels sophistiqués et performants, tels OMNISCAN, qui fournissent en sortie des fichiers JPG, TIFF, PNG entre autres ; un système de correction de la courbure du livre, etc. |
Digiscrib possède aussi des scanners à plat répondant aux attentes de la numérisation de grands volumes de documents en haute qualité (jusqu'à 600 dpi), capables de scanner les documents recto/verso, etc. |
 |
Cette haute technologie est combinée à des logiciels de traitement d'images très performants pour vérifier la qualité des images obtenues à partir des scanners, ou pour les adapter aux demandes des clients.
La reconnaissance optique de caractères (ROC ou OCR)
Très souvent, la finalité de la numérisation est de pouvoir exploiter le texte contenu dans les livres et documents numérisés.
La conversion d'une image, la représentation graphique d'un texte, à du texte proprement dit, est possible grâce à la reconnaissance optique de caractères (ROC ou OCR)
Pour l'océrisation de livres et documents, Digiscrib utilise les logiciels les plus récents, les plus sophistiqués, et les plus performants du marché FineReader, Tesseract, etc).

La société propose une large gamme de formats de fichiers pour le rendu du texte ou des données (PDF, Word, txt, etc.), que ce soit par l'OCR directement, ou par le traitement des données effectué ensuite.