C’est quoi un fichier DJVU ? un format adapté à l’archivage des documents numériques.

Depuis l’essor d’Internet, les comportements ont changé puisque toutes les informations sont stockées en ligne. Cela apporte un avantage considérable, mais parfois la taille est relativement importante. Le poids peut donc générer un problème qu’il ne faut pas négliger, d’où l’intérêt de se focaliser sur un format spécifique : DjVu.

 Petite présentation de ce format prononcé « Déjà Vu »

Il s’agit d’une nouvelle technologie de compression qui s’avère être particulièrement puissante pour les images. Elle se dresse comme un concurrent important face au JPEG ou encore au GIF. Toutefois, la qualité d’image a la particularité d’être beaucoup plus élevée alors que la taille est aisément divisée par 5, voire 10 dans certains cas de figure.

C’est en 1996 que ce format a été développé grâce aux laboratoires AT&T. Ces derniers ont eu l’ingéniosité de concevoir un format susceptible de compresser/décompresser les fichiers d’une haute résolution sans pour autant perdre de la qualité. En parallèle, la mémoire vive des machines n’est pas impactée, il présente donc plusieurs points forts qu’il est judicieux de présenter.

Compresser massivement un fichier conséquent

La première particularité réside dans sa taille, certes il ne demande pas une grande place, mais ses compétences sont beaucoup plus importantes. Un fichier de plusieurs kilo-octets aura la particularité de proposer des graphiques, des motifs colorés ou encore différentes polices sans pour autant nécessiter un espace de stockage élevé. Si par exemple, les internautes éprouvent des difficultés à prendre connaissance d’un contenu à cause d’un chargement trop long, avec le format DjVu, ce problème est balayé d’un revers de la main. En effet, seule la partie visible par l’internaute est compressée. Vous avez donc l’occasion de numériser un livre, mais le temps de diffusion sur le Web ne sera pas un point faible.

Une rapidité de lecture des données graphiques

Il suffit de se focaliser une seule fois sur ce concept pour comprendre ses atouts. Si vous avez l’habitude d’utiliser des formats comme le PDF, vous constaterez immédiatement que les avantages sont nombreux notamment au niveau des données graphiques. Ces dernières sont restituées très rapidement, et cela grâce à une méthode de fonctionnement appréciable. En effet, toutes les informations sont converties en mode point, cela permet de gagner un temps considérable qu’il ne faut pas négliger puisque les internautes veulent naviguer vite sur la toile, sans perdre une seule seconde.

Le confort est également un point fort, car vous n’êtes pas dans l’obligation de faire défiler la page pour prendre connaissance de son contenu. La lecture s’effectue via des flèches. En cliquant sur ces dernières, vous pouvez passer d’une page à une autre avec aisance.

Une compétence avérée pour l’archivage des documents

Comme il a une puissance de frappe élevée en matière de compression, il s’attaque facilement aux manuels, à la documentation historique, et même à la numérisation des ouvrages anciens. Aujourd’hui, les méthodes de conservation ont évolué grâce au Web. Auparavant, il était nécessaire de se rendre dans un lieu spécifique pour prendre connaissance d’un document à la fois précieux et rare. Avec le format DjVu, toutes les informations sont susceptibles d’être archivées sans perdre la qualité, mais en nécessitant un faible stockage.

Il est donc possible de remplacer toutes les bibliothèques physiques par des versions virtuelles grâce à cette technologie. Il est par conséquent particulièrement adapté à la lecture fréquente de contenus qui demandent une place considérable. De plus, il est judicieux de ne pas négliger ses performances obtenues grâce à une rapide mise en mémoire cache. Lorsque vous chargez une page afin de prendre connaissance de son contenu, l’affichage a le mérite d’être à la fois instantané et souple.

Cette technique performante est utilisée par de nombreux centres d’archivages. Sur le Web, il est possible de la repérer au niveau du projet Wikisource. Du côté de la Fondation Mozilla, un plug-in a même été intégré au navigateur. C’est aussi le cas pour Opera, Galeon, Netscape et Konqueror.

La méthode de compression utilisée par ce format

DjVu a la particularité de s’attaquer à une image en la découpant en plusieurs morceaux, cela lui donne les moyens de la compresser séparément. Le mode opératoire est relativement simple :

  • Étape 1 : séparation de l’image en trois images distinctes
  • Étape 2 : obtention d’une image de fond, d’une image de premier plan ainsi qu’un masque
  • Étape 3 : compression selon plusieurs méthodes

Le logiciel s’attarde sur les deux premières images préalablement obtenues, ce sont dans la plupart des cas des clichés d’une couleur de faible résolution. La compression est effectuée par ondelettes grâce à un algorithme spécifique baptisée IW44.

En parallèle, le masque affiche une haute résolution en noir et blanc. Dans cette zone qui oscille généralement autour de 300 dpi, le texte est présent. Dans ce cas de figure, il a recours à la méthode JB2 afin de compresser l’ensemble.

Cette méthode s’avère être particulièrement ingénieuse pour une police, puisque les logiciels classiques ont tendance à compresser chacune des occurrences. C’est à ce moment que le logiciel DjVu se démarque, car il a les compétences nécessaires pour compresser une seule fois cette occurrence, mais, si elle est présente à plusieurs reprises dans le document, il enregistre seulement ses différentes positions.

Par exemple avec une connexion de 56 kb/s, il suffira de trois secondes pour qu’une page soit visible. Quelques secondes plus tard, les images ainsi que le fond se dévoileront.

Comment convertir un DjVu en PDF ?

Ces deux formats ont des spécificités, mais ils ont tout de même un point commun. Lorsqu’un internaute prend connaissance d’un document, il apparait de la même façon et peu importe le lecteur. DjVu se démarque uniquement au niveau du taux de compression qui est par conséquent beaucoup plus élevé. Un fichier PDF aura tendance à être beaucoup plus lourd, mais pour diverses raisons, il est possible d’opter pour une conversion.

Le logiciel Gscan2pdf a la particularité d’importer le document en DjVu et de l’enregistrer par la suite en PDF. Ce n’est pas sa seule compétence puisqu’il peut effectuer la même démarche avec les fichiers GIF, JPEG, TIFF ou encore PNM. Il est possible d’utiliser un convertisseur en ligne comme DjVu2PDF, cette technique a l’avantage d’être particulièrement attractive grâce à sa rapidité.

Comment lire ou créer des fichiers DjVu ?

Pour la lecture, l’un des logiciels les plus connus se nomme WinDJView, il s’attaque aussi bien aux fichiers qu’aux images qui utilisent ce format de compression. Plusieurs fonctionnalités sont au rendez-vous, ce qui permet d’accroître le confort. Vous pourrez par exemple bénéficier d’options supplémentaires pour l’impression, l’insertion de marques-page ou encore l’export au format BMP… En parallèle, vous aurez la possibilité d’effectuer un zoom pour cibler une zone particulière dans le document.

Les internautes sont aussi invités à utiliser Evince qui est un visionneur de documents, mais il ne se focalise pas sur la table des matières contrairement à Djview4. Ce dernier possède plusieurs points forts qu’il est judicieux d’évoquer, car ils apportent un certain confort. Toutes les options ont la particularité d’être accessibles aisément alors qu’il est basé sur DjVuLibre. Il permet de prendre en charge les noms, les métadonnées, les contours…

Pour la création d’un fichier DjVu, nous avons la méthode préalablement citée à savoir Gscan2PDF qui est aussi compétent pour la conversion dans un autre format. Ce logiciel permet de scanner et d’assembler les documents tout en jouissant d’une reconnaissance des caractères ROC. En parallèle, vous pouvez choisir DjVuLibre qui est compatible avec Windows et Mac.

Quelles sont ses compétences en termes de compression ?

Ceux qui recherchent un gain de place considérable seront immédiatement séduits par le potentiel de ce format. Les taux de compression ont tendance à être 5 à 10 fois supérieurs que ceux proposés par des méthodes classiques comme les GIF ou les JPEG. Dans ce cas de figure, nous évoquons les documents en couleur qui demandent un stockage plus important.

A contrario, ils seront 3, voire 8 fois plus importants que ceux identifiés pour un fichier TIFF qui est généralement utilisé pour les fichiers en noir et blanc. C’est pour cette raison que l’archivage est sa principale caractéristique et il suffit d’un seul exemple pour comprendre son pouvoir. Une page en noir et blanc en 300 dpi ne demandera pas plus de 30 KB grâce à une conversion en DjVu. D’autres points forts peuvent être listés :

  • Les fichiers seront 3 à 8 fois plus petits que les PDF générés en noir et blanc
  • Les formats DjVu sont 5, voire 10 fois moins gourmands que les JPEG qui proposent des textes, des images et de la couleur
  • Ils seront 10 à 20 fois plus petits que les JPEG lorsque les documents seront seulement en noir et blanc

Certes, la compression représente son point fort, mais un avantage particulier sera disponible pour les internautes. Alors que certaines images demandent près de 25 MB de RAM, avec un tel format, elles ne nécessiteront que 2 MB de RAM. Ce gain est considérable, cela vous permet de visionner des images qualitatives sans entacher les ressources de votre machine.

Cela s’avère être particulièrement attractif pour les grandes photos de 2500 x 3300 pixels. Dans ce cas de figure, nous sommes en présence d’un format standard en 300 dpi, mais le téléchargement est instantané même si votre ordinateur possède une faible mémoire vive et des compétences peu élevées.

Ce format est-il compatible avec les Mac ?

Généralement, lorsque des fichiers sont disponibles sous Windows ou d’autres écosystèmes, les compatibilités avec l’OS d’Apple ne sont pas toujours au rendez-vous. Les propriétaires de ces machines seront donc heureux d’apprendre qu’il est possible de dénicher des « Viewer » et des « Reader » pour les Mac. Vous avez l’occasion d’utiliser DjVuLibre que nous avons évoqué au préalable, mais certains logiciels sont spécialement conçus pour ce format. C’est le cas pour MacDjView, mais qui est contraignant si vous souhaitez effectuer une impression ou de l’export. Ces fonctionnalités ne sont pas intégrées.

Sur l’App Store, vous serez en mesure de trouver DjVu Reader, mais cette version semble être payante. Elle ne sera toutefois pas compétente pour l’export, ce qui peut s’avérer complexe dans certains cas de figure. Pour jouir d’un logiciel complet et confortable, il suffit de se diriger vers DjVuLibre qui représente sans doute la meilleure solution pour OS X et Windows. En effet, il a la particularité d’imprimer des documents utilisant ce format.

Quelles sont les compétences de DjVuLibre ?

A plusieurs reprises dans cet article, nous avons prononcé son nom. C’est sans doute dû à sa performance puisqu’il est aujourd’hui le procédé le plus attractif. Cette implémentation libre de ce format dispose de plusieurs fonctionnalités particulièrement intéressantes. Certes, il peut visionner et imprimer de tels documents, mais un plug-in est disponible. Ce dernier est intégré sur plusieurs navigateurs Web comme Firefox, Opera ou encore Netscape. Il est également compatible avec l’écosystème Linux qui est généralement peu évoqué au vu de sa spécificité.

En effet, nombreux sont ceux qui se sont familiarisés avec Windows et OS X, mais Linux reste un format adapté aux amateurs d’informatique qui souhaitent évoluer en parallèle de ces formats popularisés. DjVuLibre vous propose une série d’outils comme la modification d’une ligne de commandes. Cette dernière vous donne les moyens de manipuler un fichier afin de le convertir ou encore de l’exporter via un autre format. C’est généralement à ce moment que les internautes l’utilisent pour la conversion d’un DjVu en PDF.

Du côté de Windows, une spécificité est au rendez-vous. vous avez la capacité d’installer MiniDjVu qui représente une alternative efficace.

En utilisant ce logiciel, plusieurs commandes seront à votre disposition et elles ont à chaque fois une compétence spécifique :

  • Djvutxt s’attaque au texte dissimulé
  • Djvumake assemble les différents morceaux alors que djvuextract s’occupe de les extraire
  • Djvudump affiche la structure du fichier
  • Ddjvu convertit les documents
  • Djvused manipule les fichiers grâce à de puissantes commandes
  • Bzz compresse toutes les données
  • Cpaldjvu encode les images
  • Cjb2 s’occupe des fichiers en noir et blanc
  • C44 encode les images par ondelettes comme nous avons pu le voir au préalable