Optimisation des PDF

Introduction

Le format PDF (Portable Document Format, format de document portable) facilite la publication et l'impression des contenus électroniques. Il peut toutefois aboutir à la création de fichiers inutilement volumineux lorsqu'il est mal utilisé. Ce chapitre vise à expliquer comment utiliser le format PDF de façon optimale.

Le format PDF est-il approprié ?

Lorsque vous créez un document à des fins de distribution, tentez d'utiliser le format HTML ou du texte brut à la place ou en complément du format PDF. Contrairement aux formats texte et HTML qui sont faciles à compresser et à utiliser, le format PDF peut occasionner une augmentation considérable de la taille des fichiers. De plus, aucun logiciel d'affichage supplémentaire n'est nécessaire pour les formats texte et HTML, ce qui n'est pas le cas pour le format PDF. Or, si l'utilisateur ne dispose pas du logiciel requis, il devra le télécharger. Le site Web List Apart présente un résumé[1] (anglais) des raisons pour lesquelles le format PDF se montre inapproprié pour de nombreux documents.

Choisir la version correcte

Nous vous recommandons d'utiliser la version 1.4 du standard PDF pour générer vos documents PDF. La plupart des afficheurs de PDF sont compatibles avec la version 1.4. Etant donné que les dernières versions d'afficheurs de PDF sont généralement plus volumineuses que les anciennes versions (la taille d'Adobe Reader 8.1 pour Windows est de 22,3 Mo), il est probable que les utilisateurs munis d'une connexion à bande passante faible ne souhaiterons pas les télécharger. En outre, le standard PDF/A ou PDF-Archive est destiné au stockage à long terme des documents et se compose d'un sous-ensemble réduit du standard 1.4. En utilisant la version 1.4 ou une version antérieure, vous permettrez donc aux utilisateurs de passer au standard PDF-Archive sans problème. La version 1.5 du standard PDF permet de compresser l'ensemble du fichier PDF. Toutefois, cette version n'est pas compatible avec les versions antérieures d'afficheurs PDF et, à moins que vous ne soyez certain que les utilisateurs de votre site Web seront en mesure de lire ces documents, il est préférable d'utiliser la version 1.4.

Informations imbriquées

Les documents PDF peuvent inclure des informations supplémentaires, telles que des polices imbriquées, visant à optimiser la qualité d'affichage et d'impression. Ces fonctionnalités consomment de l'espace supplémentaire dans le fichier et doivent donc être téléchargées par l'utilisateur.

L'utilisation de polices standard permet de réduire le nombre de polices imbriquées dans le document. D'après la référence PDF 1.4[2](anglais), les polices de base suivantes existent sur tous les systèmes :

  • Courier
  • Courier-Bold
  • Courier-BoldOblique
  • Courier-Oblique
  • Helvetica
  • Helvetica-Bold
  • Helvetica-BoldOblique
  • Helvetica-Oblique
  • Symbol
  • Times-Bold
  • Times-BoldItalic
  • Times-Italic
  • Times-Roman
  • ZapfDingbats

Ces polices de base ne prennent pas en charge les langues qui comprennent des caractères non latins. Pour ces langues, il est possible que vous deviez utiliser une police imbriquée dans le document. Si vous imbriquez des polices dans un document, vous pouvez créer un sous-ensemble de caractères afin d'imbriquer uniquement les caractères que vous utilisez plutôt que l'ensemble des caractères. Cette opération peut se montrer très utile puisqu'elle permet également aux utilisateurs désireux de modifier votre PDF de disposer des caractères nécessaires.

Réduction des graphismes

Lorsque vous produisez un fichier PDF à partir d'un document numérisé, les pages doivent être stockées sous forme d'images, ce qui nécessite une quantité d'espace beaucoup plus importante que lorsqu'il s'agit d'un texte. Si possible, utilisez un logiciel de reconnaissance optique de caractères (ROC) pour reproduire le texte de vos images numérisées ou saisissez le texte de façon manuelle.

Utilisez des graphismes vectoriels pour les dessins composés de lignes (diagrammes, graphiques, etc.) et le format GIF pour les images. Ces éléments peuvent être compressés sans problème et ne subiront aucune perte de qualité en cas de mise à l'échelle.

Les techniques de compression décrites dans le chapitre Images peuvent être appliquées aux images utilisées dans les PDF. Certains outils de création de PDF sont toutefois munis de leurs propres outils de compression d'image et il est donc parfois plus efficace d'insérer des images haute qualité dans le PDF, puis d'utiliser les outils de création de PDF fournis pour compresser les images au niveau souhaité. Les images qui ont été compressées avant d'être insérées dans le PDF risquent d'amener à des résultats de mauvaise qualité une fois recompressées à l'aide des outils de création de PDF.

Pensez à fournir plusieurs versions du même PDF avec plusieurs niveaux de compression ou sans image.

Fractionnement des fichiers

Vous pouvez fractionner vos documents en plusieurs fichiers de manière à ce que les utilisateurs ne soient pas contraints de télécharger l'ensemble du document s'ils ne souhaitent en consulter qu'un chapitre.

PDF linéarisés

Un PDF linéarisé est un fichier PDF qui a été optimisé de manière à ce que les pages puissent être visualisées à l'aide d'un afficheur de PDF intégré au navigateur avant que l'ensemble du document n'ait été chargé. Ce procédé est également appelé Téléchargement page à page ou Fast Web View. Similaire à l'affichage incrémentiel pour les pages Web, il permet d'accélérer l'affichage des documents tout en améliorant l'expérience des utilisateurs. Grâce à la linéarisation, les utilisateurs peuvent évaluer plus rapidement la valeur du document téléchargé. Notez toutefois que les fichiers linéarisés sont plus large que les fichiers non linéarisés.

Dans Acrobat 8, si vous enregistrez votre document à l'aide de l'option Enregistrer sous..., celui-ci est automatiquement linéarisé et tous les objets non utilisés sont supprimés par défaut. Pour plus d'informations, veuillez vous reporter au document Optimisation des fichiers Adobe PDF pour le Web (anglais).

Le site Web Websiteoptimization.com[4] fournit des informations détaillées sur les méthodes à utiliser pour optimiser les documents PDF dans Acrobat 8 ainsi que dans d'autres outils.

Synthèse

Pour optimiser vos PDF, nous vous recommandons d'utiliser :
  • du code HTML ou du texte brut plutôt qu'un document PDF, si possible.
  • la version 1.4 de PDF standard lors de l'enregistrement de vos PDF.
  • des polices standard interplateforme, telles que Helvetica, plutôt que des polices imbriquées
  • du texte OCR issus de documents numérisés
  • des graphiques vectoriels

Des détails supplémentaires sur l'accessibilité et le téléchargement des PDF sont disponibles dans le Guide d'utilisation des documents PDF[5] d'Aptivate (anglais).

Références

[#1] Faits et opinions quant à l'accessibilité des PDF, Joe Clark, A List Apart, 2005 (anglais) http://www.alistapart.com/articles/pdf_accessibility/

[#2] Référence PDF, Troisième édition, Version Adobe PDF 1.4, Adobe Systems Inc, 2001 (anglais) http://www.adobe.com/devnet/pdf/pdfs/PDFReference.pdf (8,95 Mo)

[#3] Optimisation des fichiers Adobe PDF pour le Web, Adobe Systems Inc, 2001 (anglais) http://www.adobe.com/products/acrobat/pdfs/c01acrotip.pdf (76 Ko)

[#4] Optimisation des fichiers PDF, websiteoptimisation.com http://www.websiteoptimization.com/speed/tweak/pdf/

[#5] Guide d'utilisation des documents PDF, Aptivate, 2007 http://www.aptivate.org/Projects.PDFUsageGuidelines.html