Contrairement à un fichier texte, vous ne pouvez pas modifier directement un PDF. Il existe plusieurs façons de générer des fichiers PDF à l'aide de texte. Mais que faire si vous voulez aller dans l'autre sens et convertir des PDF en fichiers texte?

Heureusement, Linux vous permet de modifier facilement ces fichiers depuis le terminal. Cet article montrera comment convertir un fichier PDF en un document texte sous Linux.

Convertir un PDF en texte à partir du terminal

Poppler est une bibliothèque logicielle utilisée pour rendre et modifier des fichiers PDF. Il contient un utilitaire, appelé pdfverstexte, qui permet aux utilisateurs de générer des fichiers texte à partir de PDF. Depuis poppler-utils ne fait pas partie des packages Linux standard, vous devrez l'installer manuellement à l'aide d'un gestionnaire de packages.

Sur Ubuntu et Debian:

sudo apt installer poppler-utils

Pour installer Poppler sur Arch Linux:

sudo pacman -S poppler

Installation du poppler-utils package sur CentOS, Fedora et d'autres distributions basées sur RHEL est facile.

instagram viewer
sudo dnf installer poppler-utils
sudo yum installer poppler-utils

Convertir un PDF entier en texte

La syntaxe de base de la commande pdftotext est:

pdftotext [options] pdffile fichier texte

...où fichier PDF est le chemin absolu ou relatif du fichier PDF, et fichier texte est le nom du fichier de sortie.

Par exemple, pour convertir lorem-ipsum.pdf dans un fichier texte:

pdftotext lorem-ipsum.pdf text.txt

Si le fichier que vous convertissez comporte des filigranes ou du texte non aligné, vous pouvez les supprimer dans la sortie en utilisant le -nodiag drapeau.

pdftotext -nodiag lorem-ipsum.pdf random.text

Traiter les pages dans une plage spécifique

Utilisez le -F et -l flag si vous souhaitez convertir des pages qui se situent dans une plage spécifique. Par exemple, pour convertir les pages une à cinq en lorem-ipsum.pdf écrire un SMS:

pdftotext -f 1 -l 5 lorem-ipsum.pdf output.txt

Pour convertir uniquement la première page du fichier PDF:

pdftotext -f 1 -l 1 lorem-ipsum.pdf output.txt

Convertir des fichiers PDF protégés par mot de passe en texte

Pdftotext peut même convertir des fichiers PDF protégés par mot de passe en fichiers texte. le -upw et -opw drapeaux, qui représentent mot de passe de l'utilisateur et mot de passe propriétaire respectivement, prenez en charge le processus d'authentification lors de la conversion des fichiers PDF.

pdftotext -upw mot de passe lorem-ipsum.pdf output.txt
pdftotext -opw mot de passe lorem-ipsum.pdf output.txt

Assurez-vous de remplacer le mot de passe avec le mot de passe du fichier PDF.

Vous pouvez également combiner plusieurs indicateurs pour obtenir la sortie souhaitée. Par exemple, pour convertir les pages 1 à 3 d'un PDF protégé par mot de passe en texte:

pdftotext -f 1 -l 3 -upw mot de passe lorem-ipsum.pdf output.txt

En rapport: Comment convertir un fichier PDF en images sous Linux

Convertir graphiquement un PDF en un fichier texte

Si travailler avec la ligne de commande n'est pas votre tasse de thé, vous pouvez convertir des fichiers PDF en fichiers texte à l'aide d'un logiciel graphique comme Calibre. Il s'agit d'une application de gestion de livres électroniques que vous pouvez utiliser pour afficher, organiser et modifier des fichiers PDF sur votre système.

Calibre est disponible sur les référentiels officiels des distributions Linux et tout le monde peut le télécharger à l'aide d'un gestionnaire de packages.

Pour installer Calibre sur Ubuntu et Debian:

sudo apt installer calibre

Sur ArchLinux:

sudo pacman -S calibre

Sur les distributions basées sur RHEL telles que CentOS et Fedora, vous pouvez télécharger Calibre en utilisant DNF ou Yum.

sudo dnf installer calibre
sudo yum installer calibre

Comment utiliser Calibre pour convertir des fichiers PDF

Une fois installé, lancez Caliber sur votre système en utilisant le Menu des applications. Alternativement, vous pouvez démarrer Calibre à partir du terminal en tapant:

calibre

Pour générer des fichiers texte à l'aide de PDF avec Calibre:

  1. Clique sur le Ajouter des livres option du menu.
  2. Recherchez et sélectionnez le fichier PDF que vous souhaitez convertir.
  3. Mettez en surbrillance le fichier PDF dans le panneau central et sélectionnez Convertir des livres du menu.
  4. Du Format de sortie liste déroulante, sélectionnez SMS.
  5. Enfin, cliquez sur d'accord continuer.

Calibre va maintenant commencer à convertir le fichier PDF spécifié en un document texte. Vous pouvez vérifier l'état du processus en cliquant sur le bouton Emplois option, située en bas à droite de la fenêtre.

Travailler avec des fichiers PDF sous Linux

Lorsque vous souhaitez partager un document avec quelqu'un, le convertir en PDF avant le partage est le moyen le plus efficace. Auparavant, les utilisateurs devaient installer une visionneuse PDF dédiée sur leur système pour afficher les fichiers PDF, mais maintenant, presque tous les navigateurs sont livrés avec une visionneuse PDF intégrée.

Vous pouvez trouver plusieurs applications qui permettent à un utilisateur de visualiser et de modifier facilement des fichiers PDF. De nombreuses installations Linux sont livrées avec LibreOffice, une suite logicielle bureautique, qui peut être utilisée comme éditeur de PDF.

E-mail
Les 5 meilleurs éditeurs PDF Linux que vous devriez essayer

Besoin d'éditer un fichier PDF sous Linux? Ces éditeurs PDF Linux sont gratuits à installer et faciles à utiliser.

Lire la suite

Rubriques connexes
  • Linux
  • PDF
  • Éditeur de PDF
  • Linux
A propos de l'auteur
Profonde Sharma (63 articles publiés)

Deepesh est l'éditeur junior pour Linux chez MUO. Il écrit du contenu informatif sur Internet depuis plus de 3 ans. Dans ses temps libres, il aime écrire, écouter de la musique et jouer de la guitare.

Plus de Deepesh Sharma

Abonnez-vous à notre newsletter

Rejoignez notre newsletter pour des conseils techniques, des critiques, des ebooks gratuits et des offres exclusives !

Un pas de plus…!

Veuillez confirmer votre adresse e-mail dans l'e-mail que nous venons de vous envoyer.

.