Comment convertir un PDF en Word en Python

2024-01-25 06:10:29

Le principal avantage des fichiers PDF est leur capacité à toujours conserver le format et la mise en page du document original, ce qui les rend idéaux pour le partage et l'impression. Cependant, ils sont souvent difficiles à éditer ou à modifier sans logiciel spécialisé. Dans ce cas, la conversion de PDF en Word vous offre une plus grande flexibilité. Avec cette conversion, vous pouvez facilement apporter diverses modifications au contenu du document, telles que modifier le texte, ajouter ou supprimer du texte et ajuster le formatage et les styles pour qu'il réponde à vos besoins. Dans cet article, je vais vous montrer un moyen simple mais efficace de convertir un PDF en Word via Python.

Bibliothèque Python pour la conversion PDF

Spire.PDF for Python est une puissante API de manipulation de PDF qui vous permet de créer, modifier ou convertir des fichiers PDF sur les plateformes Python. Avec lui, vous pouvez utiliser le code Python pour convertir un PDF en Word sans effort et définir les propriétés du document lors de la conversion. Avant cela, veuillez installer Spire.PDF for Python et plum-dispatch v1.7.4 à l'aide des commandes pip suivantes.

pip install Spire.PDF

Cet article couvre plus de détails sur l'installation: Comment installer Spire.PDF for Python dans VS Code

Convertir un PDF en DOC en Python

Si vous souhaitez modifier le contenu d'un PDF, le convertir d'abord au format Word est un bon choix. Prenons l'exemple de la conversion PDF en DOC. Il vous suffit de charger le PDF et de l'enregistrer au format DOC à l'emplacement souhaité.

Pas

  1. Importez les modules de bibliothèque nécessaires.
  2. Créez un objet PdfDocument.
  3. Utilisez la méthode PdfDocument.LoadFromFile() pour charger un fichier PDF à partir du chemin spécifié.
  4. Appelez la méthode PdfDocument.SaveToFile() pour enregistrer le PDF au format Word, en spécifiant FileFormat comme DOC.
  5. Fermez l'objet PdfDocument.

Exemple de code

  • Python
from spire.pdf.common import *
    from spire.pdf import *
    
    # Create a PdfDocument object
    pdf = PdfDocument()
    
    # Load a PDF file from the specified path
    pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf")
    
    # Save the PDF in DOC format
    pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDoc.doc", FileFormat.DOC)
    
    # Close the PdfDocument object
    pdf.Close()

How to Convert PDF to Word in Python

Convertir un PDF en DOCX en Python

Cette méthode est la même que celle ci-dessus. Il vous suffit de spécifier le format DOCX lors de l'enregistrement du fichier généré à la fin.

Pas

  1. Importez les modules de bibliothèque nécessaires.
  2. Créez un objet PdfDocument.
  3. Utilisez la méthode PdfDocument.LoadFromFile() pour charger un fichier PDF à partir du chemin spécifié.
  4. Appelez la méthode PdfDocument.SaveToFile() pour enregistrer le PDF au format Word, en spécifiant FileFormat comme DOCX.
  5. Fermez l'objet PdfDocument.

Exemple de code

  • Python
from spire.pdf.common import *
    from spire.pdf import *
    
    # Create a PdfDocument object
    pdf = PdfDocument()
    
    # Load a PDF file from the specified path
    pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf")
    
    # Save the PDF in DOCX format
    pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDocx.docx", FileFormat.DOCX)
    
    # Close the PdfDocument object
    pdf.Close()

How to Convert PDF to Word in Python

Définir les propriétés du document lors de la conversion en Python

En plus des conversions régulières, vous pouvez également personnaliser les propriétés du document lors de la conversion PDF en Word. Cela peut vous aider à mieux catégoriser et gérer vos documents.

Pas

  1. Importez les modules de bibliothèque requis.
  2. Créez un objet PdfToDocConverter et transmettez le chemin du fichier PDF à convertir en paramètre.
  3. Personnalisez les propriétés du document Word converti via les propriétés de la classe PdfToDocConverter.
  4. Appelez la méthode PdfToDocConverter.SaveToDocx() pour enregistrer le PDF au format Word.

Exemple de code

  • Python
from spire.pdf.common import *
    from spire.pdf import *
    
    # Create a PdfToDocConverter object
    converter = PdfToDocConverter("C:/Users/Administrator/Desktop/Sample.pdf")
    
    # Customize the properties for the file
    converter.DocxOptions.Title = "World Environment Day"
    converter.DocxOptions.Subject = "Promoting Sustainable Actions for a Greener Future."
    converter.DocxOptions.Tags = "Environmental Protection"
    converter.DocxOptions.Categories = "Environment"
    converter.DocxOptions.Commments = "This is an article about environmental protection."
    converter.DocxOptions.Authors = "Mark"
    converter.DocxOptions.LastSavedBy = "Johnny"
    converter.DocxOptions.Revision = 5
    converter.DocxOptions.Version = "V4.0"
    converter.DocxOptions.ProgramName = "Green Development"
    converter.DocxOptions.Company = "New Technology"
    converter.DocxOptions.Manager = "Andy"
    
    # Save the PDF in DOCX format
    converter.SaveToDocx("C:/Users/Administrator/Desktop/SetProperties.docx")

How to Convert PDF to Word in Python

Obtenez une licence gratuite pour la bibliothèque pour convertir des fichiers PDF

Vous pouvez obtenir un licence temporaire gratuite de 30 jours de Spire.PDF for Python pour utiliser le script Python pour convertir un PDF en Word sans aucune limitation d'évaluation.

Conclusion

Dans cet article, vous avez appris à convertir facilement un PDF en Word avec Python. Avec la bibliothèque Spire.PDF for Python , vous pouvez également créer un PDF à partir de zéro ou le modifier selon vos besoins. En bref, cette bibliothèque simplifie le processus et permet aux développeurs de se concentrer sur la création d'applications puissantes qui effectuent des tâches de manipulation de PDF.

Voir également