Table des matières
Installer avec Pip
pip install Spire.PDF
Liens connexes
Le principal avantage des fichiers PDF est leur capacité à toujours conserver le format et la mise en page du document original, ce qui les rend idéaux pour le partage et l'impression. Cependant, ils sont souvent difficiles à éditer ou à modifier sans logiciel spécialisé. Dans ce cas, la conversion de PDF en Word vous offre une plus grande flexibilité. Avec cette conversion, vous pouvez facilement apporter diverses modifications au contenu du document, telles que modifier le texte, ajouter ou supprimer du texte et ajuster le formatage et les styles pour qu'il réponde à vos besoins. Dans cet article, je vais vous montrer un moyen simple mais efficace de convertir un PDF en Word via Python.
- Bibliothèque Python pour la conversion PDF
- Convertir un PDF en DOC
- Convertir un PDF en DOCX
- Définir les propriétés du document lors de la conversion
- Obtenez une licence gratuite pour la bibliothèque
Bibliothèque Python pour la conversion PDF
Spire.PDF for Python est une puissante API de manipulation de PDF qui vous permet de créer, modifier ou convertir des fichiers PDF sur les plateformes Python. Avec lui, vous pouvez utiliser le code Python pour convertir un PDF en Word sans effort et définir les propriétés du document lors de la conversion. Avant cela, veuillez installer Spire.PDF for Python et plum-dispatch v1.7.4 à l'aide des commandes pip suivantes.
pip install Spire.PDF
Cet article couvre plus de détails sur l'installation: Comment installer Spire.PDF for Python dans VS Code
Convertir un PDF en DOC en Python
Si vous souhaitez modifier le contenu d'un PDF, le convertir d'abord au format Word est un bon choix. Prenons l'exemple de la conversion PDF en DOC. Il vous suffit de charger le PDF et de l'enregistrer au format DOC à l'emplacement souhaité.
Pas
- Importez les modules de bibliothèque nécessaires.
- Créez un objet PdfDocument.
- Utilisez la méthode PdfDocument.LoadFromFile() pour charger un fichier PDF à partir du chemin spécifié.
- Appelez la méthode PdfDocument.SaveToFile() pour enregistrer le PDF au format Word, en spécifiant FileFormat comme DOC.
- Fermez l'objet PdfDocument.
Exemple de code
- Python
from spire.pdf.common import * from spire.pdf import * # Create a PdfDocument object pdf = PdfDocument() # Load a PDF file from the specified path pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf") # Save the PDF in DOC format pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDoc.doc", FileFormat.DOC) # Close the PdfDocument object pdf.Close()
Convertir un PDF en DOCX en Python
Cette méthode est la même que celle ci-dessus. Il vous suffit de spécifier le format DOCX lors de l'enregistrement du fichier généré à la fin.
Pas
- Importez les modules de bibliothèque nécessaires.
- Créez un objet PdfDocument.
- Utilisez la méthode PdfDocument.LoadFromFile() pour charger un fichier PDF à partir du chemin spécifié.
- Appelez la méthode PdfDocument.SaveToFile() pour enregistrer le PDF au format Word, en spécifiant FileFormat comme DOCX.
- Fermez l'objet PdfDocument.
Exemple de code
- Python
from spire.pdf.common import * from spire.pdf import * # Create a PdfDocument object pdf = PdfDocument() # Load a PDF file from the specified path pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf") # Save the PDF in DOCX format pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDocx.docx", FileFormat.DOCX) # Close the PdfDocument object pdf.Close()
Définir les propriétés du document lors de la conversion en Python
En plus des conversions régulières, vous pouvez également personnaliser les propriétés du document lors de la conversion PDF en Word. Cela peut vous aider à mieux catégoriser et gérer vos documents.
Pas
- Importez les modules de bibliothèque requis.
- Créez un objet PdfToDocConverter et transmettez le chemin du fichier PDF à convertir en paramètre.
- Personnalisez les propriétés du document Word converti via les propriétés de la classe PdfToDocConverter.
- Appelez la méthode PdfToDocConverter.SaveToDocx() pour enregistrer le PDF au format Word.
Exemple de code
- Python
from spire.pdf.common import * from spire.pdf import * # Create a PdfToDocConverter object converter = PdfToDocConverter("C:/Users/Administrator/Desktop/Sample.pdf") # Customize the properties for the file converter.DocxOptions.Title = "World Environment Day" converter.DocxOptions.Subject = "Promoting Sustainable Actions for a Greener Future." converter.DocxOptions.Tags = "Environmental Protection" converter.DocxOptions.Categories = "Environment" converter.DocxOptions.Commments = "This is an article about environmental protection." converter.DocxOptions.Authors = "Mark" converter.DocxOptions.LastSavedBy = "Johnny" converter.DocxOptions.Revision = 5 converter.DocxOptions.Version = "V4.0" converter.DocxOptions.ProgramName = "Green Development" converter.DocxOptions.Company = "New Technology" converter.DocxOptions.Manager = "Andy" # Save the PDF in DOCX format converter.SaveToDocx("C:/Users/Administrator/Desktop/SetProperties.docx")
Obtenez une licence gratuite pour la bibliothèque pour convertir des fichiers PDF
Vous pouvez obtenir un licence temporaire gratuite de 30 jours de Spire.PDF for Python pour utiliser le script Python pour convertir un PDF en Word sans aucune limitation d'évaluation.
Conclusion
Dans cet article, vous avez appris à convertir facilement un PDF en Word avec Python. Avec la bibliothèque Spire.PDF for Python , vous pouvez également créer un PDF à partir de zéro ou le modifier selon vos besoins. En bref, cette bibliothèque simplifie le processus et permet aux développeurs de se concentrer sur la création d'applications puissantes qui effectuent des tâches de manipulation de PDF.