Cómo convertir PDF a Word en Python

2024-01-25 06:15:15

La principal ventaja de los archivos PDF es su capacidad de mantener siempre el formato y diseño del documento original, lo que los hace ideales para compartir e imprimir. Sin embargo, suelen ser difíciles de editar o modificar sin un software especializado. En este caso, convertir PDF a Word le brinda mayor flexibilidad. Con esta conversión, puede realizar fácilmente varios cambios en el contenido del documento, como modificar el texto, agregar o eliminar texto y ajustar el formato y los estilos para que satisfaga sus necesidades. En este artículo, le mostraré una manera simple pero efectiva de convertir PDF a Word a través de Python.

Biblioteca Python para conversión de PDF

Spire.PDF for Python es una poderosa API de manipulación de PDF que le permite crear, modificar o convertir archivos PDF en plataformas Python. Con él, puedes utilizar el código Python para convertir PDF a Word sin esfuerzo y establecer las propiedades del documento durante la conversión. Antes de eso, instale Spire.PDF for Python y plum-dispatch v1.7.4 usando los siguientes comandos pip.

pip install Spire.PDF

Este artículo cubre más detalles de la instalación: Cómo instalar Spire.PDF for Python en VS Code

Convertir PDF a DOC en Python

Si desea editar el contenido del PDF, convertirlo primero al formato Word es una buena opción. Tome la conversión de PDF a DOC como ejemplo. Sólo necesita cargar el PDF y guardarlo en formato DOC en la ubicación deseada.

Pasos

  1. Importe los módulos de biblioteca necesarios.
  2. Cree un objeto PdfDocument.
  3. Utilice el método PdfDocument.LoadFromFile() para cargar un archivo PDF desde la ruta especificada.
  4. Llame al método PdfDocument.SaveToFile() para guardar el PDF en formato Word, especificando FileFormat como DOC.
  5. Cierre el objeto PdfDocument.

Código de muestra

  • Python
from spire.pdf.common import *
    from spire.pdf import *
    
    # Create a PdfDocument object
    pdf = PdfDocument()
    
    # Load a PDF file from the specified path
    pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf")
    
    # Save the PDF in DOC format
    pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDoc.doc", FileFormat.DOC)
    
    # Close the PdfDocument object
    pdf.Close()

How to Convert PDF to Word in Python

Convertir PDF a DOCX en Python

Este método es el mismo que el anterior. Solo necesita especificar el formato DOCX al guardar el archivo generado al final.

Pasos

  1. Importe los módulos de biblioteca necesarios.
  2. Cree un objeto PdfDocument.
  3. Utilice el método PdfDocument.LoadFromFile() para cargar un archivo PDF desde la ruta especificada.
  4. Llame al método PdfDocument.SaveToFile() para guardar el PDF en formato Word, especificando FileFormat como DOCX.
  5. Cierre el objeto PdfDocument.

Código de muestra

  • Python
from spire.pdf.common import *
    from spire.pdf import *
    
    # Create a PdfDocument object
    pdf = PdfDocument()
    
    # Load a PDF file from the specified path
    pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf")
    
    # Save the PDF in DOCX format
    pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDocx.docx", FileFormat.DOCX)
    
    # Close the PdfDocument object
    pdf.Close()

How to Convert PDF to Word in Python

Establecer propiedades del documento en la conversión en Python

Además de las conversiones habituales, también puedes personalizar las propiedades del documento durante la conversión de PDF a Word. Esto puede ayudarle a categorizar y administrar mejor sus documentos.

Pasos

  1. Importe los módulos de biblioteca necesarios.
  2. Create a PdfToDocConverter object and pass in the path of the PDF file to be converted as a parameter.
  3. Personalice las propiedades del documento de Word convertido a través de las propiedades de la clase PdfToDocConverter.
  4. Llame al método PdfToDocConverter.SaveToDocx() para guardar el PDF en formato Word.

Código de muestra

  • Python
from spire.pdf.common import *
    from spire.pdf import *
    
    # Create a PdfToDocConverter object
    converter = PdfToDocConverter("C:/Users/Administrator/Desktop/Sample.pdf")
    
    # Customize the properties for the file
    converter.DocxOptions.Title = "World Environment Day"
    converter.DocxOptions.Subject = "Promoting Sustainable Actions for a Greener Future."
    converter.DocxOptions.Tags = "Environmental Protection"
    converter.DocxOptions.Categories = "Environment"
    converter.DocxOptions.Commments = "This is an article about environmental protection."
    converter.DocxOptions.Authors = "Mark"
    converter.DocxOptions.LastSavedBy = "Johnny"
    converter.DocxOptions.Revision = 5
    converter.DocxOptions.Version = "V4.0"
    converter.DocxOptions.ProgramName = "Green Development"
    converter.DocxOptions.Company = "New Technology"
    converter.DocxOptions.Manager = "Andy"
    
    # Save the PDF in DOCX format
    converter.SaveToDocx("C:/Users/Administrator/Desktop/SetProperties.docx")

How to Convert PDF to Word in Python

Obtenga una licencia gratuita para que la biblioteca convierta archivos PDF

Puedes conseguir un licencia temporal gratuita de 30 días de Spire.PDF for Python para utilizar el script Python para convertir PDF a Word sin ninguna limitación de evaluación.

Conclusión

En este artículo, has aprendido cómo convertir PDF a Word con Python fácilmente. Con la biblioteca Spire.PDF for Python , también puedes crear PDF desde cero o editarlo según sea necesario. En resumen, esta biblioteca simplifica el proceso y permite a los desarrolladores centrarse en crear aplicaciones potentes que realicen tareas de manipulación de PDF.

Ver también