Como converter PDF para Word em Python

2024-01-25 06:19:51

A principal vantagem dos arquivos PDF é a capacidade de manter sempre o formato e o layout do documento original, o que os torna ideais para compartilhamento e impressão. No entanto, muitas vezes são difíceis de editar ou modificar sem software especializado. Nesse caso, a conversão de PDF em Word oferece maior flexibilidade. Com esta conversão, você pode facilmente fazer várias alterações no conteúdo do documento, como modificar o texto, adicionar ou excluir texto e ajustar a formatação e os estilos para atender às suas necessidades. Neste artigo, mostrarei uma maneira simples, mas eficaz de converter PDF para Word via Python.

Biblioteca Python para conversão de PDF

Spire.PDF for Python é uma poderosa API de manipulação de PDF que permite criar, modificar ou converter arquivos PDF em plataformas Python. Com ele, você pode usar o código Python para converter PDF em Word sem esforço e definir as propriedades do documento durante a conversão. Antes disso, instale o Spire.PDF for Python e plum-dispatch v1.7.4 usando os seguintes comandos pip.

pip install Spire.PDF

Este artigo cobre mais detalhes da instalação: Como instalar o Spire.PDF for Python no VS Code

Converter PDF em DOC em Python

Se você deseja editar o conteúdo de um PDF, convertê-lo primeiro para o formato Word é uma boa escolha. Veja a conversão de PDF para DOC como exemplo. Você só precisa carregar o PDF e salvá-lo em formato DOC no local desejado.

Passos

  1. Importe os módulos de biblioteca necessários.
  2. Crie um objeto PdfDocument.
  3. Use o método PdfDocument.LoadFromFile() para carregar um arquivo PDF do caminho especificado.
  4. Chame o método PdfDocument.SaveToFile() para salvar o PDF no formato Word, especificando FileFormat como DOC.
  5. Feche o objeto PdfDocument.

Código de amostra

  • Python
from spire.pdf.common import *
    from spire.pdf import *
    
    # Create a PdfDocument object
    pdf = PdfDocument()
    
    # Load a PDF file from the specified path
    pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf")
    
    # Save the PDF in DOC format
    pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDoc.doc", FileFormat.DOC)
    
    # Close the PdfDocument object
    pdf.Close()

How to Convert PDF to Word in Python

Converter PDF em DOCX em Python

Este método é igual ao anterior. Você só precisa especificar o formato como DOCX ao salvar o arquivo gerado no final.

Passos

  1. Importe os módulos de biblioteca necessários.
  2. Crie um objeto PdfDocument.
  3. Use o método PdfDocument.LoadFromFile() para carregar um arquivo PDF do caminho especificado.
  4. Chame o método PdfDocument.SaveToFile() para salvar o PDF no formato Word, especificando FileFormat como DOCX.
  5. Feche o objeto PdfDocument.

Código de amostra

  • Python
from spire.pdf.common import *
    from spire.pdf import *
    
    # Create a PdfDocument object
    pdf = PdfDocument()
    
    # Load a PDF file from the specified path
    pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf")
    
    # Save the PDF in DOCX format
    pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDocx.docx", FileFormat.DOCX)
    
    # Close the PdfDocument object
    pdf.Close()

How to Convert PDF to Word in Python

Definir propriedades do documento na conversão em Python

Além das conversões regulares, você também pode personalizar as propriedades do documento durante a conversão de PDF para Word. Isso pode ajudá-lo a categorizar e gerenciar melhor seus documentos.

Passos

  1. Importe os módulos de biblioteca necessários.
  2. Crie um objeto PdfToDocConverter e passe como parâmetro o caminho do arquivo PDF a ser convertido.
  3. Personalize as propriedades do documento Word convertido por meio das propriedades da classe PdfToDocConverter.
  4. Chame o método PdfToDocConverter.SaveToDocx() para salvar o PDF no formato Word.

Código de amostra

  • Python
from spire.pdf.common import *
    from spire.pdf import *
    
    # Create a PdfToDocConverter object
    converter = PdfToDocConverter("C:/Users/Administrator/Desktop/Sample.pdf")
    
    # Customize the properties for the file
    converter.DocxOptions.Title = "World Environment Day"
    converter.DocxOptions.Subject = "Promoting Sustainable Actions for a Greener Future."
    converter.DocxOptions.Tags = "Environmental Protection"
    converter.DocxOptions.Categories = "Environment"
    converter.DocxOptions.Commments = "This is an article about environmental protection."
    converter.DocxOptions.Authors = "Mark"
    converter.DocxOptions.LastSavedBy = "Johnny"
    converter.DocxOptions.Revision = 5
    converter.DocxOptions.Version = "V4.0"
    converter.DocxOptions.ProgramName = "Green Development"
    converter.DocxOptions.Company = "New Technology"
    converter.DocxOptions.Manager = "Andy"
    
    # Save the PDF in DOCX format
    converter.SaveToDocx("C:/Users/Administrator/Desktop/SetProperties.docx")

How to Convert PDF to Word in Python

Obtenha uma licença gratuita da biblioteca para converter arquivos PDF

Você pode obter um licença temporária gratuita de 30 dias do Spire.PDF for Python para usar o script Python para converter PDF em Word sem qualquer limitação de avaliação.

Conclusão

Neste artigo, você aprendeu como converter facilmente PDF em Word com Python. Com a biblioteca Spire.PDF for Python , você também pode criar PDF do zero ou editá-lo conforme necessário. Resumindo, esta biblioteca simplifica o processo e permite que os desenvolvedores se concentrem na criação de aplicativos poderosos que executam tarefas de manipulação de PDF.

Veja também