Índice
Instalar com Pip
pip install Spire.PDF
Links Relacionados
A principal vantagem dos arquivos PDF é a capacidade de manter sempre o formato e o layout do documento original, o que os torna ideais para compartilhamento e impressão. No entanto, muitas vezes são difíceis de editar ou modificar sem software especializado. Nesse caso, a conversão de PDF em Word oferece maior flexibilidade. Com esta conversão, você pode facilmente fazer várias alterações no conteúdo do documento, como modificar o texto, adicionar ou excluir texto e ajustar a formatação e os estilos para atender às suas necessidades. Neste artigo, mostrarei uma maneira simples, mas eficaz de converter PDF para Word via Python.
- Biblioteca Python para conversão de PDF
- Converter PDF em DOC
- Converter PDF em DOCX
- Definir propriedades do documento na conversão
- Obtenha uma licença gratuita para a biblioteca
Biblioteca Python para conversão de PDF
Spire.PDF for Python é uma poderosa API de manipulação de PDF que permite criar, modificar ou converter arquivos PDF em plataformas Python. Com ele, você pode usar o código Python para converter PDF em Word sem esforço e definir as propriedades do documento durante a conversão. Antes disso, instale o Spire.PDF for Python e plum-dispatch v1.7.4 usando os seguintes comandos pip.
pip install Spire.PDF
Este artigo cobre mais detalhes da instalação: Como instalar o Spire.PDF for Python no VS Code
Converter PDF em DOC em Python
Se você deseja editar o conteúdo de um PDF, convertê-lo primeiro para o formato Word é uma boa escolha. Veja a conversão de PDF para DOC como exemplo. Você só precisa carregar o PDF e salvá-lo em formato DOC no local desejado.
Passos
- Importe os módulos de biblioteca necessários.
- Crie um objeto PdfDocument.
- Use o método PdfDocument.LoadFromFile() para carregar um arquivo PDF do caminho especificado.
- Chame o método PdfDocument.SaveToFile() para salvar o PDF no formato Word, especificando FileFormat como DOC.
- Feche o objeto PdfDocument.
Código de amostra
- Python
from spire.pdf.common import * from spire.pdf import * # Create a PdfDocument object pdf = PdfDocument() # Load a PDF file from the specified path pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf") # Save the PDF in DOC format pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDoc.doc", FileFormat.DOC) # Close the PdfDocument object pdf.Close()
Converter PDF em DOCX em Python
Este método é igual ao anterior. Você só precisa especificar o formato como DOCX ao salvar o arquivo gerado no final.
Passos
- Importe os módulos de biblioteca necessários.
- Crie um objeto PdfDocument.
- Use o método PdfDocument.LoadFromFile() para carregar um arquivo PDF do caminho especificado.
- Chame o método PdfDocument.SaveToFile() para salvar o PDF no formato Word, especificando FileFormat como DOCX.
- Feche o objeto PdfDocument.
Código de amostra
- Python
from spire.pdf.common import * from spire.pdf import * # Create a PdfDocument object pdf = PdfDocument() # Load a PDF file from the specified path pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf") # Save the PDF in DOCX format pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDocx.docx", FileFormat.DOCX) # Close the PdfDocument object pdf.Close()
Definir propriedades do documento na conversão em Python
Além das conversões regulares, você também pode personalizar as propriedades do documento durante a conversão de PDF para Word. Isso pode ajudá-lo a categorizar e gerenciar melhor seus documentos.
Passos
- Importe os módulos de biblioteca necessários.
- Crie um objeto PdfToDocConverter e passe como parâmetro o caminho do arquivo PDF a ser convertido.
- Personalize as propriedades do documento Word convertido por meio das propriedades da classe PdfToDocConverter.
- Chame o método PdfToDocConverter.SaveToDocx() para salvar o PDF no formato Word.
Código de amostra
- Python
from spire.pdf.common import * from spire.pdf import * # Create a PdfToDocConverter object converter = PdfToDocConverter("C:/Users/Administrator/Desktop/Sample.pdf") # Customize the properties for the file converter.DocxOptions.Title = "World Environment Day" converter.DocxOptions.Subject = "Promoting Sustainable Actions for a Greener Future." converter.DocxOptions.Tags = "Environmental Protection" converter.DocxOptions.Categories = "Environment" converter.DocxOptions.Commments = "This is an article about environmental protection." converter.DocxOptions.Authors = "Mark" converter.DocxOptions.LastSavedBy = "Johnny" converter.DocxOptions.Revision = 5 converter.DocxOptions.Version = "V4.0" converter.DocxOptions.ProgramName = "Green Development" converter.DocxOptions.Company = "New Technology" converter.DocxOptions.Manager = "Andy" # Save the PDF in DOCX format converter.SaveToDocx("C:/Users/Administrator/Desktop/SetProperties.docx")
Obtenha uma licença gratuita da biblioteca para converter arquivos PDF
Você pode obter um licença temporária gratuita de 30 dias do Spire.PDF for Python para usar o script Python para converter PDF em Word sem qualquer limitação de avaliação.
Conclusão
Neste artigo, você aprendeu como converter facilmente PDF em Word com Python. Com a biblioteca Spire.PDF for Python , você também pode criar PDF do zero ou editá-lo conforme necessário. Resumindo, esta biblioteca simplifica o processo e permite que os desenvolvedores se concentrem na criação de aplicativos poderosos que executam tarefas de manipulação de PDF.