Категория

Как конвертировать PDF в Word на Python

2024-01-25 06:18:44

Основным преимуществом файлов PDF является их способность всегда сохранять формат и макет исходного документа, что делает их идеальными для совместного использования и печати. Однако их часто сложно редактировать или модифицировать без специального программного обеспечения. В этом случае преобразование PDF в Word обеспечивает большую гибкость. С помощью этого преобразования вы можете легко вносить различные изменения в содержимое документа, например изменять текст, добавлять или удалять текст, а также настраивать форматирование и стили в соответствии с вашими потребностями. В этой статье я покажу вам простой, но эффективный способ конвертировать PDF в Word через Python.

Библиотека Python для преобразования PDF

Spire.PDF for Python — это мощный API для работы с PDF-файлами, который позволяет создавать, изменять или конвертировать PDF-файлы на платформах Python. С его помощью вы можете использовать код Python для легкого преобразования PDF в Word и устанавливать свойства документа во время преобразования. Перед этим установите Spire.PDF for Python и Plum-Dispatch v1.7.4 используя следующие команды pip.

pip install Spire.PDF

В этой статье описывается более подробная информация об установке: Как установить Spire.PDF for Python в VS Code.

Конвертировать PDF в DOC в Python

Если вы хотите отредактировать содержимое PDF-файла, сначала следует преобразовать его в формат Word. В качестве примера возьмем преобразование PDF в DOC. Вам нужно всего лишь загрузить PDF-файл и сохранить его в формате DOC в нужное место.

Шаги

  1. Импортируйте необходимые библиотечные модули.
  2. Создайте объект PDFDocument.
  3. Используйте метод PdfDocument.LoadFromFile(), чтобы загрузить PDF-файл по указанному пути.
  4. Вызовите метод PdfDocument.SaveToFile(), чтобы сохранить PDF-файл в формате Word, указав FileFormat как DOC.
  5. Закройте объект PDFDocument.

Образец кода

  • Python
from spire.pdf.common import *
    from spire.pdf import *
    
    # Create a PdfDocument object
    pdf = PdfDocument()
    
    # Load a PDF file from the specified path
    pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf")
    
    # Save the PDF in DOC format
    pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDoc.doc", FileFormat.DOC)
    
    # Close the PdfDocument object
    pdf.Close()

How to Convert PDF to Word in Python

Конвертируйте PDF в DOCX в Python

Этот метод аналогичен предыдущему. Вам нужно только указать формат DOCX при сохранении сгенерированного файла в конце.

Шаги

  1. Импортируйте необходимые библиотечные модули.
  2. Создайте объект PDFDocument.
  3. Используйте метод PdfDocument.LoadFromFile(), чтобы загрузить PDF-файл по указанному пути.
  4. Вызовите метод PdfDocument.SaveToFile(), чтобы сохранить PDF-файл в формате Word, указав FileFormat как DOCX.
  5. Закройте объект PDFDocument.

Образец кода

  • Python
from spire.pdf.common import *
    from spire.pdf import *
    
    # Create a PdfDocument object
    pdf = PdfDocument()
    
    # Load a PDF file from the specified path
    pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf")
    
    # Save the PDF in DOCX format
    pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDocx.docx", FileFormat.DOCX)
    
    # Close the PdfDocument object
    pdf.Close()

How to Convert PDF to Word in Python

Установите свойства документа при преобразовании в Python

Помимо обычных преобразований, вы также можете настроить свойства документа во время преобразования PDF в Word. Это поможет вам лучше классифицировать документы и управлять ими.

Шаги

  1. Импортируйте необходимые библиотечные модули.
  2. Создайте объект PdfToDocConverter и передайте путь к PDF-файлу, который нужно преобразовать, в качестве параметра.
  3. Настройте свойства преобразованного документа Word с помощью свойств класса PdfToDocConverter.
  4. Вызовите метод PdfToDocConverter.SaveToDocx(), чтобы сохранить PDF-файл в формате Word.

Образец кода

  • Python
from spire.pdf.common import *
    from spire.pdf import *
    
    # Create a PdfToDocConverter object
    converter = PdfToDocConverter("C:/Users/Administrator/Desktop/Sample.pdf")
    
    # Customize the properties for the file
    converter.DocxOptions.Title = "World Environment Day"
    converter.DocxOptions.Subject = "Promoting Sustainable Actions for a Greener Future."
    converter.DocxOptions.Tags = "Environmental Protection"
    converter.DocxOptions.Categories = "Environment"
    converter.DocxOptions.Commments = "This is an article about environmental protection."
    converter.DocxOptions.Authors = "Mark"
    converter.DocxOptions.LastSavedBy = "Johnny"
    converter.DocxOptions.Revision = 5
    converter.DocxOptions.Version = "V4.0"
    converter.DocxOptions.ProgramName = "Green Development"
    converter.DocxOptions.Company = "New Technology"
    converter.DocxOptions.Manager = "Andy"
    
    # Save the PDF in DOCX format
    converter.SaveToDocx("C:/Users/Administrator/Desktop/SetProperties.docx")

How to Convert PDF to Word in Python

Получите бесплатную лицензию на библиотеку для конвертации PDF-файлов

Вы можете получить бесплатная 30-дневная временная лицензия Spire.PDF for Python, чтобы использовать скрипт Python для преобразования PDF в Word без каких-либо ограничений оценки.

Заключение

В этой статье вы узнали, как легко конвертировать PDF в Word с помощью Python. С помощью библиотеки Spire.PDF for Python вы также можете создавать PDF-файлы с нуля или редактировать их по мере необходимости. Короче говоря, эта библиотека упрощает процесс и позволяет разработчикам сосредоточиться на создании мощных приложений, выполняющих задачи по манипулированию PDF-файлами.

Смотрите также