Категория

Python: конвертировать Word в PDF

2023-12-18 02:31:08

В настоящее время цифровые документы играют значительную роль в нашей повседневной жизни, как в личной, так и в профессиональной среде. Одним из таких распространенных форматов является Microsoft Word, используемый для создания и редактирования текстовых документов. Однако может наступить момент, когда вам понадобится преобразовать файлы Word в более универсальный формат, например PDF. PDF-файлы обладают такими преимуществами, как сохранение форматирования, обеспечение совместимости и сохранение целостности документа на разных устройствах и в операционных системах. В этой статье вы узнаете, как конвертировать Word в PDF на Python использование Spire.Doc for Python.

Установите Spire.Doc for Python

Для этого сценария требуется Spire.Doc for Python и Plum-Dispatch v1.7.4. Их можно легко установить в ваш VS Code с помощью следующей команды pip.

pip install Spire.Doc

Если вы не знаете, как установить, обратитесь к этому руководству: Как установить Spire.Doc for Python в VS Code.

Конвертируйте Doc или Docx в PDF в Python

Spire.Doc for Python предлагает метод Document.SaveToFile(string fileName, FileFormat fileFormat), который позволяет сохранять Word в формате PDF, XPS, HTML, RTF и т. д. Если вы просто хотите сохранить документы Word как обычные PDF-файлы без дополнительных настроек, выполните следующие действия.

  • Создайте объект Документ.
  • Загрузите образец документа Word, используя метод Document.LoadFromFile().
  • Сохраните документ в PDF с помощью метода Doucment.SaveToFile().
  • Python
from spire.doc import *
from spire.doc.common import *

# Create word document
document = Document()

# Load a doc or docx file
document.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.docx")

#Save the document to PDF
document.SaveToFile("output/ToPDF.pdf", FileFormat.PDF)
document.Close()

Python: Convert Word to PDF

Преобразование Word в PDF-файл, защищенный паролем, в Python

Чтобы преобразовать Word в PDF-файл, защищенный паролем, вы можете использовать метод Document.SaveToFile(string fileName, ToPdfParameterList paramList), где параметр ToPdfParameterList позволяет вам управлять процессом преобразования документа Word в формат PDF. Сюда входят такие параметры, как шифрование документа во время преобразования. Вот конкретные шаги для выполнения этой задачи.

  • Создайте объект Документ.
  • Загрузите образец документа Word, используя метод Document.LoadFromFile().
  • Создайте объект ToPdfParameterList, который используется для установки параметров преобразования.
  • Укажите открытый пароль и пароль разрешения, а затем установите оба пароля для созданного PDF-файла с помощью метода ToPdfParameterList.PdfSecurity.Encrypt().
  • Сохраните документ Word в PDF с паролем, используя метод Doucment.SaveToFile(string fileName, ToPdfParameterList paramList).
  • Python
from spire.doc import *
from spire.doc.common import *

# Create a Document object
document = Document()

# Load a Word file
document.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.docx")

# Create a ToPdfParameterList object
parameter = ToPdfParameterList()

# Specify open password and permission password
openPsd = "abc-123"
permissionPsd = "permission"

# Protect the PDF to be generated with open password and permission password
parameter.PdfSecurity.Encrypt(openPsd, permissionPsd, PdfPermissionsFlags.Default, PdfEncryptionKeySize.Key128Bit)

# Save the Word document to PDF
document.SaveToFile("output/ToPdfWithPassword.pdf", parameter)
document.Close()

Python: Convert Word to PDF

Преобразование Word в PDF с закладками в Python

Добавление закладок в документ может улучшить его читабельность. При создании PDF-файла из Word вы можете сохранить существующие закладки или создать новые на основе заголовков. Вот шаги по преобразованию Word в PDF с сохранением закладок.

  • Создайте объект Документ.
  • Загрузите файл Word с помощью метода Document.LoadFromFile().
  • Создайте объект ToPdfParameterList, который используется для установки параметров преобразования.
  • Создайте закладки в PDF-файле из заголовков в Word, установив для ToPdfParameterList.CreateWordBookmarksUsingHeadings значение true.
  • Сохраните документ в PDF с закладками, используя метод Doucment.SaveToFile(string fileName, ToPdfParameterList paramList).
  • Python
from spire.doc import *
from spire.doc.common import *

# Create a Document object
document = Document()

# Load a Word file
document.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.docx")

# Create a ToPdfParameterList object
parames = ToPdfParameterList()

# Create bookmarks from Word headings
parames.CreateWordBookmarksUsingHeadings = True

# Create bookmarks in PDF from existing bookmarks in Word
# parames.CreateWordBookmarks = True

# Save the document to PDF
document.SaveToFile("output/ToPdfWithBookmarks.pdf", FileFormat.PDF)
document.Close()

Python: Convert Word to PDF

Преобразование Word в PDF с помощью шрифтов, встроенных в Python

Чтобы обеспечить единообразный вид PDF-документа на любом устройстве, вам, вероятно, потребуется встроить шрифты в созданный PDF-документ. Ниже приведены шаги по встраиванию шрифтов, используемых в документе Word, в полученный PDF-файл.

  • Создайте объект Документ.
  • Загрузите образец файла Word, используя метод Document.LoadFromFile().
  • Создайте объект ToPdfParameterList, который используется для установки параметров преобразования.
  • Встраивайте шрифты в созданный PDF-файл с помощью свойства ToPdfParameterList.IsEmbeddedAllFonts.
  • Сохраните документ в PDF с помощью метода Doucment.SaveToFile(string fileName, ToPdfParameterList paramList).
  • Python
from spire.doc import *
from spire.doc.common import *

# Create a Document object
document = Document()

# Load a Word file
document.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.docx")

# Create a ToPdfParameterList object
parameter = ToPdfParameterList()

# Embed fonts in PDF
parameter.IsEmbeddedAllFonts = True

# Save the Word document to PDF
document.SaveToFile("output/EmbedFonts.pdf", parameter)
document.Close()

Python: Convert Word to PDF

Установите качество изображения при преобразовании Word в PDF в Python

При преобразовании документа Word в PDF важно учитывать размер полученного файла, особенно если он содержит множество изображений высокого качества. У вас есть возможность сжать качество изображения в процессе преобразования. Для этого выполните следующие действия.

  • Создайте объект Документ.
  • Загрузите образец файла Word, используя метод Document.LoadFromFile().
  • Установите качество изображения через свойство Document.JPEGQuality.
  • Сохраните документ в PDF с помощью метода Doucment.SaveToFile().
  • Python
from spire.doc import *
from spire.doc.common import *

# Create a Document object
document = Document()

# Load a Word file
document.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.docx")

# Compress image to 40% of its original quality
document.JPEGQuality = 40

# Preserve original image quality
# document.JPEGQuality = 100

# Save the Word document to PDF
document.SaveToFile("output/SetImageQuality.pdf", FileFormat.PDF)
document.Close()

Подать заявку на временную лицензию

Если вы хотите удалить сообщение об оценке из сгенерированных документов или избавиться от ограничений функции, пожалуйста запросите 30-дневную пробную лицензию для себя.

Смотрите также