Категория

C#/VB.NET: преобразование PDF в Word

2023-07-06 06:43:36

Формат PDF — лучший выбор во многих случаях, но Word более гибок, когда требуется редактирование или модификация. Файлы PDF обычно используются для обмена в Интернете, печати и архивирования, а документы Word используются для создания, редактирования и форматирования документов. Преобразование PDF в Word — хороший вариант, если вы хотите повторно отредактировать PDF-документ. В этой статье вы узнаете, как программно конвертировать PDF в Word на C# и VB.NET с использованием Spire.PDF for .NET.

Установите Spire.PDF for .NET

Для начала вам нужно добавить файлы DLL, включенные в пакет Spire.PDF for .NET, в качестве ссылок в ваш проект .NET. Файлы DLL можно загрузить с эта ссылка или установить через NuGet..

PM>Установка-Пакет Spire.PDF

Жизненный опыт

Spire.PDF for .NET предоставляет два режима преобразования. Преимущества и недостатки этих двух режимов заключаются в следующем:

  • Режим фиксированного макета: Режим фиксированной компоновки имеет высокую скорость преобразования и в наибольшей степени способствует сохранению исходного вида PDF-файлов. Однако возможность редактирования полученного документа будет ограничена, поскольку каждая строка текста в формате PDF будет представлена в отдельном фрейме в сгенерированном документе Word.
  • Режим распознавания потока: Режим распознавания потока — это режим полного распознавания. Преобразованный контент не будет представлен во фреймах, а структура результирующего документа будет плавной. Сгенерированный документ Word легко редактируется, но он может отличаться от исходного PDF-файла.

Преобразование PDF в Doc/Docx с фиксированным макетом в C#, VB.NET

По умолчаниюPdfDcoument.SaveToFile() method will convert PDF to Word with fixed layout. The following are the detailed steps.

  • Создайте объект PdfDocument.
  • Загрузите файл PDF с помощью метода PdfDocument.LoadFromFile().
  • Преобразуйте документ PDF в файл формата Doc или Docx, используя метод PdfDocument.SaveToFile(String fileName, FileFormat fileFormat).
  • C#
  • VB.NET
using Spire.Pdf;
    
    namespace ConvertPdfToFixedLayoutWord
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF document
                doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\sample.pdf");
    
                //Convert PDF to Doc and save it to a specified path
                doc.SaveToFile("output/ToDoc.doc", FileFormat.DOC);
    
                //Convert PDF to Docx and save it to a specified path
                doc.SaveToFile("output/ToDocx.docx", FileFormat.DOCX);
                doc.Close();
            }
        }
    }

C#/VB.NET: Convert PDF to Word

Преобразование PDF в Doc/Docx с гибкой структурой на C#, VB.NET

В дополнение к механизму преобразования по умолчанию Spire.PDF для .NET предоставляет другой механизм, называемый режимом Ps, который лучше работает с режимом распознавания потока. Чтобы включить механизм преобразования Ps и режим потокового распознавания, передайте (true, true) в качестве параметров метода PdfDocument.ConvertOptions.SetPdfToDocOptions(bool usePsMode, bool useFlowRecognitionMode). Все шаги следующие.

  • Создайте объект PdfDocument.
  • Загрузите файл PDF с помощью метода PdfDocument.loadFromFile().
  • Включите механизм преобразования Ps и режим распознавания потока с помощью метода PdfDocument.ConvertOptions.SetPdfToDocOptions(true, true).
  • Преобразуйте документ PDF в файл формата Doc или Docx, используя метод PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    
    namespace ConvertPdfToFlexibleLayoutWord
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF document
                doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\sample.pdf");
    
                //Specify the PDF to Word conversion options
                doc.ConvertOptions.SetPdfToDocOptions(true, true);
    
                //Convert PDF to Doc
                doc.SaveToFile("output/ToDoc.doc", FileFormat.DOC);
    
                //Convert PDF to Docx
                doc.SaveToFile("output/ToDocx.docx", FileFormat.DOCX);
                doc.Close();
            }
        }
    }

C#/VB.NET: Convert PDF to Word

Подать заявку на временную лицензию

Если вы хотите удалить оценочное сообщение из сгенерированных документов или избавиться от функциональных ограничений, запросите для себя 30-дневную пробную лицензию.

Смотрите также