Wednesday, 30 August 2023 06:40

C#/VB.NET: extraer texto de documentos PDF

Instalado a través de NuGet

PM> Install-Package Spire.PDF

enlaces relacionados

Los documentos PDF tienen un diseño fijo y no permiten a los usuarios realizar modificaciones en ellos. Para volver a editar el contenido del PDF, puede convertir PDF a Word o extraer texto de PDF. En este artículo, aprenderá cómo extraer texto de una página PDF específica, cómo extraer texto de un área rectangular particular, y cómo extraiga texto mediante SimpleTextExtractionStrategy en C# y VB.NET usando Spire.PDF for .NET.

Instalar Spire.PDF for .NET

Para empezar, debe agregar los archivos DLL incluidos en el paquete Spire.PDF for .NET como referencias en su proyecto .NET. Los archivos DLL se pueden descargar desde este enlace o instalar a través de NuGet.

PM> Install-Package Spire.PDF

Extraer texto de una página especificada

Los siguientes son los pasos para extraer texto de una determinada página de un documento PDF usando Spire.PDF for .NET.

  • Cree un objeto PdfDocument.
  • Cargue un archivo PDF utilizando el método PdfDocument.LoadFromFile().
  • Obtenga la página específica a través de la propiedad PdfDocument.Pages[index].
  • Cree un objeto PdfTextExtractor.
  • Cree un objeto PdfTextExtractOptions y establezca la propiedad IsExtractAllText en verdadero.
  • Extraiga texto de la página seleccionada utilizando el método PdfTextExtractor.ExtractText().
  • Escriba el texto extraído en un archivo TXT.
  • C#
  • VB.NET
using System;
    using System.IO;
    using Spire.Pdf;
    using Spire.Pdf.Texts;
    
    namespace ExtractTextFromPage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF file
                doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Terms of Service.pdf");
    
                //Get the second page
                PdfPageBase page = doc.Pages[1];
    
                //Create a PdfTextExtractot object
                PdfTextExtractor textExtractor = new PdfTextExtractor(page);
    
                //Create a PdfTextExtractOptions object
                PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
    
                //Set isExtractAllText to true
                extractOptions.IsExtractAllText = true;
    
                //Extract text from the page
                string text = textExtractor.ExtractText(extractOptions);
    
                //Write to a txt file
                File.WriteAllText("Extracted.txt", text);
            }
        }
    }

C#/VB.NET: Extract Text from PDF Documents

Extraer texto de un rectángulo

Los siguientes son los pasos para extraer texto de un área rectangular de una página usando Spire.PDF for .NET.

  • Cree un objeto PdfDocument.
  • Cargue un archivo PDF utilizando el método PdfDocument.LoadFromFile().
  • Obtenga la página específica a través de la propiedad PdfDocument.Pages[index].
  • Cree un objeto PdfTextExtractor.
  • Cree un objeto PdfTextExtractOptions y especifique el área del rectángulo a través de la propiedad ExtractArea del mismo.
  • Extraiga texto del rectángulo utilizando el método PdfTextExtractor.ExtractText().
  • Escriba el texto extraído en un archivo TXT.
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Texts;
    using System.IO;
    using System.Drawing;
    
    namespace ExtractTextFromRectangleArea
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF file
                doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Terms of Service.pdf");
    
                //Get the second page
                PdfPageBase page = doc.Pages[1];
    
                //Create a PdfTextExtractot object
                PdfTextExtractor textExtractor = new PdfTextExtractor(page);
    
                //Create a PdfTextExtractOptions object
                PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
    
                //Set the rectangle area
                extractOptions.ExtractArea = new RectangleF(0, 0, 890, 170);
    
                //Extract text from the rectangle
                string text = textExtractor.ExtractText(extractOptions);
    
                //Write to a txt file
                File.WriteAllText("Extracted.txt", text);
            }
        }
    }

C#/VB.NET: Extract Text from PDF Documents

Extraer texto usando SimpleTextExtractionStrategy

Los métodos anteriores extraen texto línea por línea. Al extraer texto usando SimpleTextExtractionStrategy, realiza un seguimiento de la posición Y actual de cada cadena e inserta un salto de línea en la salida si la posición Y ha cambiado. Los siguientes son los pasos detallados.

  • Cree un objeto PdfDocument.
  • Cargue un archivo PDF utilizando el método PdfDocument.LoadFromFile().
  • Obtenga la página específica a través de la propiedad PdfDocument.Pages[index].
  • Cree un objeto PdfTextExtractor.
  • Cree un objeto PdfTextExtractOptions y establezca la propiedad IsSimpleExtraction en verdadero.
  • Extraiga texto de la página seleccionada utilizando el método PdfTextExtractor.ExtractText().
  • Escriba el texto extraído en un archivo TXT.
  • C#
  • VB.NET
using System.IO;
    using Spire.Pdf;
    using Spire.Pdf.Texts;
    
    namespace SimpleExtraction
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF file
                doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Invoice.pdf");
    
                //Get the first page
                PdfPageBase page = doc.Pages[0];
    
                //Create a PdfTextExtractor object
                PdfTextExtractor textExtractor = new PdfTextExtractor(page);
    
                //Create a PdfTextExtractOptions object
                PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
    
                //Set IsSimpleExtraction to true
                extractOptions.IsSimpleExtraction = true;
    
                //Extract text from the selected page
                string text = textExtractor.ExtractText(extractOptions);
    
                //Write to a txt file
                File.WriteAllText("Extracted.txt", text);
            }
        }
    }

C#/VB.NET: Extract Text from PDF Documents

Solicitar una licencia temporal

Si desea eliminar el mensaje de evaluación de los documentos generados o deshacerse de las limitaciones de la función, por favor solicitar una licencia de prueba de 30 días para ti.

Ver también

Wednesday, 30 August 2023 06:39

C#/VB.NET: PDF 문서에서 텍스트 추출

PDF 문서는 레이아웃이 고정되어 있어 사용자가 수정할 수 없습니다. PDF 내용을 다시 편집 가능하게 만들려면 다음을 수행하십시오 PDF를 워드로 변환 또는 PDF에서 텍스트를 추출합니다. 이 기사에서는 다음 방법을 배웁니다 특정 PDF 페이지에서 텍스트를 추출하고, 어떻게 특정 직사각형 영역에서 텍스트를 추출하고, 그리고 어떻게 SimpleTextExtractionStrategy로 텍스트를 추출합니다 C# 및 VB.NET Spire.PDF for .NET사용합니다.

Spire.PDF for .NET 설치

먼저 Spire.PDF for.NET 패키지에 포함된 DLL 파일을 .NET 프로젝트의 참조로 추가해야 합니다. DLL 파일은 이 링크 에서 다운로드하거나 NuGet을 통해 설치할 수 있습니다.

PM> Install-Package Spire.PDF

지정된 페이지에서 텍스트 추출

다음은 Spire.PDF for.NET를 사용하여 PDF 문서의 특정 페이지에서 텍스트를 추출하는 단계입니다.

  • PdfDocument 개체를 만듭니다.
  • PdfDocument.LoadFromFile() 메서드를 사용하여 PDF 파일을 로드합니다.
  • PdfDocument.Pages[index] 속성을 통해 특정 페이지를 가져옵니다.
  • PdfTextExtractor 개체를 만듭니다.
  • PdfTextExtractOptions 개체를 만들고 IsExtractAllText 속성을 true로 설정합니다.
  • PdfTextExtractor.ExtractText() 메서드를 사용하여 선택한 페이지에서 텍스트를 추출합니다.
  • 추출된 텍스트를 TXT 파일에 씁니다.
  • C#
  • VB.NET
using System;
    using System.IO;
    using Spire.Pdf;
    using Spire.Pdf.Texts;
    
    namespace ExtractTextFromPage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF file
                doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Terms of Service.pdf");
    
                //Get the second page
                PdfPageBase page = doc.Pages[1];
    
                //Create a PdfTextExtractot object
                PdfTextExtractor textExtractor = new PdfTextExtractor(page);
    
                //Create a PdfTextExtractOptions object
                PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
    
                //Set isExtractAllText to true
                extractOptions.IsExtractAllText = true;
    
                //Extract text from the page
                string text = textExtractor.ExtractText(extractOptions);
    
                //Write to a txt file
                File.WriteAllText("Extracted.txt", text);
            }
        }
    }

C#/VB.NET: Extract Text from PDF Documents

직사각형에서 텍스트 추출

다음은 Spire.PDF for.NET를 사용하여 페이지의 직사각형 영역에서 텍스트를 추출하는 단계입니다.

  • PdfDocument 개체를 만듭니다.
  • PdfDocument.LoadFromFile() 메서드를 사용하여 PDF 파일을 로드합니다.
  • PdfDocument.Pages[index] 속성을 통해 특정 페이지를 가져옵니다.
  • PdfTextExtractor 개체를 만듭니다.
  • PdfTextExtractOptions 개체를 만들고 해당 개체의 ExtractArea 속성을 통해 사각형 영역을 지정합니다.
  • PdfTextExtractor.ExtractText() 메서드를 사용하여 사각형에서 텍스트를 추출합니다.
  • 추출된 텍스트를 TXT 파일에 씁니다.
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Texts;
    using System.IO;
    using System.Drawing;
    
    namespace ExtractTextFromRectangleArea
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF file
                doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Terms of Service.pdf");
    
                //Get the second page
                PdfPageBase page = doc.Pages[1];
    
                //Create a PdfTextExtractot object
                PdfTextExtractor textExtractor = new PdfTextExtractor(page);
    
                //Create a PdfTextExtractOptions object
                PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
    
                //Set the rectangle area
                extractOptions.ExtractArea = new RectangleF(0, 0, 890, 170);
    
                //Extract text from the rectangle
                string text = textExtractor.ExtractText(extractOptions);
    
                //Write to a txt file
                File.WriteAllText("Extracted.txt", text);
            }
        }
    }

C#/VB.NET: Extract Text from PDF Documents

SimpleTextExtractionStrategy를 사용하여 텍스트 추출

위의 방법은 텍스트를 한 줄씩 추출합니다. SimpleTextExtractionStrategy를 사용하여 텍스트를 추출할 때 각 문자열의 현재 Y 위치를 추적하고 Y 위치가 변경된 경우 출력에 줄 바꿈을 삽입합니다. 자세한 단계는 다음과 같습니다.

  • PdfDocument 개체를 만듭니다.
  • PdfDocument.LoadFromFile() 메서드를 사용하여 PDF 파일을 로드합니다.
  • PdfDocument.Pages[index] 속성을 통해 특정 페이지를 가져옵니다.
  • PdfTextExtractor 개체를 만듭니다.
  • PdfTextExtractOptions 개체를 만들고 IsSimpleExtraction 속성을 true로 설정합니다.
  • PdfTextExtractor.ExtractText() 메서드를 사용하여 선택한 페이지에서 텍스트를 추출합니다.
  • 추출된 텍스트를 TXT 파일에 씁니다.
  • C#
  • VB.NET
using System.IO;
    using Spire.Pdf;
    using Spire.Pdf.Texts;
    
    namespace SimpleExtraction
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF file
                doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Invoice.pdf");
    
                //Get the first page
                PdfPageBase page = doc.Pages[0];
    
                //Create a PdfTextExtractor object
                PdfTextExtractor textExtractor = new PdfTextExtractor(page);
    
                //Create a PdfTextExtractOptions object
                PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
    
                //Set IsSimpleExtraction to true
                extractOptions.IsSimpleExtraction = true;
    
                //Extract text from the selected page
                string text = textExtractor.ExtractText(extractOptions);
    
                //Write to a txt file
                File.WriteAllText("Extracted.txt", text);
            }
        }
    }

C#/VB.NET: Extract Text from PDF Documents

임시 라이센스 신청

생성된 문서에서 평가 메시지를 제거하고 싶거나, 기능 제한을 없애고 싶다면 30일 평가판 라이센스 요청 자신을 위해.

또한보십시오

Wednesday, 30 August 2023 06:38

C#/VB.NET: estrae testo da documenti PDF

I documenti PDF hanno un layout fisso e non consentono agli utenti di apportare modifiche al loro interno. Per rendere nuovamente modificabile il contenuto del PDF, puoi farlo convertire PDF in Word o estrarre testo da PDF. In questo articolo imparerai come farlo estrarre il testo da una pagina PDF specifica, come estrarre il testo da una particolare area rettangolare, e come farlo estrarre testo con SimpleTextExtractionStrategy in C# e VB.NET utilizzando Spire.PDF for .NET.

Installa Spire.PDF for .NET

Per cominciare, devi aggiungere i file DLL inclusi nel pacchetto Spire.PDF for.NET come riferimenti nel tuo progetto .NET. I file DLL possono essere scaricati da questo link o installato tramite NuGet.

PM> Install-Package Spire.PDF

Estrai testo da una pagina specificata

Di seguito sono riportati i passaggi per estrarre il testo da una determinata pagina di un documento PDF utilizzando Spire.PDF for .NET.

  • Crea un oggetto PdfDocument.
  • Carica un file PDF utilizzando il metodo PdfDocument.LoadFromFile().
  • Ottieni la pagina specifica tramite la proprietà PdfDocument.Pages[index].
  • Crea un oggetto PdfTextExtractor.
  • Crea un oggetto PdfTextExtractOptions e imposta la proprietà IsExtractAllText su true.
  • Estrai il testo dalla pagina selezionata utilizzando il metodo PdfTextExtractor.ExtractText().
  • Scrivi il testo estratto in un file TXT.
  • C#
  • VB.NET
using System;
    using System.IO;
    using Spire.Pdf;
    using Spire.Pdf.Texts;
    
    namespace ExtractTextFromPage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF file
                doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Terms of Service.pdf");
    
                //Get the second page
                PdfPageBase page = doc.Pages[1];
    
                //Create a PdfTextExtractot object
                PdfTextExtractor textExtractor = new PdfTextExtractor(page);
    
                //Create a PdfTextExtractOptions object
                PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
    
                //Set isExtractAllText to true
                extractOptions.IsExtractAllText = true;
    
                //Extract text from the page
                string text = textExtractor.ExtractText(extractOptions);
    
                //Write to a txt file
                File.WriteAllText("Extracted.txt", text);
            }
        }
    }

C#/VB.NET: Extract Text from PDF Documents

Estrai testo da un rettangolo

Di seguito sono riportati i passaggi per estrarre il testo da un'area rettangolare di una pagina utilizzando Spire.PDF for .NET.

  • Crea un oggetto PdfDocument.
  • Carica un file PDF utilizzando il metodo PdfDocument.LoadFromFile().
  • Ottieni la pagina specifica tramite la proprietà PdfDocument.Pages[index].
  • Crea un oggetto PdfTextExtractor.
  • Crea un oggetto PdfTextExtractOptions e specifica l'area del rettangolo tramite la sua proprietà ExtractArea.
  • Estrai il testo dal rettangolo utilizzando il metodo PdfTextExtractor.ExtractText().
  • Scrivi il testo estratto in un file TXT.
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Texts;
    using System.IO;
    using System.Drawing;
    
    namespace ExtractTextFromRectangleArea
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF file
                doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Terms of Service.pdf");
    
                //Get the second page
                PdfPageBase page = doc.Pages[1];
    
                //Create a PdfTextExtractot object
                PdfTextExtractor textExtractor = new PdfTextExtractor(page);
    
                //Create a PdfTextExtractOptions object
                PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
    
                //Set the rectangle area
                extractOptions.ExtractArea = new RectangleF(0, 0, 890, 170);
    
                //Extract text from the rectangle
                string text = textExtractor.ExtractText(extractOptions);
    
                //Write to a txt file
                File.WriteAllText("Extracted.txt", text);
            }
        }
    }

C#/VB.NET: Extract Text from PDF Documents

Estrai testo utilizzando SimpleTextExtractionStrategy

I metodi precedenti estraggono il testo riga per riga. Quando si estrae il testo utilizzando SimpleTextExtractionStrategy, tiene traccia della posizione Y corrente di ciascuna stringa e inserisce un'interruzione di riga nell'output se la posizione Y è cambiata. Di seguito sono riportati i passaggi dettagliati.

  • Crea un oggetto PdfDocument.
  • Carica un file PDF utilizzando il metodo PdfDocument.LoadFromFile().
  • Ottieni la pagina specifica tramite la proprietà PdfDocument.Pages[index].
  • Crea un oggetto PdfTextExtractor.
  • Crea un oggetto PdfTextExtractOptions e imposta la proprietà IsSimpleExtraction su true.
  • Estrai il testo dalla pagina selezionata utilizzando il metodo PdfTextExtractor.ExtractText().
  • Scrivi il testo estratto in un file TXT.
  • C#
  • VB.NET
using System.IO;
    using Spire.Pdf;
    using Spire.Pdf.Texts;
    
    namespace SimpleExtraction
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF file
                doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Invoice.pdf");
    
                //Get the first page
                PdfPageBase page = doc.Pages[0];
    
                //Create a PdfTextExtractor object
                PdfTextExtractor textExtractor = new PdfTextExtractor(page);
    
                //Create a PdfTextExtractOptions object
                PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
    
                //Set IsSimpleExtraction to true
                extractOptions.IsSimpleExtraction = true;
    
                //Extract text from the selected page
                string text = textExtractor.ExtractText(extractOptions);
    
                //Write to a txt file
                File.WriteAllText("Extracted.txt", text);
            }
        }
    }

C#/VB.NET: Extract Text from PDF Documents

Richiedi una licenza temporanea

Se desideri rimuovere il messaggio di valutazione dai documenti generati o eliminare le limitazioni della funzione, per favore richiedere una licenza di prova di 30 giorni per te.

Guarda anche

Les documents PDF ont une mise en page fixe et ne permettent pas aux utilisateurs d'y apporter des modifications. Pour rendre le contenu PDF à nouveau modifiable, vous pouvez convertir un PDF en Word ou extraire du texte d'un PDF. Dans cet article, vous apprendrez comment extraire le texte d'une page PDF spécifique, comment extraire le texte d'une zone de rectangle particulière, et comment extraire le texte par SimpleTextExtractionStrategy en C# et VB.NET l'aide de Spire.PDF for .NET.

Installer Spire.PDF for .NET

Pour commencer, vous devez ajouter les fichiers DLL inclus dans le package Spire.PDF for.NET comme références dans votre projet .NET. Les fichiers DLL peuvent être téléchargés à partir de ce lien ou installés via NuGet.

PM> Install-Package Spire.PDF

Extraire le texte d'une page spécifiée

Voici les étapes pour extraire le texte d'une certaine page d'un document PDF à l'aide de Spire.PDF for .NET.

  • Créez un objet PdfDocument.
  • Chargez un fichier PDF à l'aide de la méthode PdfDocument.LoadFromFile().
  • Obtenez la page spécifique via la propriété PdfDocument.Pages[index].
  • Créez un objet PdfTextExtractor.
  • Créez un objet PdfTextExtractOptions et définissez la propriété IsExtractAllText sur true.
  • Extrayez le texte de la page sélectionnée à l’aide de la méthode PdfTextExtractor.ExtractText().
  • Écrivez le texte extrait dans un fichier TXT.
  • C#
  • VB.NET
using System;
    using System.IO;
    using Spire.Pdf;
    using Spire.Pdf.Texts;
    
    namespace ExtractTextFromPage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF file
                doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Terms of Service.pdf");
    
                //Get the second page
                PdfPageBase page = doc.Pages[1];
    
                //Create a PdfTextExtractot object
                PdfTextExtractor textExtractor = new PdfTextExtractor(page);
    
                //Create a PdfTextExtractOptions object
                PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
    
                //Set isExtractAllText to true
                extractOptions.IsExtractAllText = true;
    
                //Extract text from the page
                string text = textExtractor.ExtractText(extractOptions);
    
                //Write to a txt file
                File.WriteAllText("Extracted.txt", text);
            }
        }
    }

C#/VB.NET: Extract Text from PDF Documents

Extraire le texte d'un rectangle

Voici les étapes pour extraire le texte d’une zone rectangulaire d’une page à l’aide de Spire.PDF for .NET.

  • Créez un objet PdfDocument.
  • Chargez un fichier PDF à l'aide de la méthode PdfDocument.LoadFromFile().
  • Obtenez la page spécifique via la propriété PdfDocument.Pages[index].
  • Créez un objet PdfTextExtractor.
  • Créez un objet PdfTextExtractOptions et spécifiez la zone rectangulaire via sa propriété ExtractArea.
  • Extrayez le texte du rectangle à l’aide de la méthode PdfTextExtractor.ExtractText().
  • Écrivez le texte extrait dans un fichier TXT.
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Texts;
    using System.IO;
    using System.Drawing;
    
    namespace ExtractTextFromRectangleArea
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF file
                doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Terms of Service.pdf");
    
                //Get the second page
                PdfPageBase page = doc.Pages[1];
    
                //Create a PdfTextExtractot object
                PdfTextExtractor textExtractor = new PdfTextExtractor(page);
    
                //Create a PdfTextExtractOptions object
                PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
    
                //Set the rectangle area
                extractOptions.ExtractArea = new RectangleF(0, 0, 890, 170);
    
                //Extract text from the rectangle
                string text = textExtractor.ExtractText(extractOptions);
    
                //Write to a txt file
                File.WriteAllText("Extracted.txt", text);
            }
        }
    }

C#/VB.NET: Extract Text from PDF Documents

Extraire du texte à l'aide de SimpleTextExtractionStrategy

Les méthodes ci-dessus extraient le texte ligne par ligne. Lors de l'extraction de texte à l'aide de SimpleTextExtractionStrategy, il garde une trace de la position Y actuelle de chaque chaîne et insère un saut de ligne dans la sortie si la position Y a changé. Voici les étapes détaillées.

  • Créez un objet PdfDocument.
  • Chargez un fichier PDF à l'aide de la méthode PdfDocument.LoadFromFile().
  • Obtenez la page spécifique via la propriété PdfDocument.Pages[index].
  • Créez un objet PdfTextExtractor.
  • Créez un objet PdfTextExtractOptions et définissez la propriété IsSimpleExtraction sur true.
  • Extrayez le texte de la page sélectionnée à l’aide de la méthode PdfTextExtractor.ExtractText().
  • Écrivez le texte extrait dans un fichier TXT.
  • C#
  • VB.NET
using System.IO;
    using Spire.Pdf;
    using Spire.Pdf.Texts;
    
    namespace SimpleExtraction
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument object
                PdfDocument doc = new PdfDocument();
    
                //Load a PDF file
                doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Invoice.pdf");
    
                //Get the first page
                PdfPageBase page = doc.Pages[0];
    
                //Create a PdfTextExtractor object
                PdfTextExtractor textExtractor = new PdfTextExtractor(page);
    
                //Create a PdfTextExtractOptions object
                PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
    
                //Set IsSimpleExtraction to true
                extractOptions.IsSimpleExtraction = true;
    
                //Extract text from the selected page
                string text = textExtractor.ExtractText(extractOptions);
    
                //Write to a txt file
                File.WriteAllText("Extracted.txt", text);
            }
        }
    }

C#/VB.NET: Extract Text from PDF Documents

Demander une licence temporaire

Si vous souhaitez supprimer le message d'évaluation des documents générés ou vous débarrasser des limitations fonctionnelles, veuillez demander une licence d'essai de 30 jours pour toi.

Voir également

Compared with text-only documents, documents containing images are undoubtedly more vivid and engaging to readers. When generating or editing a PDF document, you may sometimes need to insert images to improve its appearance and make it more appealing. In this article, you will learn how to insert, replace or delete images in PDF documents in C# and VB.NET using Spire.PDF for .NET.

Install Spire.PDF for .NET

To begin with, you need to add the DLL files included in the Spire.PDF for.NET package as references in your .NET project. The DLL files can be either downloaded from this link or installed via NuGet.

PM> Install-Package Spire.PDF

Insert an Image into a PDF Document in C# and VB.NET

The following steps demonstrate how to insert an image into an existing PDF document:

  • Initialize an instance of the PdfDocument class.
  • Load a PDF document using PdfDocument.LoadFromFile() method.
  • Get the desired page in the PDF document through PdfDocument.Pages[pageIndex] property.
  • Load an image using PdfImage.FromFile() method.
  • Specify the width and height of the image area on the page.
  • Specify the X and Y coordinates to start drawing the image.
  • Draw the image on the page using PdfPageBase.Canvas.DrawImage() method.
  • Save the result document using PdfDocument.SaveToFile() method.
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Graphics;
    
    namespace InsertImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument pdf = new PdfDocument();
                pdf.LoadFromFile("Input.pdf");
    
                //Get the first page in the PDF document
                PdfPageBase page = pdf.Pages[0];
    
                //Load an image
                PdfImage image = PdfImage.FromFile("image.jpg");
    
                //Specify the width and height of the image area on the page
                float width = image.Width * 0.50f;
                float height = image.Height * 0.50f;
    
                //Specify the X and Y coordinates to start drawing the image
                float x = 180f;
                float y = 70f;
    
                //Draw the image at a specified location on the page
                page.Canvas.DrawImage(image, x, y, width, height);
    
                //Save the result document
                pdf.SaveToFile("AddImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Replace an Image with Another Image in a PDF Document in C# and VB.NET

The following steps demonstrate how to replace an image with another image in a PDF document:

  • Initialize an instance of the PdfDocument class.
  • Load a PDF document using PdfDocument.LoadFromFile() method.
  • Get the desired page in the PDF document through PdfDocument.Pages[pageIndex] property.
  • Load an image using PdfImage.FromFile() method.
  • Initialize an instance of the PdfImageHelper class.
  • Get the image information from the page using PdfImageHelper.GetImagesInfo() method.
  • Replace a specific image on the page with the loaded image using PdfImageHelper.ReplaceImage() method.
  • Save the result document using PdfDocument.SaveToFile() method.
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Graphics;
    using Spire.Pdf.Utilities;
    
    namespace ReplaceImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument doc = new PdfDocument();
                //Load a PDF document
                doc.LoadFromFile("AddImage.pdf");
    
                //Get the first page
                PdfPageBase page = doc.Pages[0];
    
                //Load an image
                PdfImage image = PdfImage.FromFile("image1.jpg");
    
                //Create a PdfImageHelper instance
                PdfImageHelper imageHelper = new PdfImageHelper();
                //Get the image information from the page
                PdfImageInfo[] imageInfo = imageHelper.GetImagesInfo(page);
                //Replace the first image on the page with the loaded image
                imageHelper.ReplaceImage(imageInfo[0], image);
    
                //Save the result document
                doc.SaveToFile("ReplaceImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Delete a Specific Image in a PDF Document in C# and VB.NET

The following steps demonstrate how to delete an image from a PDF document:

  • Initialize an instance of the PdfDocument class.
  • Load a PDF document using PdfDocument.LoadFromFile() method.
  • Get the desired page in the PDF document through PdfDocument.Pages[pageIndex] property.
  • Delete a specific image on the page using PdfPageBase.DeleteImage() method.
  • Save the result document using PdfDocument.SaveToFile() method.
  • C#
  • VB.NET
using Spire.Pdf;
    
    namespace DeleteImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument pdf = new PdfDocument();
                //Load a PDF document
                pdf.LoadFromFile("AddImage.pdf");
    
                //Get the first page
                PdfPageBase page = pdf.Pages[0];
    
                //Delete the first image on the page
                page.DeleteImage(0);
    
                //Save the result document
                pdf.SaveToFile("DeleteImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Apply for a Temporary License

If you'd like to remove the evaluation message from the generated documents, or to get rid of the function limitations, please request a 30-day trial license for yourself.

See Also

Em comparação com documentos somente de texto, os documentos que contêm imagens são, sem dúvida, mais vívidos e atraentes para os leitores. Ao gerar ou editar um documento PDF, às vezes pode ser necessário inserir imagens para melhorar sua aparência e torná-lo mais atraente. Neste artigo, você aprenderá como inserir, substituir ou excluir imagens em documentos PDF em C# e VB.NET usando Spire.PDF for .NET.

Instale o Spire.PDF for .NET

Para começar, você precisa adicionar os arquivos DLL incluídos no pacote Spire.PDF for.NET como referências em seu projeto .NET. Os arquivos DLL podem ser baixados deste link ou instalados via NuGet.

PM> Install-Package Spire.PDF

Insira uma imagem em um documento PDF em C# e VB.NET

As etapas a seguir demonstram como inserir uma imagem em um documento PDF existente:

  • Inicialize uma instância da classe PdfDocument.
  • Carregue um documento PDF usando o método PdfDocument.LoadFromFile().
  • Obtenha a página desejada no documento PDF através da propriedade PdfDocument.Pages[pageIndex].
  • Carregue uma imagem usando o método PdfImage.FromFile().
  • Especifique a largura e a altura da área da imagem na página.
  • Especifique as coordenadas X e Y para começar a desenhar a imagem.
  • Desenhe a imagem na página usando o método PdfPageBase.Canvas.DrawImage().
  • Salve o documento resultante usando o método PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Graphics;
    
    namespace InsertImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument pdf = new PdfDocument();
                pdf.LoadFromFile("Input.pdf");
    
                //Get the first page in the PDF document
                PdfPageBase page = pdf.Pages[0];
    
                //Load an image
                PdfImage image = PdfImage.FromFile("image.jpg");
    
                //Specify the width and height of the image area on the page
                float width = image.Width * 0.50f;
                float height = image.Height * 0.50f;
    
                //Specify the X and Y coordinates to start drawing the image
                float x = 180f;
                float y = 70f;
    
                //Draw the image at a specified location on the page
                page.Canvas.DrawImage(image, x, y, width, height);
    
                //Save the result document
                pdf.SaveToFile("AddImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Substitua uma imagem por outra imagem em um documento PDF em C# e VB.NET

As etapas a seguir demonstram como substituir uma imagem por outra imagem em um documento PDF:

  • Inicialize uma instância da classe PdfDocument.
  • Carregue um documento PDF usando o método PdfDocument.LoadFromFile().
  • Obtenha a página desejada no documento PDF através da propriedade PdfDocument.Pages[pageIndex].
  • Carregue uma imagem usando o método PdfImage.FromFile().
  • Inicialize uma instância da classe PdfImageHelper.
  • Obtenha as informações da imagem da página usando o método PdfImageHelper.GetImagesInfo().
  • Substitua uma imagem específica na página pela imagem carregada usando o método PdfImageHelper.ReplaceImage().
  • Salve o documento resultante usando o método PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Graphics;
    using Spire.Pdf.Utilities;
    
    namespace ReplaceImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument doc = new PdfDocument();
                //Load a PDF document
                doc.LoadFromFile("AddImage.pdf");
    
                //Get the first page
                PdfPageBase page = doc.Pages[0];
    
                //Load an image
                PdfImage image = PdfImage.FromFile("image1.jpg");
    
                //Create a PdfImageHelper instance
                PdfImageHelper imageHelper = new PdfImageHelper();
                //Get the image information from the page
                PdfImageInfo[] imageInfo = imageHelper.GetImagesInfo(page);
                //Replace the first image on the page with the loaded image
                imageHelper.ReplaceImage(imageInfo[0], image);
    
                //Save the result document
                doc.SaveToFile("ReplaceImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Exclua uma imagem específica em um documento PDF em C# e VB.NET

As etapas a seguir demonstram como excluir uma imagem de um documento PDF:

  • Inicialize uma instância da classe PdfDocument.
  • Carregue um documento PDF usando o método PdfDocument.LoadFromFile().
  • Obtenha a página desejada no documento PDF através da propriedade PdfDocument.Pages[pageIndex].
  • Exclua uma imagem específica da página usando o método PdfPageBase.DeleteImage().
  • Salve o documento resultante usando o método PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    
    namespace DeleteImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument pdf = new PdfDocument();
                //Load a PDF document
                pdf.LoadFromFile("AddImage.pdf");
    
                //Get the first page
                PdfPageBase page = pdf.Pages[0];
    
                //Delete the first image on the page
                page.DeleteImage(0);
    
                //Save the result document
                pdf.SaveToFile("DeleteImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Solicite uma licença temporária

Se desejar remover a mensagem de avaliação dos documentos gerados ou se livrar das limitações de função, por favor solicite uma licença de teste de 30 dias para você mesmo.

Veja também

По сравнению с текстовыми документами документы, содержащие изображения, несомненно, более яркие и привлекательные для читателей. При создании или редактировании PDF-документа иногда может потребоваться вставить изображения, чтобы улучшить его внешний вид и сделать его более привлекательным. В этой статье вы узнаете, как вставлять, заменять или удалять изображения в документах PDF на C# и VB.NET. используя Spire.PDF for .NET.

Установите Spire.PDF for .NET

Для начала вам необходимо добавить файлы DLL, включенные в пакет Spire.PDF for.NET, в качестве ссылок в ваш проект .NET. Файлы DLL можно загрузить по этой ссылке или установить через NuGet.

PM> Install-Package Spire.PDF

Вставка изображения в PDF-документ на C# и VB.NET

Следующие шаги демонстрируют, как вставить изображение в существующий PDF-документ:

  • Инициализируйте экземпляр класса PdfDocument.
  • Загрузите PDF-документ с помощью метода PdfDocument.LoadFromFile().
  • Получите нужную страницу в PDF-документе через свойство PdfDocument.Pages[pageIndex].
  • Загрузите изображение, используя метод PdfImage.FromFile().
  • Укажите ширину и высоту области изображения на странице.
  • Укажите координаты X и Y, чтобы начать рисовать изображение.
  • Нарисуйте изображение на странице, используя метод PdfPageBase.Canvas.DrawImage().
  • Сохраните полученный документ с помощью метода PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Graphics;
    
    namespace InsertImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument pdf = new PdfDocument();
                pdf.LoadFromFile("Input.pdf");
    
                //Get the first page in the PDF document
                PdfPageBase page = pdf.Pages[0];
    
                //Load an image
                PdfImage image = PdfImage.FromFile("image.jpg");
    
                //Specify the width and height of the image area on the page
                float width = image.Width * 0.50f;
                float height = image.Height * 0.50f;
    
                //Specify the X and Y coordinates to start drawing the image
                float x = 180f;
                float y = 70f;
    
                //Draw the image at a specified location on the page
                page.Canvas.DrawImage(image, x, y, width, height);
    
                //Save the result document
                pdf.SaveToFile("AddImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Замена изображения другим изображением в PDF-документе на C# и VB.NET

Следующие шаги демонстрируют, как заменить изображение другим изображением в документе PDF:

  • Инициализируйте экземпляр класса PdfDocument.
  • Загрузите PDF-документ с помощью метода PdfDocument.LoadFromFile().
  • Получите нужную страницу в PDF-документе через свойство PdfDocument.Pages[pageIndex].
  • Загрузите изображение, используя метод PdfImage.FromFile().
  • Инициализируйте экземпляр класса PdfImageHelper.
  • Получите информацию об изображении со страницы, используя метод PdfImageHelper.GetImagesInfo().
  • Замените определенное изображение на странице загруженным изображением с помощью метода PdfImageHelper.ReplaceImage().
  • Сохраните полученный документ с помощью метода PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Graphics;
    using Spire.Pdf.Utilities;
    
    namespace ReplaceImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument doc = new PdfDocument();
                //Load a PDF document
                doc.LoadFromFile("AddImage.pdf");
    
                //Get the first page
                PdfPageBase page = doc.Pages[0];
    
                //Load an image
                PdfImage image = PdfImage.FromFile("image1.jpg");
    
                //Create a PdfImageHelper instance
                PdfImageHelper imageHelper = new PdfImageHelper();
                //Get the image information from the page
                PdfImageInfo[] imageInfo = imageHelper.GetImagesInfo(page);
                //Replace the first image on the page with the loaded image
                imageHelper.ReplaceImage(imageInfo[0], image);
    
                //Save the result document
                doc.SaveToFile("ReplaceImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Удаление определенного изображения в PDF-документе на C# и VB.NET

Следующие шаги демонстрируют, как удалить изображение из документа PDF:

  • Инициализируйте экземпляр класса PdfDocument.
  • Загрузите PDF-документ с помощью метода PdfDocument.LoadFromFile().
  • Получите нужную страницу в PDF-документе через свойство PdfDocument.Pages[pageIndex].
  • Удалите определенное изображение на странице с помощью метода PdfPageBase.DeleteImage().
  • Сохраните полученный документ с помощью метода PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    
    namespace DeleteImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument pdf = new PdfDocument();
                //Load a PDF document
                pdf.LoadFromFile("AddImage.pdf");
    
                //Get the first page
                PdfPageBase page = pdf.Pages[0];
    
                //Delete the first image on the page
                page.DeleteImage(0);
    
                //Save the result document
                pdf.SaveToFile("DeleteImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Подать заявку на временную лицензию

Если вы хотите удалить сообщение об оценке из сгенерированных документов или избавиться от ограничений функции, пожалуйста запросите 30-дневную пробную лицензию для себя.

Смотрите также

Im Vergleich zu reinen Textdokumenten sind Dokumente mit Bildern zweifellos lebendiger und ansprechender für den Leser. Beim Erstellen oder Bearbeiten eines PDF-Dokuments müssen Sie möglicherweise manchmal Bilder einfügen, um das Erscheinungsbild zu verbessern und es ansprechender zu gestalten. In diesem Artikel erfahren Sie, wie das geht Einfügen, Ersetzen oder Löschen von Bildern in PDF-Dokumenten in C# und VB.NET Verwendung von Spire.PDF for .NET.

Installieren Sie Spire.PDF for .NET

Zunächst müssen Sie die im Spire.PDF for.NET-Paket enthaltenen DLL-Dateien als Referenzen in Ihrem .NET-Projekt hinzufügen. Die DLL-Dateien können entweder über diesen Link heruntergeladen oder über NuGet installiert werden.

PM> Install-Package Spire.PDF

Fügen Sie ein Bild in ein PDF-Dokument in C# und VB.NET ein

Die folgenden Schritte zeigen, wie Sie ein Bild in ein vorhandenes PDF-Dokument einfügen:

  • Initialisieren Sie eine Instanz der PdfDocument-Klasse.
  • Laden Sie ein PDF-Dokument mit der Methode PdfDocument.LoadFromFile().
  • Rufen Sie die gewünschte Seite im PDF-Dokument über die Eigenschaft PdfDocument.Pages[pageIndex] ab.
  • Laden Sie ein Bild mit der Methode PdfImage.FromFile().
  • Geben Sie die Breite und Höhe des Bildbereichs auf der Seite an.
  • Geben Sie die X- und Y-Koordinaten an, um mit dem Zeichnen des Bildes zu beginnen.
  • Zeichnen Sie das Bild mit der Methode PdfPageBase.Canvas.DrawImage() auf die Seite.
  • Speichern Sie das Ergebnisdokument mit der Methode PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Graphics;
    
    namespace InsertImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument pdf = new PdfDocument();
                pdf.LoadFromFile("Input.pdf");
    
                //Get the first page in the PDF document
                PdfPageBase page = pdf.Pages[0];
    
                //Load an image
                PdfImage image = PdfImage.FromFile("image.jpg");
    
                //Specify the width and height of the image area on the page
                float width = image.Width * 0.50f;
                float height = image.Height * 0.50f;
    
                //Specify the X and Y coordinates to start drawing the image
                float x = 180f;
                float y = 70f;
    
                //Draw the image at a specified location on the page
                page.Canvas.DrawImage(image, x, y, width, height);
    
                //Save the result document
                pdf.SaveToFile("AddImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Ersetzen Sie ein Bild durch ein anderes Bild in einem PDF-Dokument in C# und VB.NET

Die folgenden Schritte zeigen, wie Sie ein Bild durch ein anderes Bild in einem PDF-Dokument ersetzen:

  • Initialisieren Sie eine Instanz der PdfDocument-Klasse.
  • Laden Sie ein PDF-Dokument mit der Methode PdfDocument.LoadFromFile().
  • Rufen Sie die gewünschte Seite im PDF-Dokument über die Eigenschaft PdfDocument.Pages[pageIndex] ab.
  • Laden Sie ein Bild mit der Methode PdfImage.FromFile().
  • Initialisieren Sie eine Instanz der PdfImageHelper-Klasse.
  • Rufen Sie die Bildinformationen von der Seite mit der Methode PdfImageHelper.GetImagesInfo() ab.
  • Ersetzen Sie ein bestimmtes Bild auf der Seite durch das geladene Bild mit der Methode PdfImageHelper.ReplaceImage().
  • Speichern Sie das Ergebnisdokument mit der Methode PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Graphics;
    using Spire.Pdf.Utilities;
    
    namespace ReplaceImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument doc = new PdfDocument();
                //Load a PDF document
                doc.LoadFromFile("AddImage.pdf");
    
                //Get the first page
                PdfPageBase page = doc.Pages[0];
    
                //Load an image
                PdfImage image = PdfImage.FromFile("image1.jpg");
    
                //Create a PdfImageHelper instance
                PdfImageHelper imageHelper = new PdfImageHelper();
                //Get the image information from the page
                PdfImageInfo[] imageInfo = imageHelper.GetImagesInfo(page);
                //Replace the first image on the page with the loaded image
                imageHelper.ReplaceImage(imageInfo[0], image);
    
                //Save the result document
                doc.SaveToFile("ReplaceImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Löschen Sie ein bestimmtes Bild in einem PDF-Dokument in C# und VB.NET

Die folgenden Schritte zeigen, wie Sie ein Bild aus einem PDF-Dokument löschen:

  • Initialisieren Sie eine Instanz der PdfDocument-Klasse.
  • Laden Sie ein PDF-Dokument mit der Methode PdfDocument.LoadFromFile().
  • Rufen Sie die gewünschte Seite im PDF-Dokument über die Eigenschaft PdfDocument.Pages[pageIndex] ab.
  • Löschen Sie ein bestimmtes Bild auf der Seite mit der Methode PdfPageBase.DeleteImage().
  • Speichern Sie das Ergebnisdokument mit der Methode PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    
    namespace DeleteImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument pdf = new PdfDocument();
                //Load a PDF document
                pdf.LoadFromFile("AddImage.pdf");
    
                //Get the first page
                PdfPageBase page = pdf.Pages[0];
    
                //Delete the first image on the page
                page.DeleteImage(0);
    
                //Save the result document
                pdf.SaveToFile("DeleteImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Beantragen Sie eine temporäre Lizenz

Wenn Sie die Bewertungsmeldung aus den generierten Dokumenten entfernen oder die Funktionseinschränkungen beseitigen möchten, wenden Sie sich bitte an uns Fordern Sie eine 30-Tage-Testlizenz an für sich selbst.

Siehe auch

En comparación con los documentos que sólo contienen texto, los documentos que contienen imágenes son sin duda más vívidos y atractivos para los lectores. Al generar o editar un documento PDF, es posible que en ocasiones necesites insertar imágenes para mejorar su apariencia y hacerlo más atractivo. En este artículo, aprenderá cómo insertar, reemplazar o eliminar imágenes en documentos PDF en C# y VB.NET usando Spire.PDF for .NET.

Instalar Spire.PDF for .NET

Para empezar, debe agregar los archivos DLL incluidos en el paquete Spire.PDF for .NET como referencias en su proyecto .NET. Los archivos DLL se pueden descargar desde este enlace o instalar a través de NuGet.

PM> Install-Package Spire.PDF

Insertar una imagen en un documento PDF en C# y VB.NET

Los siguientes pasos demuestran cómo insertar una imagen en un documento PDF existente:

  • Inicialice una instancia de la clase PdfDocument.
  • Cargue un documento PDF utilizando el método PdfDocument.LoadFromFile().
  • Obtenga la página deseada en el documento PDF a través de la propiedad PdfDocument.Pages[pageIndex].
  • Cargue una imagen usando el método PdfImage.FromFile().
  • Especifique el ancho y el alto del área de la imagen en la página.
  • Especifique las coordenadas X e Y para comenzar a dibujar la imagen.
  • Dibuja la imagen en la página usando el método PdfPageBase.Canvas.DrawImage().
  • Guarde el documento resultante utilizando el método PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Graphics;
    
    namespace InsertImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument pdf = new PdfDocument();
                pdf.LoadFromFile("Input.pdf");
    
                //Get the first page in the PDF document
                PdfPageBase page = pdf.Pages[0];
    
                //Load an image
                PdfImage image = PdfImage.FromFile("image.jpg");
    
                //Specify the width and height of the image area on the page
                float width = image.Width * 0.50f;
                float height = image.Height * 0.50f;
    
                //Specify the X and Y coordinates to start drawing the image
                float x = 180f;
                float y = 70f;
    
                //Draw the image at a specified location on the page
                page.Canvas.DrawImage(image, x, y, width, height);
    
                //Save the result document
                pdf.SaveToFile("AddImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Reemplazar una imagen con otra imagen en un documento PDF en C# y VB.NET

Los siguientes pasos demuestran cómo reemplazar una imagen con otra imagen en un documento PDF:

  • Inicialice una instancia de la clase PdfDocument.
  • Cargue un documento PDF utilizando el método PdfDocument.LoadFromFile().
  • Obtenga la página deseada en el documento PDF a través de la propiedad PdfDocument.Pages[pageIndex].
  • Cargue una imagen usando el método PdfImage.FromFile().
  • Inicialice una instancia de la clase PdfImageHelper.
  • Obtenga la información de la imagen de la página utilizando el método PdfImageHelper.GetImagesInfo().
  • Reemplace una imagen específica en la página con la imagen cargada usando el método PdfImageHelper.ReplaceImage().
  • Guarde el documento resultante utilizando el método PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Graphics;
    using Spire.Pdf.Utilities;
    
    namespace ReplaceImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument doc = new PdfDocument();
                //Load a PDF document
                doc.LoadFromFile("AddImage.pdf");
    
                //Get the first page
                PdfPageBase page = doc.Pages[0];
    
                //Load an image
                PdfImage image = PdfImage.FromFile("image1.jpg");
    
                //Create a PdfImageHelper instance
                PdfImageHelper imageHelper = new PdfImageHelper();
                //Get the image information from the page
                PdfImageInfo[] imageInfo = imageHelper.GetImagesInfo(page);
                //Replace the first image on the page with the loaded image
                imageHelper.ReplaceImage(imageInfo[0], image);
    
                //Save the result document
                doc.SaveToFile("ReplaceImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Eliminar una imagen específica en un documento PDF en C# y VB.NET

Los siguientes pasos demuestran cómo eliminar una imagen de un documento PDF:

  • Inicialice una instancia de la clase PdfDocument.
  • Cargue un documento PDF utilizando el método PdfDocument.LoadFromFile().
  • Obtenga la página deseada en el documento PDF a través de la propiedad PdfDocument.Pages[pageIndex].
  • Elimine una imagen específica en la página usando el método PdfPageBase.DeleteImage().
  • Guarde el documento resultante utilizando el método PdfDocument.SaveToFile().
  • C#
  • VB.NET
using Spire.Pdf;
    
    namespace DeleteImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument pdf = new PdfDocument();
                //Load a PDF document
                pdf.LoadFromFile("AddImage.pdf");
    
                //Get the first page
                PdfPageBase page = pdf.Pages[0];
    
                //Delete the first image on the page
                page.DeleteImage(0);
    
                //Save the result document
                pdf.SaveToFile("DeleteImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

Solicitar una licencia temporal

Si desea eliminar el mensaje de evaluación de los documentos generados o deshacerse de las limitaciones de la función, por favor solicitar una licencia de prueba de 30 días para ti.

Ver también

텍스트만 있는 문서에 비해 이미지가 포함된 문서는 의심할 여지 없이 더 생생하고 독자의 관심을 끌게 됩니다. PDF 문서를 생성하거나 편집할 때 모양을 개선하고 더욱 매력적으로 만들기 위해 이미지를 삽입해야 하는 경우가 있습니다. 이 기사에서는 다음 방법을 배웁니다 C# 및 VB.NET의 PDF 문서에서 이미지 삽입, 교체 또는 삭제 Spire.PDF for .NET사용합니다

Spire.PDF for .NET 설치

먼저 Spire.PDF for.NET 패키지에 포함된 DLL 파일을 .NET 프로젝트의 참조로 추가해야 합니다. DLL 파일은 이 링크 에서 다운로드하거나 NuGet을 통해 설치할 수 있습니다.

PM> Install-Package Spire.PDF

C# 및 VB.NET에서 PDF 문서에 이미지 삽입

다음 단계에서는 기존 PDF 문서에 이미지를 삽입하는 방법을 보여줍니다.

  • PdfDocument 클래스의 인스턴스를 초기화합니다.
  • PdfDocument.LoadFromFile() 메서드를 사용하여 PDF 문서를 로드합니다.
  • PdfDocument.Pages[pageIndex] 속성을 통해 PDF 문서에서 원하는 페이지를 가져옵니다.
  • PdfImage.FromFile() 메서드를 사용하여 이미지를 로드합니다.
  • 페이지에서 이미지 영역의 너비와 높이를 지정합니다.
  • 이미지 그리기를 시작하려면 X 및 Y 좌표를 지정하세요.
  • PdfPageBase.Canvas.DrawImage() 메서드를 사용하여 페이지에 이미지를 그립니다.
  • PdfDocument.SaveToFile() 메서드를 사용하여 결과 문서를 저장합니다.
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Graphics;
    
    namespace InsertImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument pdf = new PdfDocument();
                pdf.LoadFromFile("Input.pdf");
    
                //Get the first page in the PDF document
                PdfPageBase page = pdf.Pages[0];
    
                //Load an image
                PdfImage image = PdfImage.FromFile("image.jpg");
    
                //Specify the width and height of the image area on the page
                float width = image.Width * 0.50f;
                float height = image.Height * 0.50f;
    
                //Specify the X and Y coordinates to start drawing the image
                float x = 180f;
                float y = 70f;
    
                //Draw the image at a specified location on the page
                page.Canvas.DrawImage(image, x, y, width, height);
    
                //Save the result document
                pdf.SaveToFile("AddImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

C# 및 VB.NET의 PDF 문서에서 이미지를 다른 이미지로 바꾸기

다음 단계에서는 PDF 문서의 이미지를 다른 이미지로 바꾸는 방법을 보여줍니다.

  • PdfDocument 클래스의 인스턴스를 초기화합니다.
  • PdfDocument.LoadFromFile() 메서드를 사용하여 PDF 문서를 로드합니다.
  • PdfDocument.Pages[pageIndex] 속성을 통해 PDF 문서에서 원하는 페이지를 가져옵니다.
  • PdfImage.FromFile() 메서드를 사용하여 이미지를 로드합니다.
  • PdfImageHelper 클래스의 인스턴스를 초기화합니다.
  • PdfImageHelper.GetImagesInfo() 메서드를 사용하여 페이지에서 이미지 정보를 가져옵니다.
  • PdfImageHelper.ReplaceImage() 메서드를 사용하여 페이지의 특정 이미지를 로드된 이미지로 바꿉니다.
  • PdfDocument.SaveToFile() 메서드를 사용하여 결과 문서를 저장합니다.
  • C#
  • VB.NET
using Spire.Pdf;
    using Spire.Pdf.Graphics;
    using Spire.Pdf.Utilities;
    
    namespace ReplaceImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument doc = new PdfDocument();
                //Load a PDF document
                doc.LoadFromFile("AddImage.pdf");
    
                //Get the first page
                PdfPageBase page = doc.Pages[0];
    
                //Load an image
                PdfImage image = PdfImage.FromFile("image1.jpg");
    
                //Create a PdfImageHelper instance
                PdfImageHelper imageHelper = new PdfImageHelper();
                //Get the image information from the page
                PdfImageInfo[] imageInfo = imageHelper.GetImagesInfo(page);
                //Replace the first image on the page with the loaded image
                imageHelper.ReplaceImage(imageInfo[0], image);
    
                //Save the result document
                doc.SaveToFile("ReplaceImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

C# 및 VB.NET의 PDF 문서에서 특정 이미지 삭제

다음 단계에서는 PDF 문서에서 이미지를 삭제하는 방법을 보여줍니다.

  • PdfDocument 클래스의 인스턴스를 초기화합니다.
  • PdfDocument.LoadFromFile() 메서드를 사용하여 PDF 문서를 로드합니다.
  • PdfDocument.Pages[pageIndex] 속성을 통해 PDF 문서에서 원하는 페이지를 가져옵니다.
  • PdfPageBase.DeleteImage() 메서드를 사용하여 페이지의 특정 이미지를 삭제합니다.
  • PdfDocument.SaveToFile() 메서드를 사용하여 결과 문서를 저장합니다.
  • C#
  • VB.NET
using Spire.Pdf;
    
    namespace DeleteImage
    {
        class Program
        {
            static void Main(string[] args)
            {
                //Create a PdfDocument instance
                PdfDocument pdf = new PdfDocument();
                //Load a PDF document
                pdf.LoadFromFile("AddImage.pdf");
    
                //Get the first page
                PdfPageBase page = pdf.Pages[0];
    
                //Delete the first image on the page
                page.DeleteImage(0);
    
                //Save the result document
                pdf.SaveToFile("DeleteImage.pdf", FileFormat.PDF);
            }
        }
    }

C#/VB.NET: Insert, Replace or Delete Images in PDF

임시 라이센스 신청

생성된 문서에서 평가 메시지를 제거하고 싶거나, 기능 제한을 없애고 싶다면 30일 평가판 라이센스 요청 자신을 위해.

또한보십시오