TUTOS.EU

Lire le texte contenu dans un fichier pdf avec C Sharp

Avec Visual Studio 2019

Créer un projet de type application console C Sharp

Ici je le nomme LirePdf

Aller dans Gérer les packages Nuget

Aller sur Parcourir, chercher itextsharp V5 et l'installer

Cliquer sur Ok

Vous aller devoir accepter la licence

Je n'ai pas eu d'erreurs

Repartez sur l'onglet qui a votre programme. On va modifier le code

Effacez tout et collez ceci à la place.

Ici le code lit C:\Exemple.pdf
et il écrit le contenu dans C:\aaa.txt

using System;

using iTextSharp.text.pdf;          //*iTextSharp
using iTextSharp.text.pdf.parser;   //*iTextSharp Text-Reader
using System.IO; //Pour les fichiers

namespace LirePdf
{
    class Program
    {
        static void Main(string[] args)
        {
            //Console.WriteLine("Hello World!");

            var fileName = @"C:\aaa.txt";

            using FileStream objFileStream = File.Create(fileName);
            using var objStreamWriter = new StreamWriter(objFileStream);

            String sFilename = @"C:\Exemple.pdf";
            String sText = "";

            PdfReader pdf_Reader = new PdfReader(sFilename);

            for (int i = 1; i <= pdf_Reader.NumberOfPages; i++)
            {
                sText = PdfTextExtractor.GetTextFromPage(pdf_Reader, i);
                objStreamWriter.WriteLine(sText);
                Console.WriteLine(sText);
            }

        }
    }
}
Lien vers le fichier : cliquez ici Copier le code

En passant, voici comment créer un fichier pdf et écrire Hello World Baby ! dedans :

using System;

//using iTextSharp;
using iTextSharp.text;
using iTextSharp.text.pdf;          //*iTextSharp
//using iTextSharp.text.pdf.parser;   //*iTextSharp Text-Reader
using System.IO; //Pour les fichiers

namespace CreatePDF
{
    class Program
    {
        static void Main(string[] args)
        {
            //Console.WriteLine("Hello World!");

            var fileName = @"C:\aaaa.pdf";

            using FileStream objFileStream = File.Create(fileName);

            //using var objStreamWriter = new StreamWriter(objFileStream);

            //System.IO.FileStream fs = new FileStream(Server.MapPath("pdf") + "\\" + "First PDF document.pdf", FileMode.Create)

            // Create an instance of the document class which represents the PDF document itself.  
            Document document = new Document(PageSize.A4, 25, 25, 30, 30);
            // Create an instance to the PDF file by creating an instance of the PDF   
            // Writer class using the document and the filestrem in the constructor.  
            PdfWriter writer = PdfWriter.GetInstance(document, objFileStream);

            // Add meta information to the document  
            document.AddAuthor("Test");
            document.AddCreator("Test using iTextSharp");
            document.AddKeywords("test");
            document.AddSubject("test");
            document.AddTitle("test");

            // Open the document to enable you to write to the document  
            document.Open();
            // Add a simple and wellknown phrase to the document in a flow layout manner  
            document.Add(new Paragraph("Hello World Baby !"));
            // Close the document  
            document.Close();
            // Close the writer instance  
            writer.Close();
            // Always close open filehandles explicity  
            objFileStream.Close();

        }
    }
}
Lien vers le fichier : cliquez ici Copier le code

Pages Web

Site WebDescription
readdy.netSite où j'ai puisié l'inspiration
Youtube.comLa vidéo du gars qui explique comment lire un pdf
c-sharpcorner.comLà où j'ai trouvé comment écrire dans un pdf

2