Hur man extraherar text från PDF via .NET

Referera till Aspose.PDF i ditt projekt
Ange dina licensnycklar
Skapa instanser av TextExtractorOptions.
Lägg till inmatnings-PDF-dokument med hjälp av TextExtractorOptions.AddDataSource
Anropa TextExtractorOptions.Process och tilldela resultatet till ResultContainer.
Kom åt den extraherade texten med hjälp av ResultContainer.ResultCollection

Kom igång med PDF Text Extractor

Hämta samlingsfilerna från downloads eller hämta paketet från NuGet för att lägga till Aspose.PDF direkt i din arbetsplats.

Stödda operativsystem inkluderar Windows 7-11 och Windows Server 2003-2022, macOS (10.12+) och Linux
Stödda ramverk sträcker sig från 4.0 till 7.0.
Kompatibel med olika versioner av Microsoft Visual Studio

Hur man extraherar text från flera PDF-filer

Referera till Aspose.PDF för .NET i ditt projekt
Ange dina licensnycklar
Skapa instanser av TextExtractor och TextExtractorOptions.
Lägg till inmatnings-PDF-dokument med hjälp av TextExtractorOptions.AddDataSource
Anropa TextExtractor.Process med en instans av TextExtractorOptions som parameter
Få resultatet i en instans av ResultContainer.
Få åtkomst till extraherad text med ResultContainer.ResultCollection

Bildextraktorns Driftslägen

Alternativet Pure möjliggör textutvinning från en PDF-fil med olika formateringsprocedurer, införlivande av relativa positioner och in införande av ytterligare mellanslag för att justera texten till sidans bredd.
Raw-läget extraherar text från PDF-filen utan att tillämpa någon formatering.
Plaintext-läget extraherar text från PDF-filen med hänsyn till den relativa positioneringen av textfragment, men till skillnad från “Pure”-läget lägger det inte till extra mellanrum.

Vanliga Frågor

Vad gör Aspose.PDF Text Extractor for .NET?

Aspose.PDF Text Extractor för .NET är en plugin designad för .NET-applikationer, som erbjuder textextraktion från PDF-dokument med tre olika lägen för operation; Ren, Raw, och Vanlig. Den är förinställd på ‘Raw’-läget, stödjer mångsidiga ingångs- och utdataalternativ, tillåter simultan bearbetning av flera PDF-filer, och erbjuder anpassning för utvecklare, vilket gör den till en bekväm lösning för textextraktion inom .NET-miljöer.

Vad är skillnaden mellan Aspose.PDF for .NET & Aspose.PDF Text Extractor for .NET?

Aspose.PDF för .NET är en kraftfull .NET API för ett brett spektrum av PDF-uppgifter, inklusive dokumentgenerering, komprimering, tabellskapande och avancerade funktioner som import och export av PDF-data. Å andra sidan är Aspose.PDF Text Extractor för .NET en specialiserad plugin fokuserad enbart på att extrahera text från PDF-dokument, med tonvikt på textutvinningsförmågor.

PDF Text Extractor för .NET

Extrahera ren, rå eller vanlig text från PDF-dokument med Aspose.PDF .NET Plugin.

Aspose.PDF
for .NET

Textutdragare för .NET

Hur man extraherar text från PDF via .NET

Kom igång med PDF Text Extractor

Hur man extraherar text från flera PDF-filer

Bildextraktorns Driftslägen

Vanliga Frågor

Vad gör Aspose.PDF Text Extractor for .NET?

Vad är skillnaden mellan Aspose.PDF for .NET & Aspose.PDF Text Extractor for .NET?

PDF Text Extractor för .NET

Extrahera ren, rå eller vanlig text från PDF-dokument med Aspose.PDF .NET Plugin.

Aspose.PDFfor .NET

Textutdragare för .NET

Hur man extraherar text från PDF via .NET

Kom igång med PDF Text Extractor

Hur man extraherar text från flera PDF-filer

Bildextraktorns Driftslägen

Vanliga Frågor

Vad gör Aspose.PDF Text Extractor for .NET?

Vad är skillnaden mellan Aspose.PDF for .NET & Aspose.PDF Text Extractor for .NET?

Aspose.PDF
for .NET