Förenkla textutvinning från PDF-dokument med Aspose.PDF Text Extractor för .NET-tillägget. Denna mångsidiga verktyg erbjuder tre driftlägen: ren, rå och vanlig, vilket ger flexibilitet och bekvämlighet för textutvinningsuppgifter i .NET-applikationer.
TextExtractorOptions
.TextExtractorOptions.AddDataSource
TextExtractorOptions.Process
och tilldela resultatet till ResultContainer
.ResultContainer.ResultCollection
Hämta samlingsfilerna från downloads eller hämta paketet från NuGet för att lägga till Aspose.PDF
direkt i din arbetsplats.
TextExtractor
och TextExtractorOptions
.TextExtractorOptions.AddDataSource
TextExtractor.Process
med en instans av TextExtractorOptions
som parameterResultContainer
.ResultContainer.ResultCollection
Pure
möjliggör textutvinning från en PDF-fil med olika formateringsprocedurer, införlivande av relativa positioner och in införande av ytterligare mellanslag för att justera texten till sidans bredd.Raw
-läget extraherar text från PDF-filen utan att tillämpa någon formatering.Plaintext
-läget extraherar text från PDF-filen med hänsyn till den relativa positioneringen av textfragment, men till skillnad från “Pure”-läget lägger det inte till extra mellanrum.Aspose.PDF Text Extractor för .NET är en plugin designad för .NET-applikationer, som erbjuder textextraktion från PDF-dokument med tre olika lägen för operation; Ren, Raw, och Vanlig. Den är förinställd på ‘Raw’-läget, stödjer mångsidiga ingångs- och utdataalternativ, tillåter simultan bearbetning av flera PDF-filer, och erbjuder anpassning för utvecklare, vilket gör den till en bekväm lösning för textextraktion inom .NET-miljöer.
Aspose.PDF för .NET är en kraftfull .NET API för ett brett spektrum av PDF-uppgifter, inklusive dokumentgenerering, komprimering, tabellskapande och avancerade funktioner som import och export av PDF-data. Å andra sidan är Aspose.PDF Text Extractor för .NET en specialiserad plugin fokuserad enbart på att extrahera text från PDF-dokument, med tonvikt på textutvinningsförmågor.