1. Produkter
  2.   Aspose.PDF
  3.   .NET
  4.   Textutdragare

PDF Text Extractor för .NET

Extrahera ren, rå eller vanlig text från PDF-dokument med Aspose.PDF .NET Plugin.

Textutdragare för .NET

Förenkla textutvinning från PDF-dokument med Aspose.PDF Text Extractor för .NET-tillägget. Denna mångsidiga verktyg erbjuder tre driftlägen: ren, rå och vanlig, vilket ger flexibilitet och bekvämlighet för textutvinningsuppgifter i .NET-applikationer.

Hur man extraherar text från PDF via .NET

  • Referera till Aspose.PDF i ditt projekt
  • Ange dina licensnycklar
  • Skapa instanser av TextExtractorOptions.
  • Lägg till inmatnings-PDF-dokument med hjälp av TextExtractorOptions.AddDataSource
  • Anropa TextExtractorOptions.Process och tilldela resultatet till ResultContainer.
  • Kom åt den extraherade texten med hjälp av ResultContainer.ResultCollection

Kom igång med PDF Text Extractor

Hämta samlingsfilerna från downloads eller hämta paketet från NuGet för att lägga till Aspose.PDF direkt i din arbetsplats.

  • Stödda operativsystem inkluderar Windows 7-11 och Windows Server 2003-2022, macOS (10.12+) och Linux
  • Stödda ramverk sträcker sig från 4.0 till 7.0.
  • Kompatibel med olika versioner av Microsoft Visual Studio


Hur man extraherar text från flera PDF-filer

  • Referera till Aspose.PDF för .NET i ditt projekt
  • Ange dina licensnycklar
  • Skapa instanser av TextExtractor och TextExtractorOptions.
  • Lägg till inmatnings-PDF-dokument med hjälp av TextExtractorOptions.AddDataSource
  • Anropa TextExtractor.Process med en instans av TextExtractorOptions som parameter
  • Få resultatet i en instans av ResultContainer.
  • Få åtkomst till extraherad text med ResultContainer.ResultCollection

Bildextraktorns Driftslägen

  • Alternativet Pure möjliggör textutvinning från en PDF-fil med olika formateringsprocedurer, införlivande av relativa positioner och in införande av ytterligare mellanslag för att justera texten till sidans bredd.
  • Raw-läget extraherar text från PDF-filen utan att tillämpa någon formatering.
  • Plaintext-läget extraherar text från PDF-filen med hänsyn till den relativa positioneringen av textfragment, men till skillnad från “Pure”-läget lägger det inte till extra mellanrum.


Vanliga Frågor

Vad gör Aspose.PDF Text Extractor for .NET?

Aspose.PDF Text Extractor för .NET är en plugin designad för .NET-applikationer, som erbjuder textextraktion från PDF-dokument med tre olika lägen för operation; Ren, Raw, och Vanlig. Den är förinställd på ‘Raw’-läget, stödjer mångsidiga ingångs- och utdataalternativ, tillåter simultan bearbetning av flera PDF-filer, och erbjuder anpassning för utvecklare, vilket gör den till en bekväm lösning för textextraktion inom .NET-miljöer.

Vad är skillnaden mellan Aspose.PDF for .NET & Aspose.PDF Text Extractor for .NET?

Aspose.PDF för .NET är en kraftfull .NET API för ett brett spektrum av PDF-uppgifter, inklusive dokumentgenerering, komprimering, tabellskapande och avancerade funktioner som import och export av PDF-data. Å andra sidan är Aspose.PDF Text Extractor för .NET en specialiserad plugin fokuserad enbart på att extrahera text från PDF-dokument, med tonvikt på textutvinningsförmågor.

 Svenska