Uprość wyodrębnianie tekstu z dokumentów PDF za pomocą wtyczki Aspose.PDF Text Extractor dla .NET. Ten wszechstronny narzędzie oferuje trzy tryby pracy: czysty, surowy i zwykły, zapewniając elastyczność i wygodę podczas wyodrębniania tekstu w aplikacjach .NET.
TextExtractorOptions
TextExtractorOptions.AddDataSource
TextExtractorOptions.Process
i przypisz wynik do ResultContainer
.ResultContainer.ResultCollection
.Pobierz pliki montażowe z pobieranie lub pobierz pakiet z NuGet, aby dodać Aspose.PDF
bezpośrednio do swojej przestrzeni roboczej.
TextExtractor
oraz TextExtractorOptions
.TextExtractorOptions.AddDataSource
TextExtractor.Process
z instancją TextExtractorOptions
jako parametrem.ResultContainer
.ResultContainer.ResultCollection
Pure
umożliwia wyodrębnienie tekstu z pliku PDF za pomocą różnych procedur formatowania, uwzględniając względne pozycje i wprowadzając dodatkowe spacje w celu wyrównania tekstu do szerokości strony.Surowy
wyodrębnia tekst z pliku PDF bez zastosowania żadnego formatowania.Aspose.PDF Text Extractor dla .NET to wtyczka zaprojektowana dla aplikacji .NET, oferująca ekstrakcję tekstu z dokumentów PDF w trzech trybach działania: Czystym, Surowym i Zwykłym. Domyślnie działa w trybie ‘Surowym’, obsługuje wszechstronne opcje wejścia i wyjścia, pozwala na jednoczesne przetwarzanie wielu plików PDF oraz zapewnia dostosowanie dla deweloperów, co czyni ją wygodnym rozwiązaniem do ekstrakcji tekstu w środowiskach .NET.
Aspose.PDF dla .NET to solidne API .NET do szerokiego zakresu zadań związanych z PDF, w tym generowania dokumentów, kompresji, tworzenia tabel oraz zaawansowanych funkcji, takich jak import i eksport danych PDF. Z kolei Aspose.PDF Text Extractor dla .NET to specjalistyczny plugin skoncentrowany wyłącznie na wyodrębnianiu tekstu z dokumentów PDF, podkreślając możliwości wyodrębniania tekstu.