Polski
  1. Produkty
  2.   Aspose.OCR
  3.   Przekonwertuj PDF na tekst

Przekonwertuj skanowany plik PDF na tekst przy użyciu OCR.

Wyodrębniaj tekst z zeskanowanych plików PDF lub konwertuj je na dokumenty możliwe do wyszukiwania. Przeczytaj każde układ i styl, dokładnie zdefiniuj strukturę tekstu i tabel. Zachowaj oryginalne obrazy w tle dla zachowania treści. Aspose.OCR - Twoje rozwiązanie do wydobywania tekstu z plików PDF dla .NET.

Konwertuj zeskanowany plik PDF na tekst przy użyciu Aspose.OCR dla .NET

Wtyczka OCR Aspose.OCR dla .NET pobiera tekst ze zeskanowanych plików PDF lub konwertuje je na dokumenty z możliwością wyszukiwania, zachowując oryginalne obrazy. Zaawansowane algorytmy dokładnie identyfikują tekst i struktury tabel, sprawiając, że jest to Twoje rozwiązanie do ekstrakcji tekstu z plików PDF.

Jak używać wtyczki PDF do tekstu zeskanowanego

  • Zainstaluj pakiet Aspose.OCR za pomocą NuGet lub pliku pobranego lokalnie.
  • [Ustaw swoje klucze licencyjne.
  • Załaduj zeskanowany obraz do obiektu OcrInput.
  • Utwórz instancję silnika rozpoznawania Aspose.OCR.
  • Wydobywanie tekstu z zeskanowanego pliku PDF.
  • Wyświetl rozpoznany tekst lub zapisz go do pliku.

Pobierz wtyczkę konwertera PDF na tekst.

Pobierz odpowiednie pliki zestawów składających się na pobrania lub pobierz pakiet z NuGet aby dodać Aspose.OCR bezpośrednio do swojego środowiska pracy.

  • Zgodny z systemem Microsoft Windows lub zgodnym systemem operacyjnym z .NET Standard 2.0
  • Wymaga środowiska programistycznego, takiego jak Microsoft Visual Studio.


Dodatkowe funkcje

  • Wsparcie dla wielostronicowych plików PDF do ekstrakcji tekstu z każdej strony.
  • Konfigurowalne ustawienia rozpoznawania tekstu dla poprawy dokładności.
  • Integracja z innymi bibliotekami Aspose do zaawansowanego przetwarzania dokumentów.

Wymagania systemowe

  • Wymagana jest wersja .NET Standard 2.0 lub wyższa do uruchomienia wtyczki.
  • Kompatybilny z systemami operacyjnymi Microsoft Windows.
  • Odpowiednia pamięć i miejsce na dysku dla optymalnej wydajności.


Najczęściej Zadawane Pytania

Czy określenie języka jest konieczne?

Domyślnie, Aspose.OCR automatycznie rozpoznaje szeroki zakres języków oparty na rozszerzonym alfabecie łacińskim. Jednak określenie konkretnego języka może znacząco zwiększyć dokładność rozpoznawania. W przypadku tekstu w alfabecie cyrylicy, chińskiego i hindi, należy wyraźnie określić używany język.

Jakie formaty plików są obsługiwane?

Aspose.OCR obsługuje popularne formaty zeskanowanych dokumentów lub zdjęć z aparatów, w tym PDF, JPEG, PNG i TIFF. Wyniki rozpoznawania są zwracane w postaci zwykłego tekstu, HTML, Microsoft Word, PDF, JSON i XML.

Jak osiągnąć najlepszy wynik?

Dobra jakość obrazu jest kluczowa dla dokładnego OCR. Użyj skanera lub aparatu o wysokiej rozdzielczości. Biblioteka zawiera zaawansowane filtry, które automatycznie poprawiają jakość obrazu przed rozpoznaniem.

Gdzie znaleźć więcej informacji i przykładów?

Zbadaj naszą dokumentację online lub odwiedź repozytorium Aspose.OCR dla .NET w celu uzyskania przykładowego kodu i projektów pokazowych.

  

Zasoby Wsparcia i Nauki

  
 Polski