Wtyczka OCR Aspose.OCR dla .NET pobiera tekst ze zeskanowanych plików PDF lub konwertuje je na dokumenty z możliwością wyszukiwania, zachowując oryginalne obrazy. Zaawansowane algorytmy dokładnie identyfikują tekst i struktury tabel, sprawiając, że jest to Twoje rozwiązanie do ekstrakcji tekstu z plików PDF.
OcrInput
.Pobierz odpowiednie pliki zestawów składających się na pobrania lub pobierz pakiet z NuGet aby dodać Aspose.OCR bezpośrednio do swojego środowiska pracy.
Domyślnie, Aspose.OCR automatycznie rozpoznaje szeroki zakres języków oparty na rozszerzonym alfabecie łacińskim. Jednak określenie konkretnego języka może znacząco zwiększyć dokładność rozpoznawania. W przypadku tekstu w alfabecie cyrylicy, chińskiego i hindi, należy wyraźnie określić używany język.
Aspose.OCR obsługuje popularne formaty zeskanowanych dokumentów lub zdjęć z aparatów, w tym PDF, JPEG, PNG i TIFF. Wyniki rozpoznawania są zwracane w postaci zwykłego tekstu, HTML, Microsoft Word, PDF, JSON i XML.
Dobra jakość obrazu jest kluczowa dla dokładnego OCR. Użyj skanera lub aparatu o wysokiej rozdzielczości. Biblioteka zawiera zaawansowane filtry, które automatycznie poprawiają jakość obrazu przed rozpoznaniem.
Zbadaj naszą dokumentację online lub odwiedź repozytorium Aspose.OCR dla .NET w celu uzyskania przykładowego kodu i projektów pokazowych.