Aspose.OCR to wtyczka .NET OCR, która wyodrębnia tekst zeskanowanych lub sfotografowanych tabel. Zaawansowane algorytmy uczenia maszynowego oraz specjalnie przeszkolone sieci neuronowe dokładnie identyfikują strukturę tabel, wyodrębniają tekst z komórek i organizują go w arkusze kalkulacyjne, które można wyszukiwać i edytować.
OcrInput
.Pobierz odpowiednie pliki zestawów składających się na pobrania lub pobierz pakiet z NuGet aby dodać Aspose.OCR bezpośrednio do swojego środowiska pracy.
Domyślnie, Aspose.OCR automatycznie rozpoznaje szeroki zakres języków oparty na rozszerzonym alfabecie łacińskim. Jednak określenie konkretnego języka może znacząco zwiększyć dokładność rozpoznawania. W przypadku tekstu w alfabecie cyrylicy, chińskiego i hindi, należy wyraźnie określić używany język.
Aspose.OCR obsługuje popularne formaty zeskanowanych dokumentów lub zdjęć z aparatów, w tym PDF, JPEG, PNG i TIFF. Wyniki rozpoznawania są zwracane w postaci zwykłego tekstu, HTML, Microsoft Word, PDF, JSON i XML.
Dobra jakość obrazu jest kluczowa dla dokładnego OCR. Użyj skanera lub aparatu o wysokiej rozdzielczości. Biblioteka zawiera zaawansowane filtry, które automatycznie poprawiają jakość obrazu przed rozpoznaniem.
Zbadaj naszą dokumentację online lub odwiedź repozytorium Aspose.OCR dla .NET w celu uzyskania przykładowego kodu i projektów pokazowych.