Il plug-in OCR di Aspose.OCR per .NET estrae il testo da PDF scansionati o li converte in documenti ricercabili, preservando le immagini originali. Gli algoritmi avanzati identificano con precisione strutture di testo e tabelle, rendendolo la soluzione ideale per l’estrazione di testo dai PDF.
OcrInput
.Ottieni i file di assembly rispettivi dai download o recupera il pacchetto da NuGet per aggiungere Aspose.OCR direttamente al tuo spazio di lavoro.
Per impostazione predefinita, Aspose.OCR può riconoscere automaticamente una vasta gamma di lingue basate sull’alfabeto latino esteso. Tuttavia, specificare una lingua specifica può migliorare significativamente l’accuratezza del riconoscimento. Specifica esplicitamente la lingua quando riconosci testi in cirillico, cinese e hindi.
Aspose.OCR supporta formati popolari da scanner o telecamere, inclusi PDF, JPEG, PNG e TIFF. I risultati del riconoscimento vengono restituiti in testo normale, HTML, Microsoft Word, PDF, JSON e XML.
Buona qualità dell’immagine è cruciale per un’OCR accurata. Utilizza uno scanner o una fotocamera ad alta risoluzione. La libreria include filtri avanzati per migliorare automaticamente la qualità dell’immagine prima del riconoscimento.
Esplora la nostra documentazione online o visita il repository di Aspose.OCR for .NET per campioni di codice e progetti dimostrativi.