Da PDF scansionato a testo (OCR).

Estrarre il testo dai PDF digitalizzati o convertirli in documenti cercabili. Leggere qualsiasi layout e stile, definire con precisione la struttura del testo e delle tabelle. Conservare le immagini originali nello sfondo per mantenere il contenuto. Aspose.OCR - La tua soluzione di estrazione del testo da PDF per .NET.

Convertire PDF acquisiti in testo con Aspose.OCR per .NET

Il plug-in OCR di Aspose.OCR per .NET estrae il testo da PDF scansionati o li converte in documenti ricercabili, preservando le immagini originali. Gli algoritmi avanzati identificano con precisione strutture di testo e tabelle, rendendolo la soluzione ideale per l’estrazione di testo dai PDF.

Come utilizzare il plugin PDF scannerizzato per il testo

Installare il pacchetto Aspose.OCR da NuGet o un file scaricato localmente.
Imposta le tue chiavi di licenza.
Carica un’immagine acquisita nell’oggetto OcrInput.
Crea un’istanza del motore di riconoscimento Aspose.OCR.
Estrarre testo da un PDF scansionato.
Stampare il testo riconosciuto o salvarlo in un file.

Ottieni il plugin Convertitore PDF in Testo scannerizzato

Ottieni i file di assembly rispettivi dai download o recupera il pacchetto da NuGet per aggiungere Aspose.OCR direttamente al tuo spazio di lavoro.

Compatibile con Microsoft Windows o un OS compatibile con .NET Standard 2.0
Richiede un ambiente di sviluppo come Microsoft Visual Studio.

Funzionalità Aggiuntive

Supporto per PDF multipagina per estrarre testo da ciascuna pagina.
Impostazioni di riconoscimento del testo personalizzabili per una maggiore precisione.
Integrazione con altre librerie Aspose per un’elaborazione documentale avanzata.

Requisiti di sistema

È necessaria .NET Standard 2.0 o superiore per eseguire il plugin.
Compatibile con i sistemi operativi Microsoft Windows.
Memoria adeguata e spazio su disco per prestazioni ottimali.

Domande Frequenti

Specificare una lingua è necessario?

Per impostazione predefinita, Aspose.OCR può riconoscere automaticamente una vasta gamma di lingue basate sull’alfabeto latino esteso. Tuttavia, specificare una lingua specifica può migliorare significativamente l’accuratezza del riconoscimento. Specifica esplicitamente la lingua quando riconosci testi in cirillico, cinese e hindi.

Quali formati di file sono supportati?

Aspose.OCR supporta formati popolari da scanner o telecamere, inclusi PDF, JPEG, PNG e TIFF. I risultati del riconoscimento vengono restituiti in testo normale, HTML, Microsoft Word, PDF, JSON e XML.

Come ottenere il miglior risultato?

Buona qualità dell’immagine è cruciale per un’OCR accurata. Utilizza uno scanner o una fotocamera ad alta risoluzione. La libreria include filtri avanzati per migliorare automaticamente la qualità dell’immagine prima del riconoscimento.

Dove trovare ulteriori informazioni ed esempi?

Esplora la nostra documentazione online o visita il repository di Aspose.OCR for .NET per campioni di codice e progetti dimostrativi.