1. Produits
  2.   Aspose.OCR
  3.   .NET
  4.   PDF scanné en texte

Conversion de PDF numérisé en texte grâce à la reconnaissance optique de caractères (OCR).

Extraire du texte à partir de PDF scannés ou les convertir en documents consultables. Lire n’importe quelle mise en page et style, définir précisément la structure du texte et des tableaux. Préserver les images originales en arrière-plan pour une conservation du contenu. Aspose.OCR - Votre solution d’extraction de texte PDF pour .NET.

Convertir un PDF scanné en texte avec Aspose.OCR pour .NET

Le plug-in OCR .NET d’Aspose extrait du texte à partir de PDF numérisés ou les convertit en documents interrogeables, préservant les images originales. Les algorithmes avancés identifient avec précision le texte et les structures de tableau, en faisant votre solution privilégiée pour l’extraction de texte PDF.

Comment utiliser le plugin PDF scanné vers texte

  • Installer le package Aspose.OCR depuis NuGet ou un fichier téléchargé localement.
  • Définissez vos clés de licence.
  • Charger une image scannée dans l’objet OcrInput.
  • Créez une instance du moteur de reconnaissance Aspose.OCR.
  • Extraire le texte d’un PDF numérisé.
  • Afficher le texte reconnu ou l’enregistrer dans un fichier.

Obtenez le plugin de conversion de PDF scanné en texte

Obtenez les fichiers d’assemblage respectifs à partir des téléchargements ou récupérez le package depuis NuGet pour ajouter Aspose.OCR directement à votre espace de travail.

  • Compatible avec Microsoft Windows ou un système d’exploitation compatible avec .NET Standard 2.0
  • Nécessite un environnement de développement tel que Microsoft Visual Studio.


Foire aux questions

La spécification d’une langue est-elle nécessaire?

Par défaut, Aspose.OCR peut automatiquement reconnaître un large éventail de langues basées sur l’alphabet latin étendu. Cependant, fournir une langue spécifique peut considérablement améliorer la précision de la reconnaissance. Spécifiez explicitement la langue lors de la reconnaissance de textes cyrilliques, chinois et hindi.

Quels formats de fichier sont pris en charge?

Aspose.OCR prend en charge les formats populaires des scanners ou des appareils photo, y compris PDF, JPEG, PNG et TIFF. Les résultats de reconnaissance sont renvoyés sous forme de texte brut, HTML, Microsoft Word, PDF, JSON et XML.

Comment obtenir le meilleur résultat?

Bonne qualité d’image est crucial pour une OCR précise. Utilisez un scanner ou un appareil photo haute résolution. La bibliothèque inclut des filtres avancés pour améliorer automatiquement la qualité de l’image avant la reconnaissance.

Où trouver plus d’informations et d’exemples?

Explorez notre documentation en ligne ou visitez le dépôt Aspose.OCR pour .NET pour des exemples de code et des projets de démonstration.

  

Ressources de support et d'apprentissage

  
 Français