Le plug-in OCR .NET d’Aspose extrait du texte à partir de PDF numérisés ou les convertit en documents interrogeables, préservant les images originales. Les algorithmes avancés identifient avec précision le texte et les structures de tableau, en faisant votre solution privilégiée pour l’extraction de texte PDF.
OcrInput
.Obtenez les fichiers d’assemblage respectifs à partir des téléchargements ou récupérez le package depuis NuGet pour ajouter Aspose.OCR directement à votre espace de travail.
Par défaut, Aspose.OCR peut automatiquement reconnaître un large éventail de langues basées sur l’alphabet latin étendu. Cependant, fournir une langue spécifique peut considérablement améliorer la précision de la reconnaissance. Spécifiez explicitement la langue lors de la reconnaissance de textes cyrilliques, chinois et hindi.
Aspose.OCR prend en charge les formats populaires des scanners ou des appareils photo, y compris PDF, JPEG, PNG et TIFF. Les résultats de reconnaissance sont renvoyés sous forme de texte brut, HTML, Microsoft Word, PDF, JSON et XML.
Bonne qualité d’image est crucial pour une OCR précise. Utilisez un scanner ou un appareil photo haute résolution. La bibliothèque inclut des filtres avancés pour améliorer automatiquement la qualité de l’image avant la reconnaissance.
Explorez notre documentation en ligne ou visitez le dépôt Aspose.OCR pour .NET pour des exemples de code et des projets de démonstration.