Le plug-in OCR Aspose.OCR pour .NET extrait du texte des images contenant une grande quantité de texte structuré, tel que des contrats numérisés, des accords, des pages de livres, des articles, des journaux, et bien plus. Le moteur de reconnaissance détermine avec précision la structure du document, vous permettant de travailler avec des mises en page complexes, y compris du texte en plusieurs colonnes.
OcrInput
.Obtenez les fichiers d’assemblage respectifs à partir des téléchargements ou récupérez le package depuis NuGet pour ajouter Aspose.OCR directement à votre espace de travail.
Aspose.OCR peut être intégré aux systèmes de gestion de documents pour l’extraction automatisée de texte.
Par défaut, Aspose.OCR peut automatiquement reconnaître un large éventail de langues basées sur l’alphabet latin étendu. Cependant, fournir une langue spécifique peut considérablement améliorer la précision de la reconnaissance. Spécifiez explicitement la langue lors de la reconnaissance de textes cyrilliques, chinois et hindi.
Aspose.OCR prend en charge les formats populaires des scanners ou des appareils photo, y compris PDF, JPEG, PNG et TIFF. Les résultats de reconnaissance sont renvoyés sous forme de texte brut, HTML, Microsoft Word, PDF, JSON et XML.
Bonne qualité d’image est crucial pour une OCR précise. Utilisez un scanner ou un appareil photo haute résolution. La bibliothèque inclut des filtres avancés pour améliorer automatiquement la qualité de l’image avant la reconnaissance.
Explorez notre documentation en ligne ou visitez le dépôt Aspose.OCR pour .NET pour des exemples de code et des projets de démonstration.