El complemento OCR de Aspose.OCR para .NET extrae texto de PDFs escaneados o los convierte en documentos buscables, preservando las imágenes originales. Los algoritmos avanzados identifican con precisión las estructuras de texto y tablas, convirtiéndolo en tu solución principal para la extracción de texto de PDFs.
OcrInput
.Obtenga los archivos de ensamblaje respectivos desde los descargas o adquiera el paquete desde NuGet para agregar Aspose.OCR directamente a su espacio de trabajo.
De forma predeterminada, Aspose.OCR puede reconocer automáticamente una amplia gama de idiomas basados en el alfabeto latino extendido. Sin embargo, especificar un idioma específico puede mejorar significativamente la precisión del reconocimiento. Especifique explícitamente el idioma al reconocer textos en cirílico, chino e hindi.
Aspose.OCR admite formatos populares de escáneres o cámaras, incluidos PDF, JPEG, PNG y TIFF. Los resultados de reconocimiento se devuelven en texto plano, HTML, Microsoft Word, PDF, JSON y XML.
Buena calidad de imagen es crucial para una OCR precisa. Utilice un escáner o una cámara de alta resolución. La biblioteca incluye filtros avanzados para mejorar automáticamente la calidad de imagen antes de la reconocimiento.
Explora nuestra documentación en línea o visita el repositorio de Aspose.OCR para .NET para ver ejemplos de código y proyectos de muestra.