Aspose.OCR’s .NET OCR-Plug-In extrahiert Text aus gescannten PDFs oder wandelt sie in durchsuchbare Dokumente um und erhält dabei die originalen Bilder. Fortgeschrittene Algorithmen identifizieren Text und Tabellenstrukturen präzise, wodurch es zur idealen Lösung für die Extraktion von PDF-Text wird.
OcrInput
-Objekt.Holen Sie sich die entsprechenden Assembly-Dateien von den Downloads oder holen Sie das Paket von NuGet ab, um Aspose.OCR direkt zu Ihrem Arbeitsbereich hinzuzufügen.
Standardmäßig kann Aspose.OCR automatisch eine Vielzahl von Sprachen auf der Grundlage des erweiterten lateinischen Alphabets erkennen. Das explizite Angeben einer bestimmten Sprache kann jedoch die Erkennungsgenauigkeit erheblich verbessern. Geben Sie die Sprache explizit an, wenn Sie kyrillische, chinesische und hindi Texte erkennen möchten.
Aspose.OCR unterstützt beliebte Formate von Scannern oder Kameras, einschließlich PDF, JPEG, PNG und TIFF. Erkennungsergebnisse werden in Klartext, HTML, Microsoft Word, PDF, JSON und XML zurückgegeben.
Gute Bildqualität ist entscheidend für eine präzise OCR. Verwenden Sie einen Scanner oder eine Kamera mit hoher Auflösung. Die Bibliothek enthält fortschrittliche Filter, um die Bildqualität vor der Erkennung automatisch zu verbessern.
Erkunden Sie unsere Online-Dokumentation oder besuchen Sie das Aspose.OCR für .NET Repository für Codebeispiele und Showcase-Projekte.