1. Produkte
  2.   Aspose.OCR
  3.   .NET
  4.   Gescanntes PDF in Text

Gescanntes PDF in Text OCR

Extrahieren Sie Text aus gescannten PDFs oder konvertieren Sie sie in durchsuchbare Dokumente. Lesen Sie jedes Layout und jeden Stil, definieren Sie genau die Struktur von Text und Tabellen. Bewahren Sie Originalbilder im Hintergrund für den Inhaltserhalt. Aspose.OCR - Ihre Lösung für die Extraktion von PDF-Text für .NET.

Aspose.OCR Gescannte PDF in Text für .NET

Aspose.OCR’s .NET OCR-Plug-In extrahiert Text aus gescannten PDFs oder wandelt sie in durchsuchbare Dokumente um und erhält dabei die originalen Bilder. Fortgeschrittene Algorithmen identifizieren Text und Tabellenstrukturen präzise, wodurch es zur idealen Lösung für die Extraktion von PDF-Text wird.

Wie man das Scanned PDF-zu-Text-Plugin verwendet

  • Installieren Sie das Aspose.OCR-Paket von NuGet oder einer lokal heruntergeladenen Datei.
  • Legen Sie Ihre Lizenzschlüssel fest.
  • Laden Sie ein gescanntes Bild in das OcrInput-Objekt.
  • Erstellen Sie eine Instanz des Aspose.OCR-Erkennungsmotors.
  • Extrahiere den Text aus einem gescannten PDF.
  • Geben Sie den erkannten Text aus oder speichern Sie ihn in einer Datei.

Erhalten Sie den Plugin für gescannte PDF in Text Konverter.

Holen Sie sich die entsprechenden Assembly-Dateien von den Downloads oder holen Sie das Paket von NuGet ab, um Aspose.OCR direkt zu Ihrem Arbeitsbereich hinzuzufügen.

  • Kompatibel mit Microsoft Windows oder einem kompatiblen Betriebssystem mit .NET Standard 2.0
  • Erfordert eine Entwicklungsumgebung wie Microsoft Visual Studio.


Häufig gestellte Fragen

Ist die Angabe einer Sprache erforderlich?

Standardmäßig kann Aspose.OCR automatisch eine Vielzahl von Sprachen auf der Grundlage des erweiterten lateinischen Alphabets erkennen. Das explizite Angeben einer bestimmten Sprache kann jedoch die Erkennungsgenauigkeit erheblich verbessern. Geben Sie die Sprache explizit an, wenn Sie kyrillische, chinesische und hindi Texte erkennen möchten.

Welche Dateiformate werden unterstützt?

Aspose.OCR unterstützt beliebte Formate von Scannern oder Kameras, einschließlich PDF, JPEG, PNG und TIFF. Erkennungsergebnisse werden in Klartext, HTML, Microsoft Word, PDF, JSON und XML zurückgegeben.

Wie erreicht man das beste Ergebnis?

Gute Bildqualität ist entscheidend für eine präzise OCR. Verwenden Sie einen Scanner oder eine Kamera mit hoher Auflösung. Die Bibliothek enthält fortschrittliche Filter, um die Bildqualität vor der Erkennung automatisch zu verbessern.

Wo finde ich weitere Informationen und Beispiele?

Erkunden Sie unsere Online-Dokumentation oder besuchen Sie das Aspose.OCR für .NET Repository für Codebeispiele und Showcase-Projekte.

  

Support und Lernressourcen

  
 Deutsch