日本語
  1. 製品
  2.   Aspose.OCR
  3.   スキャンされたPDFをテキストに変換

PDF スキャン済みのテキストを OCR で変換

スキャンされたPDFからテキストを抽出するか、それらを検索可能なドキュメントに変換します。どんなレイアウトやスタイルも読み取り、テキストやテーブルの構造を正確に定義します。コンテンツの保持のために背景にオリジナルの画像を保持します。Aspose.OCR - .NET向けのPDFテキスト抽出ソリューション。

Aspose.OCRは、.NET向けのスキャンされたPDFをテキストに変換します。

Aspose.OCRの.NET OCRプラグインは、スキャンされたPDFからテキストを抽出したり、元の画像を保持しながら検索可能なドキュメントに変換したりします。高度なアルゴリズムがテキストや表の構造を正確に識別し、PDFテキストの抽出に最適なソリューションとなります。

スキャンされたPDFをテキストプラグインとして使用する方法

  • NuGetからAspose.OCRパッケージをインストールするか、ローカルにダウンロードしたファイルからインストールします。
  • ライセンスキーを設定する.
  • OcrInput`オブジェクトにスキャンされた画像を読み込みます。
  • Aspose.OCR 認識エンジンのインスタンスを作成します。
  • スキャンされたPDFからテキストを抽出します。
  • 認識されたテキストを出力するか、ファイルに保存します。

スキャンされたPDFをテキストに変換するプラグインを入手してください。

downloads](https://releases.aspose.com/ocr/net/)またはNuGetから該当するアセンブリファイルを取得するか、Aspose.OCRをワークスペースに直接追加するためにパッケージを取得してください。

  • Microsoft Windowsと.NET Standard 2.0と互換性があります。
  • Microsoft Visual Studioのような開発環境が必要です。


追加機能

  • 各ページからテキストを抽出するためのマルチページPDFのサポート。
  • 精度向上のためのカスタマイズ可能なテキスト認識設定。
  • 高度な文書処理のための他のAsposeライブラリとの統合。

システム要件

  • プラグインを実行するには、.NET Standard 2.0以上が必要です。
  • Microsoft Windowsオペレーティングシステムに対応しています。
  • 最適なパフォーマンスのための十分なメモリとディスクスペース。


よくある質問

言語を指定する必要がありますか?

デフォルトでは、Aspose.OCR は拡張ラテンアルファベットに基づいて幅広い言語を自動的に認識できます。ただし、特定の言語を指定すると、認識の精度が大幅に向上します。キリル、中国語、ヒンディー語のテキストを認識する際には、明示的に言語を指定してください。

サポートされているファイル形式は何ですか?

Aspose.OCRは、PDF、JPEG、PNG、TIFFなどの一般的な形式をスキャナーやカメラからサポートしています。認識結果は、プレーンテキスト、HTML、Microsoft Word、PDF、JSON、およびXMLで返されます。

ベストな結果を得る方法は何ですか?

良質な画像は正確なOCRにとって重要です。スキャナーまたは高解像度カメラを使用してください。ライブラリには、認識前に画質を自動的に向上させる高度なフィルターが含まれています。

より多くの情報や例を見つける場所はどこですか?

オンラインドキュメント](https://docs.aspose.com/ocr/net/)をご覧いただくか、コードサンプルやショーケースプロジェクトをご覧いただくためにAspose.OCR for .NETリポジトリをご覧ください。

  

サポートと学習リソース

  
 日本語