1. 製品
  2.   Aspose.PDF
  3.   .NET
  4.   テキストエクス

.NET用のPDFテキスト抽出ツール

Aspose.PDF .NET プラグインを使用して、PDF ドキュメントから純粋な、生の、またはプレーンテキストを抽出します。

.NET用のテキストエクストラクタ

PDFドキュメントからテキストを抽出することを容易にする、Aspose.PDF Text Extractor for .NETプラグイン。この多機能なツールは、純粋、生、およびプレーンの3つの操作モードを提供し、.NETアプリケーションでのテキスト抽出タスクに柔軟性と利便性を提供します。

.NETを使用してPDFからテキストを抽出する方法

  • プロジェクトにAspose.PDFを参照してください
  • ライセンスキーを設定する
  • TextExtractorOptions のインスタンスを作成します。
  • TextExtractorOptions.AddDataSourceを使用して入力PDFドキュメントを追加します。
  • TextExtractorOptions.Process を呼び出して結果を ResultContainer に代入します。
  • 抽出されたテキストには ResultContainer.ResultCollection を使用してアクセスします。

PDFテキスト抽出ツールの使い方

downloadsからアセンブリファイルを取得するか、NuGetからパッケージを取得してAspose.PDFを直接ワークスペースに追加してください。

  • サポートされているオペレーティングシステムは、Windows 7-11、Windows Server 2003-2022、macOS(10.12以上)、およびLinuxです。
  • サポートされているフレームワークは4.0から7.0までです。
  • さまざまなMicrosoft Visual Studioバージョンと互換性があります。


複数のPDFからテキストを抽出する方法

  • プロジェクトで Aspose.PDF for .NET を参照してください
  • ライセンスキーを設定する
  • TextExtractorおよびTextExtractorOptionsのインスタンスを作成します。
  • TextExtractorOptions.AddDataSourceを使用して入力PDFドキュメントを追加します。
  • TextExtractorOptions のインスタンスをパラメータとして TextExtractor.Process を呼び出します。
  • ResultContainer のインスタンスに結果を取得します。
  • 以下のテキストを翻訳します:- ‘ResultContainer.ResultCollection’を使用して抽出されたテキストにアクセスします。

テキストエクストラクターの動作モード

  • Pure オプション は、相対的な位置を組み込み、追加のスペースを導入して、ページの幅にテキストを整列させる、さまざまな書式手順を使用して PDF ファイルからテキストを抽出する機能を有効にします。
  • PDFファイルからテキストを抽出し、書式を適用せずに抽出します。
  • 「プレーン」モードは、テキスト断片の相対位置を考慮してPDFファイルからテキストを抽出しますが、「ピュア」モードとは異なり、余分なスペースを追加しません。


よくある質問

Aspose.PDF Text Extractor for .NETは何をしますか?

Aspose.PDF Text Extractor for .NETは、.NETアプリケーション向けに設計されたプラグインであり、PDFドキュメントからテキストを抽出する3つの操作モードを提供します。 プレーンモード、ロウモード、およびプレーンモードがあります。 デフォルトは「Raw」モードであり、多様な入力および出力オプションをサポートし、複数のPDFファイルを同時に処理することができ、開発者向けにカスタマイズが可能です。.NET環境内でのテキスト抽出のための便利なソリューションとなっています。

Aspose.PDF for .NETとAspose.PDFテキスト抽出機能for.NETの違いは何ですか?

Aspose.PDF for .NETは、ドキュメントの生成、圧縮、表の作成など、さまざまなPDFタスクに対応した堅牢な.NET APIです。 Aspose.PDF Text Extractor for .NETは、PDF文書からのテキスト抽出に特化したプラグインであり、テキスト抽出機能を重視しています。

 日本語