.NETを使用してPDFからテキストを抽出する方法

プロジェクトにAspose.PDFを参照してください
ライセンスキーを設定する
TextExtractorOptions のインスタンスを作成します。
TextExtractorOptions.AddDataSourceを使用して入力PDFドキュメントを追加します。
TextExtractorOptions.Process を呼び出して結果を ResultContainer に代入します。
抽出されたテキストには ResultContainer.ResultCollection を使用してアクセスします。

PDFテキスト抽出ツールの使い方

downloadsからアセンブリファイルを取得するか、NuGetからパッケージを取得してAspose.PDFを直接ワークスペースに追加してください。

サポートされているオペレーティングシステムは、Windows 7-11、Windows Server 2003-2022、macOS（10.12以上）、およびLinuxです。
サポートされているフレームワークは4.0から7.0までです。
さまざまなMicrosoft Visual Studioバージョンと互換性があります。

複数のPDFからテキストを抽出する方法

プロジェクトで Aspose.PDF for .NET を参照してください
ライセンスキーを設定する
TextExtractorおよびTextExtractorOptionsのインスタンスを作成します。
TextExtractorOptions.AddDataSourceを使用して入力PDFドキュメントを追加します。
TextExtractorOptions のインスタンスをパラメータとして TextExtractor.Process を呼び出します。
ResultContainer のインスタンスに結果を取得します。
以下のテキストを翻訳します：- ‘ResultContainer.ResultCollection’を使用して抽出されたテキストにアクセスします。

テキストエクストラクターの動作モード

Pure オプションは、相対的な位置を組み込み、追加のスペースを導入して、ページの幅にテキストを整列させる、さまざまな書式手順を使用して PDF ファイルからテキストを抽出する機能を有効にします。
PDFファイルからテキストを抽出し、書式を適用せずに抽出します。
「プレーン」モードは、テキスト断片の相対位置を考慮してPDFファイルからテキストを抽出しますが、「ピュア」モードとは異なり、余分なスペースを追加しません。

よくある質問

Aspose.PDF Text Extractor for .NETは何をしますか？

Aspose.PDF Text Extractor for .NETは、.NETアプリケーション向けに設計されたプラグインであり、PDFドキュメントからテキストを抽出する3つの操作モードを提供します。プレーンモード、ロウモード、およびプレーンモードがあります。デフォルトは「Raw」モードであり、多様な入力および出力オプションをサポートし、複数のPDFファイルを同時に処理することができ、開発者向けにカスタマイズが可能です。.NET環境内でのテキスト抽出のための便利なソリューションとなっています。

Aspose.PDF for .NETとAspose.PDFテキスト抽出機能for.NETの違いは何ですか？

Aspose.PDF for .NETは、ドキュメントの生成、圧縮、表の作成など、さまざまなPDFタスクに対応した堅牢な.NET APIです。 Aspose.PDF Text Extractor for .NETは、PDF文書からのテキスト抽出に特化したプラグインであり、テキスト抽出機能を重視しています。

.NET用のPDFテキスト抽出ツール

Aspose.PDF .NET プラグインを使用して、PDF ドキュメントから純粋な、生の、またはプレーンテキストを抽出します。

Aspose.PDF
for .NET

.NET用のテキストエクストラクタ

.NETを使用してPDFからテキストを抽出する方法

PDFテキスト抽出ツールの使い方

複数のPDFからテキストを抽出する方法

テキストエクストラクターの動作モード

よくある質問

Aspose.PDF Text Extractor for .NETは何をしますか？

Aspose.PDF for .NETとAspose.PDFテキスト抽出機能for.NETの違いは何ですか？

.NET用のPDFテキスト抽出ツール

Aspose.PDF .NET プラグインを使用して、PDF ドキュメントから純粋な、生の、またはプレーンテキストを抽出します。

Aspose.PDFfor .NET

.NET用のテキストエクストラクタ

.NETを使用してPDFからテキストを抽出する方法

PDFテキスト抽出ツールの使い方

複数のPDFからテキストを抽出する方法

テキストエクストラクターの動作モード

よくある質問

Aspose.PDF Text Extractor for .NETは何をしますか？

Aspose.PDF for .NETとAspose.PDFテキスト抽出機能for.NETの違いは何ですか？

Aspose.PDF
for .NET