Simplifique a extração de texto de documentos PDF com o plug-in Aspose.PDF Text Extractor para .NET. Esta ferramenta versátil oferece três modos de operação: puro, bruto e simples, proporcionando flexibilidade e conveniência para tarefas de extração de texto em aplicações .NET.
TextExtractorOptions
.TextExtractorOptions.AddDataSource
.TextExtractorOptions.Process
e atribua o resultado a ResultContainer
ResultContainer.ResultCollection
.Obtenha os arquivos de montagem dos downloads ou baixe o pacote do NuGet para adicionar o Aspose.PDF
diretamente ao seu ambiente de trabalho.
TextExtractor
e TextExtractorOptions
.TextExtractorOptions.AddDataSource
.TextExtractor.Process
com uma instância de TextExtractorOptions
como parâmetro.ResultContainer
.ResultContainer.ResultCollection
.Pure
permite a extração de texto de um arquivo PDF com diversos procedimentos de formatação, incorporando posições relativas e introduzindo espaços adicionais para alinhar o texto à largura da página.Raw
extrai texto do arquivo PDF sem aplicar formatação alguma.Simples
extrai texto do arquivo PDF, levando em conta a posição relativa dos fragmentos de texto, mas ao contrário do modo “Puro”, ele não adiciona espaço extra.O Aspose.PDF Text Extractor para .NET é um plugin projetado para aplicações .NET, oferecendo extração de texto de documentos PDF com três modos de operação; Puro, Bruto e Simples. Ele padrão é o modo ‘Bruto’, suporta opções de entrada e saída versáteis, permite o processamento simultâneo de vários arquivos PDF e fornece personalização para desenvolvedores, tornando-o uma solução conveniente para extração de texto em ambientes .NET.
Aspose.PDF para .NET é uma API robusta para uma ampla gama de tarefas em PDF, incluindo geração de documentos, compressão, criação de tabelas e recursos avançados como importação e exportação de dados em PDF. Por outro lado, o Aspose.PDF Text Extractor para .NET é um plugin especializado focado exclusivamente em extrair texto de documentos PDF, enfatizando as capacidades de extração de texto.