Simplifiez l’extraction de texte à partir de documents PDF avec le plugin Aspose.PDF Text Extractor pour .NET. Cet outil polyvalent offre trois modes de fonctionnement : pur, brut et simple, offrant flexibilité et commodité pour les tâches d’extraction de texte dans les applications .NET.
TextExtractorOptions
TextExtractorOptions.AddDataSource
.TextExtractorOptions.Process
et assigner le résultat à ResultContainer
.ResultContainer.ResultCollection
.Obtenez les fichiers d’assemblage depuis les téléchargements ou récupérez le package depuis NuGet pour ajouter Aspose.PDF
directement à votre espace de travail.
TextExtractor
& TextExtractorOptions
TextExtractorOptions.AddDataSource
.TextExtractor.Process
avec une instance de TextExtractorOptions
en tant que paramètreResultContainer
.ResultContainer.ResultCollection
.Pure
permet l’extraction de texte à partir d’un fichier PDF avec diverses procédures de mise en forme, incorporant des positions relatives et introduisant des espaces supplémentaires pour aligner le texte sur la largeur de la page.Brut
extrait le texte du fichier PDF sans appliquer de mise en formeSimple
extrait le texte du fichier PDF en tenant compte du positionnement relatif des fragments de texte, mais contrairement au mode “Pur”, il n’ajoute pas d’espace supplémentaire.Aspose.PDF Text Extractor for .NET est un plugin conçu pour les applications .NET, offrant l’extraction de texte à partir de documents PDF avec trois modes de fonctionnement: Pur, Brut et Simple. Il se décline en mode ‘Brut’ par défaut, prend en charge diverses options d’entrée et de sortie, permet le traitement simultané de plusieurs fichiers PDF, et offre une personnalisation pour les développeurs, en faisant une solution pratique pour l’extraction de texte au sein des environnements .NET.
Aspose.PDF pour .NET est une API .NET robuste pour une large gamme de tâches PDF, y compris la génération de documents, la compression, la création de tables et des fonctionnalités avancées telles que l’importation et l’exportation de données PDF. En revanche, Aspose.PDF Text Extractor pour .NET est un plugin spécialisé axé uniquement sur l’extraction de texte à partir de documents PDF, mettant l’accent sur les capacités d’extraction de texte.