Mempermudah ekstraksi teks dari dokumen PDF dengan plugin Aspose.PDF Text Extractor untuk .NET. Alat serbaguna ini menawarkan tiga mode operasi: murni, mentah, dan biasa, memberikan fleksibilitas dan kenyamanan untuk tugas ekstraksi teks di aplikasi .NET.
TextExtractorOptions
TextExtractorOptions.AddDataSource
TextExtractorOptions.Process
dan berikan hasilnya ke ResultContainer
.ResultContainer.ResultCollection
Dapatkan file rapat dari unduhan atau ambil paket dari NuGet untuk menambahkan Aspose.PDF
langsung ke ruang kerja Anda.
TextExtractor
& TextExtractorOptions
TextExtractorOptions.AddDataSource
TextExtractor.Process
dengan sebuah instance dari TextExtractorOptions
sebagai parameterResultContainer
.ResultContainer.ResultCollection
Murni
memungkinkan ekstraksi teks dari file PDF dengan berbagai prosedur pemformatan, menggabungkan posisi relatif, dan memperkenalkan spasi tambahan untuk meluruskan teks ke lebar halamanRaw
mengekstrak teks dari file PDF tanpa menerapkan format apapunPlain
mengekstrak teks dari file PDF, mempertimbangkan posisi relatif fragmen teks, tetapi tidak seperti mode “Pure”, tidak menambahkan ruang ekstra.Aspose.PDF Text Extractor untuk .NET adalah plugin yang dirancang untuk aplikasi .NET, menawarkan ekstraksi teks dari dokumen PDF dengan tiga mode operasi; Murni, Mentah, dan Polos. Ini default ke mode ‘Mentah’, mendukung opsi input dan output yang beragam, memungkinkan pemrosesan simultan dari beberapa file PDF, dan menyediakan penyesuaian untuk pengembang, sehingga menjadi solusi yang nyaman untuk ekstraksi teks dalam lingkungan .NET.
Aspose.PDF untuk .NET adalah API .NET yang tangguh untuk berbagai tugas PDF, termasuk pembuatan dokumen, kompresi, pembuatan tabel, dan fitur canggih seperti impor dan ekspor data PDF. Di sisi lain, Aspose.PDF Text Extractor untuk .NET adalah plugin khusus yang fokus hanya pada mengekstrak teks dari dokumen PDF, menekankan kemampuan ekstraksi teks.