1. Produk
  2.   Aspose.PDF
  3.   .NET
  4.   Ekstraktor Teks

Pengekstrak Teks PDF untuk .NET

Ekstrak teks murni, mentah, atau polos dari dokumen PDF dengan Plugin Aspose.PDF .NET.

Pengekstrak Teks untuk .NET

Mempermudah ekstraksi teks dari dokumen PDF dengan plugin Aspose.PDF Text Extractor untuk .NET. Alat serbaguna ini menawarkan tiga mode operasi: murni, mentah, dan biasa, memberikan fleksibilitas dan kenyamanan untuk tugas ekstraksi teks di aplikasi .NET.

Cara Mengekstrak Teks dari PDF melalui .NET

  • Merujuk Aspose.PDF di proyek Anda
  • Atur kunci lisensi Anda
  • Buatlah instance dari TextExtractorOptions
  • Tambahkan dokumen PDF masukan menggunakan TextExtractorOptions.AddDataSource
  • Panggil TextExtractorOptions.Process dan berikan hasilnya ke ResultContainer.
  • Akses teks yang diekstrak menggunakan ResultContainer.ResultCollection

Memulai dengan PDF Text Extractor

Dapatkan file rapat dari unduhan atau ambil paket dari NuGet untuk menambahkan Aspose.PDF langsung ke ruang kerja Anda.

  • Sistem operasi yang didukung termasuk Windows 7-11, dan Windows Server 2003-2022, macOS (10.12+), dan Linux
  • Kerangka kerja yang didukung mulai dari 4.0 hingga 7.0
  • Kompatibel dengan berbagai versi Microsoft Visual Studio


Cara Ekstrak Teks dari Beberapa PDF

  • Merujuk Aspose.PDF untuk .NET dalam proyek Anda
  • Atur kunci lisensi Anda
  • Buat instance dari TextExtractor & TextExtractorOptions
  • Tambahkan dokumen PDF masukan menggunakan TextExtractorOptions.AddDataSource
  • Panggil TextExtractor.Process dengan sebuah instance dari TextExtractorOptions sebagai parameter
  • Dapatkan hasil ke dalam sebuah instance dari ResultContainer.
  • Akses teks yang diekstrak menggunakan ResultContainer.ResultCollection

Mode Operasi Penarik Teks

  • Opsi Murni memungkinkan ekstraksi teks dari file PDF dengan berbagai prosedur pemformatan, menggabungkan posisi relatif, dan memperkenalkan spasi tambahan untuk meluruskan teks ke lebar halaman
  • mode Raw mengekstrak teks dari file PDF tanpa menerapkan format apapun
  • Mode Plain mengekstrak teks dari file PDF, mempertimbangkan posisi relatif fragmen teks, tetapi tidak seperti mode “Pure”, tidak menambahkan ruang ekstra.


Pertanyaan yang Sering Diajukan

Apa yang dilakukan Aspose.PDF Text Extractor untuk .NET?

Aspose.PDF Text Extractor untuk .NET adalah plugin yang dirancang untuk aplikasi .NET, menawarkan ekstraksi teks dari dokumen PDF dengan tiga mode operasi; Murni, Mentah, dan Polos. Ini default ke mode ‘Mentah’, mendukung opsi input dan output yang beragam, memungkinkan pemrosesan simultan dari beberapa file PDF, dan menyediakan penyesuaian untuk pengembang, sehingga menjadi solusi yang nyaman untuk ekstraksi teks dalam lingkungan .NET.

Apa bedanya antara Aspose.PDF untuk .NET & Ekstraktor Teks Aspose.PDF untuk .NET?

Aspose.PDF untuk .NET adalah API .NET yang tangguh untuk berbagai tugas PDF, termasuk pembuatan dokumen, kompresi, pembuatan tabel, dan fitur canggih seperti impor dan ekspor data PDF. Di sisi lain, Aspose.PDF Text Extractor untuk .NET adalah plugin khusus yang fokus hanya pada mengekstrak teks dari dokumen PDF, menekankan kemampuan ekstraksi teks.

 Indonesia