1. Sản Phẩm
  2.   Aspose.OCR
  3.   .NET
  4.   Chuyển đổi PDF quét thành Văn bản

Chuyển đổi PDF quét sang Văn bản OCR

Trích xuất văn bản từ các tài liệu PDF đã quét hoặc chuyển đổi chúng thành tài liệu có thể tìm kiếm. Đọc bất kỳ bố cục và kiểu dáng nào, xác định cấu trúc văn bản và bảng một cách chính xác. Bảo toàn hình ảnh gốc trong nền để giữ nội dung. Aspose.OCR - Giải pháp trích xuất văn bản PDF của bạn cho .NET.

Aspose.OCR Chuyển đổi PDF quét sang Văn bản cho .NET

Trình OCR của Aspose.OCR trích xuất văn bản từ các tệp PDF quét hoặc chuyển đổi chúng thành tài liệu có thể tìm kiếm, bảo toàn hình ảnh gốc. Các thuật toán tiên tiến xác định văn bản và cấu trúc bảng một cách chính xác, biến nó thành giải pháp ưa thích của bạn cho việc trích xuất văn bản từ PDF.

Cách sử dụng Plugin PDF đã quét thành văn bản

  • Cài đặt gói Aspose.OCR từ NuGet hoặc một tệp đã tải về cục bộ.
  • Đặt khóa cấp phép của bạn.
  • Tải một hình ảnh đã quét vào đối tượng OcrInput.
  • Tạo một phiên bản của động cơ nhận diện Aspose.OCR.
  • Trích xuất văn bản từ PDF được quét.
  • Đầu ra văn bản được nhận diện hoặc lưu vào một tệp.

Nhận Plugin Chuyển đổi PDF quét thành văn bản

Tải tệp tin hợp của ứng dụng tại downloads hoặc lấy gói từ NuGet để thêm Aspose.OCR trực tiếp vào không gian làm việc của bạn.

  • Tương thích với Microsoft Windows hoặc một hệ điều hành tương thích với .NET Standard 2.0
  • Yêu cầu một môi trường phát triển như Microsoft Visual Studio.


Câu Hỏi Thường Gặp

Có cần phải chỉ định một ngôn ngữ không?

Mặc định, Aspose.OCR có thể tự động nhận dạng một loạt các ngôn ngữ dựa trên bảng chữ cái Latin mở rộng. Tuy nhiên, cung cấp một ngôn ngữ cụ thể có thể cải thiện đáng kể độ chính xác của việc nhận dạng. Chỉ định rõ ngôn ngữ khi nhận dạng văn bản chữ Cyrillic, tiếng Trung và tiếng Hin-đi.

Các định dạng tệp nào được hỗ trợ?

Aspose.OCR hỗ trợ các định dạng phổ biến từ máy quét hoặc máy ảnh, bao gồm PDF, JPEG, PNG và TIFF. Kết quả nhận dạng được trả về trong văn bản thô, HTML, Microsoft Word, PDF, JSON và XML.

Cách đạt được kết quả tốt nhất là gì?

Chất lượng hình ảnh tốt rất quan trọng cho việc OCR chính xác. Sử dụng máy quét hoặc máy ảnh có độ phân giải cao. Thư viện bao gồm bộ lọc tiên tiến để tự động cải thiện chất lượng hình ảnh trước khi nhận dạng.

Bạn có thể tìm thêm thông tin và ví dụ ở đâu?

Khám phá tài liệu trực tuyến của chúng tôi hoặc truy cập vào kho lưu trữ Aspose.OCR cho .NET để xem mẫu mã và các dự án trưng bày.

  

Tài Nguyên Hỗ Trợ và Học Tập

  
 Tiếng Việt