Trình OCR của Aspose.OCR trích xuất văn bản từ các tệp PDF quét hoặc chuyển đổi chúng thành tài liệu có thể tìm kiếm, bảo toàn hình ảnh gốc. Các thuật toán tiên tiến xác định văn bản và cấu trúc bảng một cách chính xác, biến nó thành giải pháp ưa thích của bạn cho việc trích xuất văn bản từ PDF.
OcrInput
.Tải tệp tin hợp của ứng dụng tại downloads hoặc lấy gói từ NuGet để thêm Aspose.OCR trực tiếp vào không gian làm việc của bạn.
Mặc định, Aspose.OCR có thể tự động nhận dạng một loạt các ngôn ngữ dựa trên bảng chữ cái Latin mở rộng. Tuy nhiên, cung cấp một ngôn ngữ cụ thể có thể cải thiện đáng kể độ chính xác của việc nhận dạng. Chỉ định rõ ngôn ngữ khi nhận dạng văn bản chữ Cyrillic, tiếng Trung và tiếng Hin-đi.
Aspose.OCR hỗ trợ các định dạng phổ biến từ máy quét hoặc máy ảnh, bao gồm PDF, JPEG, PNG và TIFF. Kết quả nhận dạng được trả về trong văn bản thô, HTML, Microsoft Word, PDF, JSON và XML.
Chất lượng hình ảnh tốt rất quan trọng cho việc OCR chính xác. Sử dụng máy quét hoặc máy ảnh có độ phân giải cao. Thư viện bao gồm bộ lọc tiên tiến để tự động cải thiện chất lượng hình ảnh trước khi nhận dạng.
Khám phá tài liệu trực tuyến của chúng tôi hoặc truy cập vào kho lưu trữ Aspose.OCR cho .NET để xem mẫu mã và các dự án trưng bày.