Το πρόσθετο Aspose.OCR για το .NET εξάγει κείμενο από σαρωμένα PDF ή τα μετατρέπει σε αναζητήσιμα έγγραφα, διατηρώντας τις αρχικές εικόνες. Οι προηγμένοι αλγόριθμοι αναγνωρίζουν ακριβώς κείμενο και δομές πινάκων, κάνοντάς το ένα αξιόπιστο εργαλείο για την εξαγωγή κειμένου από PDF.
OcrInput
.Λάβετε τα αντίστοιχα αρχεία συναρμολόγησης από τα downloads ή ανακτήστε το πακέτο από τον NuGet για να προσθέσετε το Aspose.OCR απευθείας στον χώρο εργασίας.
Από προεπιλογή, το Aspose.OCR μπορεί να αναγνωρίσει αυτόματα μια ευρεία γκάμα γλωσσών βασισμένη στο Επεκταμένο Λατινικό αλφάβητο. Ωστόσο, η παροχή μιας συγκεκριμένης γλώσσας μπορεί να βελτιώσει σημαντικά την ακρίβεια αναγνώρισης. Καθορίστε ρητά τη γλώσσα κατά την αναγνώριση κειμένων σε Κυριλλική, Κινέζικη και Χίντι.
Το Aspose.OCR υποστηρίζει δημοφιλείς μορφές από σαρωτές ή φωτογραφικές μηχανές, συμπεριλαμβανομένων των PDF, JPEG, PNG και TIFF. Τα αποτελέσματα αναγνώρισης επιστρέφονται σε απλό κείμενο, HTML, Microsoft Word, PDF, JSON και XML.
Η καλή ποιότητα εικόνας είναι κρίσιμη για την ακριβή OCR. Χρησιμοποιήστε ένα σαρωτή ή μια κάμερα υψηλής ανάλυσης. Η βιβλιοθήκη περιλαμβάνει προηγμένα φίλτρα για την αυτόματη βελτίωση της ποιότητας της εικόνας πριν από την αναγνώριση.
Εξερευνήστε την online τεκμηρίωσή μας ή επισκεφθείτε το Αποθετήριο Aspose.OCR για .NET για δείγματα κώδικα και προβολή έργων.