Українська
  1. Продукти
  2.   Aspose.OCR
  3.   Сканований PDF у текст

Сканований PDF до тексту OCR

Витягніть текст з відсканованих PDF або перетворіть їх на пошукові документи. Читання будь-якого макету та стилю, точне визначення структури тексту та таблиць. Збережіть оригінальні зображення на задньому плані для збереження контенту. Aspose.OCR - Ваше рішення для видобування тексту з PDF для .NET.

Aspose.OCR Сканований PDF в текст для .NET

Aspose.OCR NET OCR плагін витягує текст з сканованих PDF-файлів або конвертує їх у документи, які можна шукати, зберігаючи оригінальні зображення. Покращені алгоритми точно визначають текст і структури таблиць, що робить його вашим вибором для видобутку тексту з PDF.

Як використовувати плагін для перетворення зісканованого PDF у текст

  • Встановіть пакет Aspose.OCR з NuGet або локально завантаженого файлу.
  • Встановіть свої ліцензійні ключі.
  • Завантажте отсканований зображення в об’єкт OcrInput.
  • Створіть екземпляр двигуна визначення Aspose.OCR.
  • Витягніть текст з відсканованого PDF.
  • Виведіть визнаний текст або збережіть його у файл.

Отримайте модуль перетворення отсканованого PDF-файлу на текст.

Отримайте відповідні файли збірки з скачувань або встановіть пакет з NuGet для додавання Aspose.OCR безпосередньо у ваше робоче оточення.

  • Сумісний з Microsoft Windows або сумісною ОС з .NET Standard 2.0
  • Потребує середовища розробки, такого як Microsoft Visual Studio.


Додаткові функції

  • Підтримка багатосторінкових PDF-файлів для вилучення тексту з кожної сторінки.
  • Налаштування розпізнавання тексту, що налаштовуються для покращення точності.
  • Інтеграція з іншими бібліотеками Aspose для розширеного оброблення документів.

Системні вимоги

  • Для роботи плагіна потрібен .NET Standard 2.0 або вище.
  • Сумісний з операційними системами Microsoft Windows.
  • Адекватна пам’ять і дисковий простір для оптимальної роботи.


Часті Питання

Чи обов’язково вказувати мову?

За замовчуванням Aspose.OCR може автоматично визначати широкий спектр мов на основі Розширеного Латинського алфавіту. Однак вказання конкретної мови може значно покращити точність розпізнавання. Явно вказуйте мову при розпізнаванні кириличних, китайських та індійських текстів.

Які формати файлів підтримуються?

Aspose.OCR підтримує популярні формати з сканерів або камер, включаючи PDF, JPEG, PNG та TIFF. Результати розпізнавання повертаються у звичайному тексті, HTML, Microsoft Word, PDF, JSON та XML.

Як досягти кращого результату?

Якісне зображення - це ключовий фактор для точного OCR. Використовуйте сканер або камеру високої роздільної здатності. Бібліотека містить розширені фільтри для автоматичного покращення якості зображення перед розпізнаванням.

Де знайти більше інформації та прикладів?

Досліджуйте нашу онлайн документацію або відвідайте репозиторій Aspose.OCR для .NET для зразків коду та показових проектів.

  

Ресурси Підтримки та Навчання

  
 Українська