Русский
  1. Продукты
  2.   Aspose.OCR
  3.   Отсканированный PDF в текст

Сканированный PDF в текст OCR

Извлекайте текст из отсканированных PDF-документов или преобразуйте их в доступные для поиска документы. Читайте любой макет и стиль, точно определяйте структуру текста и таблиц. Сохраняйте оригинальные изображения на заднем плане для сохранения содержимого. Aspose.OCR - ваше решение для извлечения текста из PDF для .NET.

Aspose.OCR Сканированный PDF в текст для .NET

Плагин Aspose.OCR для .NET извлекает текст из отсканированных PDF-документов или преобразует их в полнотекстовые документы, сохраняя оригинальные изображения. Передовые алгоритмы точно определяют текст и структуру таблиц, что делает его вашим идеальным решением для извлечения текста из PDF.

Как использовать плагин Scanned PDF to Text

  • Установите пакет Aspose.OCR из NuGet или с локально загруженного файла.
  • Установите свои ключи лицензии.
  • Загрузите отсканированное изображение в объект OcrInput.
  • Создайте экземпляр системы распознавания Aspose.OCR.
  • Извлеките текст из отсканированного PDF.
  • Вывести распознанный текст или сохранить его в файл.

Сканированный PDF в текстовый конвертер плагин

Получите соответствующие сборочные файлы из загрузок или загрузите пакет из NuGet, чтобы добавить Aspose.OCR непосредственно в ваше рабочее пространство.

  • Совместимо с Microsoft Windows или совместимой ОС с .NET Standard 2.0
  • Требует среды разработки, такой как Microsoft Visual Studio.


Дополнительные функции

  • Поддержка многоп страничных PDF для извлечения текста с каждой страницы.
  • Настраиваемые параметры распознавания текста для повышения точности.
  • Интеграция с другими библиотеками Aspose для расширенной обработки документов.

Системные требования

  • Для запуска плагина требуется .NET Standard 2.0 или выше.
  • Совместимо с операционными системами Microsoft Windows.
  • Адекватная память и дисковое пространство для оптимальной работы.


Часто задаваемые вопросы

Необходимо ли указывать язык?

По умолчанию Aspose.OCR может автоматически распознавать широкий спектр языков на основе расширенного латинского алфавита. Однако указание конкретного языка может значительно повысить точность распознавания. Явно указывайте язык при распознавании текстов на кириллице, китайском и хинди.

Какие форматы файлов поддерживаются?

Aspose.OCR поддерживает популярные форматы от сканеров или камер, включая PDF, JPEG, PNG и TIFF. Результаты распознавания возвращаются в виде обычного текста, HTML, Microsoft Word, PDF, JSON и XML.

Как добиться наилучшего результата?

Хорошее качество изображения имеет решающее значение для точного OCR. Используйте сканер или камеру с высоким разрешением. Библиотека включает в себя продвинутые фильтры для автоматического улучшения качества изображения перед распознаванием.

Где найти больше информации и примеров?

Исследуйте нашу онлайн-документацию или посетите репозиторий Aspose.OCR для .NET для образцов кода и демонстрационных проектов.

  

Ресурсы поддержки и обучения

  
 Русский