Плагин Aspose.OCR для .NET извлекает текст из отсканированных PDF-документов или преобразует их в полнотекстовые документы, сохраняя оригинальные изображения. Передовые алгоритмы точно определяют текст и структуру таблиц, что делает его вашим идеальным решением для извлечения текста из PDF.
OcrInput
.Получите соответствующие сборочные файлы из загрузок или загрузите пакет из NuGet, чтобы добавить Aspose.OCR непосредственно в ваше рабочее пространство.
По умолчанию Aspose.OCR может автоматически распознавать широкий спектр языков на основе расширенного латинского алфавита. Однако указание конкретного языка может значительно повысить точность распознавания. Явно указывайте язык при распознавании текстов на кириллице, китайском и хинди.
Aspose.OCR поддерживает популярные форматы от сканеров или камер, включая PDF, JPEG, PNG и TIFF. Результаты распознавания возвращаются в виде обычного текста, HTML, Microsoft Word, PDF, JSON и XML.
Хорошее качество изображения имеет решающее значение для точного OCR. Используйте сканер или камеру с высоким разрешением. Библиотека включает в себя продвинутые фильтры для автоматического улучшения качества изображения перед распознаванием.
Исследуйте нашу онлайн-документацию или посетите репозиторий Aspose.OCR для .NET для образцов кода и демонстрационных проектов.