Aspose.OCR的.NET OCR插件从含有大量结构化文本的图像中提取文本,如扫描的合同、协议、书页、文章、报纸等。识别引擎准确确定文档结构,使您能够处理复杂布局,包括多栏文本。
Aspose.OCR 可与文档管理系统集成,以实现自动化文本提取。
默认情况下,Aspose.OCR 可以基于扩展拉丁字母自动识别多种语言。但是,指定特定语言可以显著提高识别准确性。在识别西里尔文、中文和印地文时,请明确指定语言。
Aspose.OCR 支持来自扫描仪或相机的常见格式,包括 PDF、JPEG、PNG 和 TIFF。识别结果以纯文本、HTML、Microsoft Word、PDF、JSON 和 XML 返回。
良好的图像质量对于准确的OCR至关重要。使用扫描仪或高分辨率相机。图书馆包含高级滤镜,可在识别之前自动改善图像质量。
浏览我们的在线文档或访问Aspose.OCR for .NET存储库获取代码示例和展示项目。