افزونه OCR Aspose.NET، متن را از PDF های اسکن شده استخراج میکند یا آنها را به اسناد قابل جستجو تبدیل میکند، تصاویر اصلی را حفظ میکند. الگوریتمهای پیشرفته متن و ساختارهای جدول را با دقت شناسایی میکند، این راهکاری برای استخراج متن از PDF شماست.
OcrInput
بارگیری کنید.فایلهای مجمع مربوطه را از دانلودها دریافت کنید یا بسته را از NuGet بیاورید تا بتوانید به طور مستقیم Aspose.OCR را به فضای کاری خود اضافه کنید.
به طور پیشفرض، Aspose.OCR میتواند به طور خودکار زبانهای مختلفی را بر اساس الفبای لاتین توسعه یافته تشخیص دهد. با این حال، تعیین یک زبان خاص میتواند دقت تشخیص را به طرز قابلتوجهی افزایش دهد. هنگام تشخیص متون سیریلیک، چینی و هندی، به صورت صریح زبان را مشخص کنید.
Aspose.OCR از فرمتهای محبوب از اسکنرها یا دوربینها پشتیبانی میکند، از جمله PDF، JPEG، PNG و TIFF. نتایج شناسایی به صورت متن ساده، HTML، Microsoft Word، PDF، JSON و XML بازگردانده میشود.
کیفیت تصویر خوب برای تشخیص نویسهها بسیار حیاتی است. از یک اسکنر یا دوربین با وضوح بالا استفاده کنید. این کتابخانه شامل فیلترهای پیشرفته برای بهبود خودکار کیفیت تصویر قبل از تشخیص میشود.
برای دیدن مستندات ما آنلاین، به مستندات آنلاین ما مراجعه کنید یا برای نمونههای کد و پروژههای نمایشی، به مخزن Aspose.OCR برای .NET سر بزنید.