معرفی بهترین نرم افزارهای تبدیل تصویر به متن یا OCR
حتما برای شما پیش آمده است که بخواهید نوشتههای موجود در یک عکس یا کتاب را به نسخهی الکترونیکی تبدیل کنید. در این مطلب به معرفی هشت ابزار برتر برای انجام این کار میپردازیم.
هرچند امروزه و در این دوره تقریبا همه چیز حالت دیجیتال پیدا کرده است، باید گفت هنوز استفاده از کاغذ در مواردی مانند کتابها، قبوض، روزنامهها و… رواج دارد. برای تبدیل اسناد متنی به نسخههای دیجیتال راهکاری به نام OCR وجود دارد که مخفف عبارت «تشخیص کاراکتر اپتیکال» است. نرمافزارهای OCR امکان دیجیتالی کردن اسناد نوشتاری پرینتشده و تبدیل آنها به نسخههای قابل ویرایش را فراهم میکنند.
تشخیص کاراکتر اپتیکال یا OCR برنامهای است که تصاویر اسکن شدهی متون چاپشده یا دستنویس را به فرمتهای متنی قابل خواندن برای ماشین تبدیل میکند. ممکن است کتاب یا رسیدی داشته باشید که سالها پیش تایپ یا نوشته شده است و بخواهید بدون تایپ مجدد، نسخهی دیجیتال آن را داشته باشید؛ در چنین مواردی OCR بسیار کارآمد است.
از این فناوری کارآمد میتوان برای استخراج متن از تصاویر نیز بهره برد. به علاوه، با استفاده از OCR میتوانید جدولهای موجود در متن چاپشده را به فرمت اکسل تبدیل کنید و کتابهای قدیمی را به گونهای PDF کنید که متن موجود در تصاویر آنها نیز توسط نرمافزاری که PDF را با آن باز میکنید، قابل جستجو باشد. در این مقاله از زومیت، بهترین نرمافزارهای رایگان و پولی OCR را به شما معرفی خواهیم کرد.
بهترین نرمافزارهای OCR موجود
وقتی سراغ دانلود نرمافزاری برای تبدیل عکس به نوشته میروید، اصلیترین سؤال در ذهن شما این خواهد بود که کدام نرمافزار بهتر است. برای رسیدن به پاسخ این سؤال باید موارد زیر را مد نظر قرار دهید.
- آیا نرمافزار مورد نظر از فرمتهای متعدد پشتیبانی میکند؟
- آیا امکان تشخیص زبان نوشته را دارد؟
- آیا امکان استفادهی آنلاین از این ابزار وجود دارد؟
- آیا میتواند متن موجود در تصاویر را تشخیص دهد؟
۱. ریدآیریس ( Readiris)
ریدایریس یکی از نرمافزارهای OCR قدرتمند موجود بهشمار میرود که کار با آن بسیار ساده است. هرچند این برنامه پولی است، اما ارزش هزینهای که میپردازید را دارد. ریدایریس از اکثر فرمتها پشتیبانی میکند و قابلیتهای جذابی دارد که روند تبدیل را تسهیل میکند. برای مثال، در ریدایریس، تصاویر میتوانند از دستگاههای مختلف مانند انواع اسکنر گرفته شوند و امکان تنظیم پارامترهای مختلف از جمله DPI نیز برای کاربر فراهم است.
پس از پایان کار، ریدایریس بخشهای متنی تصویر را تشخیص میدهد و نقاطی که امکان استخراج متن از آنها وجود دارد را مشخص میکند. ریدایریس به قابلیت کمنظیر ذخیرهی ابری نیز مجهز است که به کاربران امکان ذخیرهی متون استخراجشده را در گوگلدرایو، واندرایو، دراپباکس و… میدهد. ریدایریس به قابلیتهای ویرایش و پردازش متعددی نیز مجهز است که به کاربران امکان اسکن بارکدها را نیز میدهد. استفاده از ریدایریس برای ۱۰ روز رایگان است و پس از آن برای برخورداری از امکانات این نرمافزار باید حداقل ۹۹ دلار بپردازید.
۲. ابی فاینریدر ۱۴ (ABBYY FineReader 14)
این ابزار را میتوان قدرتمندترین ابزار تشخیص کاراکتر اپتیکال موجود قلمداد کرد. ابی فاین ریدر ۱۴ از سرعت و دقت بالایی در تشخیص متون برخوردار است. این نرمافزار به خوبی از پس حجم بالای کار برمیآید و از ابزار پیشرفتهی اصلاح متون نیز برخوردار است. این ابزار در مواردی که در صحت کلمهی تشخیص داده شده تردید وجود دارد، به راحتی با انجام مقایسهی دقیق با تصویر اصلی، مشکل را برطرف میسازد.
مقالهی مرتبط:
- پشتیبانی OCR از زبان فارسی در گوگلدرایو
ابی فاینریدر ۱۴ عملکردی فراتر از آنچه که از یک نرمافزار OCR انتظار دارید ارائه میدهد. این ابزار کتابی ۵۰۰ صفحهای را با دقت تمام به پیدیاف تبدیل میکند. همچنین میتوانید متون موجود در عکسهایی که در اینترنت پیدا میکنید را با این برنامه استخراج کنید. به علاوه، امکان تبدیل اسناد اسکن شده به فرمت HTML یا ePub نیز وجود دارد. کمترین هزینه برای تهیهی نسخهی پولی این نرمافزار ۱۹۹ دلار است؛ هرچند که میتوانید به مدت ۳۰ روز به صورت رایگان از ابی فاینریدر ۱۴ استفاده کنید.
۳. ابی فاینریدر آنلاین
اگر میخواهید از امکانات ابزار قدرتمند ابی بدون متحمل شدن هزینهی آن برخوردار شوید، میتوانید نسخهی آنلاین فاینریدر را امتحان کنید. فاینریدر آنلاین از فرمتهای ورودی بسیاری از قبیل PDF ،JPG ،PNG ،DCX ،PCX ،TIF ،TIFF و BMP پشتیبانی میکند. فرمتهای خروجی این ابزار آنلاین نیز PDF، وورد، اکسل و e-Pub را شامل میشود.
نسخهی رایگان این ابزار اجازهی تبدیل ۱۰ صفحه در ماه را پس از نامنویسی رایگان در آن به شما خواهد داد؛ اما اگر میخواهید ماهانه تعداد صفحات بیشتری را تبدیل کنید، باید یکی از اشتراکهای پولی آن را خریداری کنید. قیمت این اشتراکها از ۴۹ دلار برای ۲۴۰۰ صفحه در سال شروع شده به ۱۴۹ دلار بابت ۱۲ هزار صفحه در سال ختم میشوند. علاوه بر این، میتوانید با پرداخت ۱۶۹.۹۹ دلار، اشتراک نامحدود و مادامالعمر ابی فاینریدر پرو را تهیه کنید.
۴. مایکروسافت واننوت (Microsoft OneNote)
یکی از قابلیتهای واننوت که شاید کمتر کسی به آن توجه کرده باشد، تشخیص کاراکتر اپتیکال است. در این برنامه که بیشتر جهت نگهداری یادداشتها از آن استفاده میشود، گزینهای تحت عنوان Copy text from picture وجود دارد که به شما امکان استخراج متن از تصاویر را میدهد. آنچه که واننوت را از سایر ابزارها متمایز میکند سادگی کار با آن است. کافی است تصویر را به واننوت بدهید و روی آن کلیک راست کنید و گزینهی یادشده را انتخاب کنید تا واننوت ادامهی کار را انجام دهد. متن تشخیص داده شده در کلیپبورد ذخیره میشود و شما قادر خواهید بود آن را در فایل ورد یا هر برنامهی دیگری که میخواهید پیست کنید؛ اما توجه داشته باشید که این برنامه قادر به تشخیص و استخراج جدولها و ستونها نیست.
۵. سیمپل OCR
سیمپل OCR ابزار کارآمدی است که میتواند به راحتی متون پرینتشدهی شما را به فایلهای متنی با قابلیت ویرایش تبدیل کند. اگر اسناد دستنویس زیادی دارید که میخواهید آنها را به فایلهای متنی قابلویرایش تبدیل کنید، سیمپل OCR بهترین گزینه برای شما خواهد بود؛ اما باید بدانید که تشخیص دستنوشته محدودیت دارید و تنها به مدت ۱۴ روز میتوانید به صورت رایگان از آن بهره ببرید. در عوض، تشخیص متن پرینتشدهی ماشینی هیچ محدودیتی ندارد. یک بررسیکنندهی املا نیز در این نرمافزار تعبیه شده است که میتوانید برای اصلاح مواردی که به درستی تشخیص داده نشدهاند استفاده کنید. همچنین میتوانید سیمپل OCR را طوری تنظیم کنید که مستقیما تصویر دریافت شده توسط اسکنر را مورد پردازش قرار دهد. متأسفانه، سیمپل OCR نیز مانند مایکروسافت واننوت از ستونها و جدولها پشتیبانی نمیکند.
۶. Free OCR
فری OCR از موتور Tesseract که ابتدا توسط HP ساخته شد و سپس توسط گوگل بهبود داده شد، استفاده میکند. تسراکت موتور بسیار قدرتمندی است که گفته میشود یکی از دقیقترین موتورهای روز OCR در دنیا است. فری OCR فرمتهای پیدیاف را به خوبی تشخیص میدهد و از دستگاههایی مانند دوربینها و اسکنرها پشتیبانی میکند. به علاوه، پشتیبانی از تمام فرمتهای تصویری و فایلهای چندصفحهای TIFF نیز برای این نرمافزار در نظر گرفته شده است. میتوانید از فری OCR برای استخراج متن از تصاویر با دقت بالا استفاده کنید. همانند سایر برنامههای رایگان تشخیص کاراکتر اپتیکال، فری OCR نیز از ستونها و جداول پشتیبانی نمیکند.
۷. باکسافت فری OCR
باکسافت فری OCR ابزار کارآمد دیگری جهت استخراج متن از انواع تصویر است. کار با این ابزار رایگان بسیار ساده است و امکان تحلیل دقیق متون چندستونی نیز وجود دارد. باکسافت از چندین زبان از جمله انگلیسی، اسپانیایی، ایتالیایی، آلمانی، فرانسوی، پرتقالی و بسیاری زبانهای دیگر پشتیبانی میکند. سرعت و دقت عملکرد باکسافت فری OCR در تشخیص متن تایپی بر خلاف دستنوشته بسیار بالا است.
۸. تاپ OCR
این نرمافزار در بسیاری از جنبهها نسبت به سایر نرمافزارهای معرفیشده متفاوت است، اما کار تشخیص متن را به همان دقت و ظرافت انجام میدهد. تاپ OCR با دوربینهای دیجیتال و اسکنرها به خوبی کار میکند و محیط کاربری آن دارای دو پنجره، یکی برای قرارگیری تصویر منبع و دیگری برای متن استخراجشده است. پس از آنکه تصویر مورد نظر از دوربین یا اسکنر در پنجرهی سمت چپ بارگذاری شود، متن استخراجشده از آن در پنجرهی سمت راست که نوعی ویرایشگر متن است نمایان خواهد شد. این نرمافزار از فرمتهای تصویری GIF ،JPEG ،BMP و TIFF پشتیبانی میکند و خروجی کار نیز میتواند به صورت PDF، HTML ،TXT و RTF باشد. به علاوه، تنظیمات فیلتر تصویر نیز برای افزایش کیفیت عکس ورودی در تاپ OCR در نظر گرفته شده است.
منبع:زومیت