الجمعة، نوفمبر 24، 2017

برنامج NeOCR لاستخلاص الكتابة من الصور وتحويل ملفات pdf الممسوحة ضوئيا

 
خدمة خاصة بمعالجة اللغة العربية بشكل آلي, وهي خدمة التعرف الآلي على الحروف الممسوحة ضوئيا , ما يسمى ب الأوسيآر OCR , وهي ممثلة في برنامج مجاني خاص بالحاسوب وهو باسم NeOCR.
نبدأ بتثبيت برنامج gost script وذلك حسب النواة المستخدمة .
ثم نذهب لبرنامجنا الرئيسي وهو neocr ; البرنامج سهل الاستخدام , فبعد تثبيته ثم فتحه ,نختار اللغة العربية كلغة أساسية للتحويل ,
وذلك من خلال الذهاب ألى قائمة tools ثم الصعوض ألى خيار preference نتحرك بالتاب ألى غاية recognizion language نختار arab , ونقوم بحفظ الأعدادات .
عملية التحويل ;من القائمة file نختار open وهي قائمة فرعية نختار منها حسب المراد سواءً
pdf file
أو
image file
ونضغط أنتر , ننتظر حتى تنتهي عملية التعرف ونضغط ok , نتحرك بالتاب حتى نجد النص المستخلص في شكل أسطر ,
يمكن نسخه ولسقه ,أو يمكن حفظه في شكل ملف وورد من خلال الخيار save الموجود داخل قائمة file .
ملاحظة :
يستحسن تشغيل البرنامج كمسؤول تفاديا لبعض المشاكل .
روابط التحميل
1 برنامج gost script لتمكين البرنامج من فتح والتعرف على ملفات pdf والمجلد يحتوي النسخة للنواتين 32 و 64 :
https://drive.google.com/file/d/0B9CwdXG31d7XYUtQS1FoT25PbG8/view?usp=sharing
2 رابط تحميل برنامج neocr :