الأحد، مايو 16، 2010

تقنيةOCR

ما هي تقنية OCR؟
تعتمد تقنية "Optical Character Recognition" او كما تسمى اختصارا OCR على التقنية البصرية الضوئية، تقنية تتجلى بوضوح في الماسحات الضوئية ، وان كانت الماسحات الضوئية ليست وحدها من تستخدم هذه التقنية
كيف تعمل تقنية OCR؟
بقليل من الملاحظة نستطيع استنتاج ولو بشكل بسيط الآلية التي تعمل بها. فنحن نلاحظ وجود مصدر ضوئي يمر على المستند المراد مسحه ومن ثم تظهر نسخه من ذاك المستند على شاشة الجهاز او على الطابعة اعتمادا على رغبة المستخدم.
ما ضرورة برامج OCR؟
ان المصدر الضوئي يمر على المستند ومن ثم تظهر نسخة منه على الشاشة.لكن .. كيف تعرف الكمبيوتر على الصورة او الحروف المكتوبة ؟! أنه دور البرنامج الخاص بالمسح الضوئي.
كيف تعمل برامج OCR؟
هناك تقنيات كثيرة لبرامج المسح الضوئي، مثل Matrix matching وتقنية feature extraction. وتعد الطريقة الاولى هي الأشهر والاكثر استخداما لسهولتها.
تعتمد البرامج التي تعمل بهذه التنقية على مطابقة كل حرف يتم مسحه بجداول خاصة ومن ثم اعطاء الأسكي كود ASCII الخاص بذلك الحرف .. ليتم ترجمته مرة اخرى الى الحرف حتي يظهر مرة ثانية على الشاشة.
الا يساهم ذلك في بطئ العملية ؟!هذه البرامج سريعة جدا بحيث انها تستطيع مسح ما يقارب 2400 كلمة في الدقيقة !!!
هل تختلف وظيفة برامج OCR؟
بالطبع، فانت عندما تريد ان تمسح صورة تحتاج الى برنامج يختلف تماما عن البرنامج الذي تستخدمه لمسح النصوص. لذلك .. تأتي الماسحات الضوئية عادة مع هذين البرنامجين واحد للصور وآخر للنصوص .. مع اختلاف الاسماء طبعا حسب اسم الشركة المصنعة.
هل تختلف برامج OCR باختلاف اللغات ؟
 تعتمد هذه البرامج على تحويل الحروف الممسوحة بعد مقارنتها بالجداول الخاصة للبرنامج الى ما يطابقها من شفرة الاسكي كود .. ولانه لحد الآن لا يوجد برنامج يحتوي على الاسكي كود لجميع اللغات فالجواب ... نعم .. تحتاج الى برنامج خاص لكل لغة مستخدمة .. فالبرنامج الخاص بمسح النصوص الانجليزية لن يعمل ابدا مع العربية لانه بكل بساطة لا يستطيع تميزها اصلا !!!وهذا ما جعل الكثيرين يواجهون مشكلة كبيرة نوعا ما عند التعامل مع النصوص العربية