السبت، نوفمبر 13، 2010

مصطلح تعدين البيانات Data Mining


يقصد بتعدين البيانات البحث عن المعلومات ذات العلاقة ببعضها البعض التي يجمعها خصائص وسمات مشتركة ويربطها وحدة الموضوع أو التخصص، ويتم البحث عن هذه المعلومات ذات العلاقة بين كم كبير جداً من المعلومات التي لا تربطها علاقة أو وحدة موضوعية واستخلاصها ثم تقديمها لمتخذ القرار.
 تخزن هذه الكميات الكبيرة من المعلومات في مخازن عامة للبيانات تسمى Data Warehousing لتخزين المعلومات في مختلف المواضيع. ومن هنا برزت الحاجة إلى التنقيب أو التنجيم عن المعلومات المتخصصة وذات العلاقة في وسط هذا الكم المعلوماتي الكبير، وبالتالي الحصول على معرفة جديدة من خلال كميات كبيرة من البيانات.
يمر تعدين البيانات بعدد من المراحل تبدأ من تنقية البيانات، ثم توحيد البيانات، واختبار البيانات ذات العلاقة، ثم نقلها، وتصنيفها ثم تقييمها واستخراجها. هذه هي مراحل تعدين البيانات ولكل مرحلة تفاصيلها الدقيقة، وتتم مرحلة تلو الأخرى لتخرج في النهاية معلومات مفيدة ذات علاقة وقواسم وروابط مشتركة، لكي تقدم في النهاية إلى صناع القرار والجهات المستفيدة بحيث يتم توظيفها والاستفادة منها في مختلف المجالات العلمية والعملية.