Data mining merupakan proses mengekstraksi atau menggali sejumlah data besar yang sebelumnya tidak diketahui tetapi bisa dipahami dan berguna dari basis data besar yang digunakan dalam membuat keputusan bisnis yang penting. Data mining merupakan proses semi-otomatis menggunakan teknik statistik, kecerdasan buatan, matematika dan pembelajaran mesin untuk mengekstraksi informasi dari basis data besar. Data mining adalah bagian dari proses Knowledge Discovery in Data base (KDD), terdapat beberapa langkah, seperti: Pemilihan data, pre-processing, data mining, transformasi, dan evaluasi hash.