Perlombongan Data

Apakah Data Perlombongan:

Perlombongan data adalah istilah Inggeris yang dikaitkan dengan sains komputer yang terjemahannya adalah perlombongan data . Ia terdiri daripada fungsi yang mengagregatkan dan menganjurkan data, mencari pola, persatuan, perubahan dan anomali yang relevan.

Istilah penggalian data pertama kali muncul pada tahun 1990 dalam komuniti pangkalan data. Perlombongan data adalah langkah analisis proses yang dikenali sebagai KDD ( Pengetahuan Pengetahuan dalam Pangkalan Data ), terjemahan harfiahnya adalah "Pengetahuan Pengetahuan dalam Pangkalan Data".

Perlombongan data boleh dibahagikan kepada beberapa langkah asas: penerokaan, bangunan model, definisi corak, dan pengesahan dan pengesahan.

Perlombongan data adalah amalan yang agak baru dalam dunia pengkomputeran, dan ia menggunakan pengambilan maklumat, kecerdasan buatan, pengecaman corak, dan teknik statistik untuk mencari korelasi antara data yang berbeza yang membolehkan anda memperoleh pengetahuan yang bermanfaat untuk syarikat atau individu. Bagi syarikat, perlombongan data boleh menjadi alat penting yang meningkatkan inovasi dan keuntungan.

Penggunaan data perlombongan adalah sangat umum dalam pangkalan data yang besar, dan hasil akhir penggunaannya dapat dipaparkan melalui peraturan, hipotesis, pohon keputusan, dendrogram, dll.

Perlombongan data yang dilaksanakan dengan baik haruslah memenuhi tugas seperti: pengesanan anomali, pembelajaran peraturan persatuan (pemodelan kebergantungan), pengelompokan, klasifikasi, regresi, dan ringkasan. Proses perlombongan data biasanya berlaku menggunakan data yang terkandung dalam gudang data .

Terdapat beberapa syarikat dan perisian yang berdedikasi untuk perlombongan data, kerana pengenalan corak dalam pangkalan data semakin penting. Walau bagaimanapun, pengenalpastian standard yang berkaitan tidak unik kepada dunia komputer. Otak manusia menggunakan proses yang sama untuk mengenal pasti corak dan memperoleh pengetahuan.

Dalam tahun-tahun kebelakangan ini, perlombongan data telah banyak digunakan dalam bidang sains dan kejuruteraan seperti bioinformatik, genetik, perubatan, pendidikan dan kejuruteraan elektrik.

Konsep perlombongan data sering dikaitkan dengan mengekstrak maklumat mengenai tingkah laku orang. Atas sebab ini, dalam beberapa situasi, perlombongan data menimbulkan isu undang-undang dan isu yang berkaitan dengan privasi dan etika. Walaupun begitu, ramai yang mendakwa bahawa perlombongan data adalah neutral secara etika kerana ia tidak mempunyai implikasi etika.

Contoh-contoh Pertambangan Data Sebenar

Perlombongan data sering digunakan oleh syarikat dan organisasi untuk mendapatkan pengetahuan mengenai pengguna / pekerja / pelanggan. Contohnya, dalam sektor awam adalah mungkin untuk menyeberangi antara status perkahwinan seorang pekerja dan gaji yang diperolehnya untuk melihat apakah ini mempunyai pengaruh terhadap kehidupan perkawinannya.

Syarikat-syarikat seperti rantaian pasar raya boleh menggunakan data silang untuk menentukan produk yang dibeli bersama-sama. Jika pelanggan yang membeli produk X juga membeli produk Y, mungkin idea yang baik untuk meletakkan kedua-dua produk berdekatan untuk memudahkan pelanggan membeli.