PROSES ATAU TAHAPAN DATA MINING
Data mining adalah suatu proses yang melibatkan ekstraksi, transformasi, dan analisis data yang kompleks dari berbagai sumber, termasuk basis data besar, data terstruktur dan tidak terstruktur, serta data yang diperoleh dari berbagai platform digital. Tujuan utama dari data mining adalah untuk mengungkapkan pola atau hubungan yang tidak terlihat secara langsung, serta mendapatkan pemahaman yang lebih dalam tentang perilaku atau tren yang mendasari data tersebut.
Tahapan Data Mining
Sederhananya, Anda bisa menganalogikan proses data mining dengan penambangan emas. Sebagai penambang emas, pastinya harus melakukan beberapa tahapan agar butiran batu mentah biasa bisa berubah menjadi emas berharga.
Bagaimana penerapannya dalam tahapan data mining? Simak penjelasan tahapan data mining di bawah ini.
1. Pembersihan Data (Data Cleaning)
Dalam proses menambang emas, tahap awal yang dilakukan adalah dengan mencari batu atau lumpur yang sekiranya bisa diolah menjadi emas yang bagus.
Dalam proses tersebut, pasti menemukan satu atau bahkan mencapai puluhan batu yang kurang layak untuk diproses. Sehingga batu-batu itu perlu dibuang.
Begitu juga penerapannya dalam tahapan data mining. Sebelum diproses dan dibentuk menjadi sebuah knowledge, data yang ada harus dibersihkan terlebih dahulu.
Jika ada yang mengandung eror, maka data-data tersebut harus dibuang. Sehingga tersisa data yang ‘bagus’ untuk diolah dalam tahap selanjutnya.
2. Integrasi Data (Data Integration)
Langkah kedua dalam tahapan data mining adalah integrasi data. Setelah menemukan batu-batu yang cocok, selanjutnya penambang akan mulai mengkombinasikan untuk dijadikan batangan emas atau bentuk emas lainnya. Dalam data mining, data yang berhasil dibersihkan juga akan diintegrasi.
3. Transformation
Seperti bentuk emas yang berbeda-beda, maka proses pembentukannya juga akan berbeda. Begitu juga dengan data, dalam tahap transformation data akan dipilih dan diubah formatnya agar sesuai dengan teknik atau metode yang dipakai. Pada tahap ini pula kualitas data mining akan terlihat.
4. Data Mining
Tahapan data mining selanjutnya adalah proses penambangan data itu sendiri. Perlu penentuan metode penambangan yang tepat.
5. Evaluasi Pola (Pattern Evaluation)
Setelah bahan mentah emas selesai diolah, maka perlu diuji juga apakah sudah sesuai dengan standar kualitasnya atau belum. Baru setelah itu bisa didistribusikan ke toko emas dan di-display kepada pelanggan.
Setelah selesai melakukan proses data mining, pola-pola yang dihasilkan dari proses tersebut perlu untuk dievaluasi. Tujuan dari dilakukannya evaluasi adalah untuk menguji hipotesis awal. Setelah teruji data bisa dipresentasikan kepada pengguna.
Komentar
Posting Komentar