Machine learning adalah metode analisis yang membantu menangani data besar dengan cara mengembangkan algoritma komputer. Dengan menggunakan data, pembelajaran mesin memungkinkan komputer menemukan wawasan tersembunyi tanpa diprogram secara eksplisit saat mencarinya. Machine learning adalah aplikasi artificial intelligence (AI) yang menyediakan sistem kinerja secara otomatis serta belajar memperbaiki diri dari pengalaman tanpa diprogram secara eksplisit. Pembelajaran mesin berfokus pada pengembangan program komputer yang bisa mengakses data dan menggunakannya untuk belajar sendiri. Penerapan metode Machine Learning dalam beberapa tahun terakhir telah berkembang di mana-mana dalam kehidupan sehari-hari.
Langkah-langkah yang digunakan dalam Machine Learning:
- Mengumpulkan data: Data mentah bisa berupa Excel, Ms Access, file teks dan lain-lain. Langkah ini membentuk dasar pembelajaran masa depan. Semakin banyak variasi, kepadatan dan volume data yang relevan, semakin baik prospek pembelajaran untuk mesin.
- Mempersiapkan data: Setiap proses analitis berkembang dengan kualitas data yang digunakan. Kita perlu meluangkan waktu untuk menentukan kualitas data dan kemudian mengambil langkah-langkah untuk memperbaiki masalah seperti kehilangan data dan lainnya.
- Melatih sebuah model: Langkah ini melibatkan pemilihan alrgoritma dan representasi data yang tepat dalam bentuk model. Data yang disiapkan dibagi menjadi dua bagian : train dan test. Bagian pertama (training data) digunakan untuk pengembangan model. Bagian kedua (data test), digunakan sebagai referensi.
- Mengevaluasi model: Untuk menguji keakuratan, bagian kedua dari data (data test) digunakan. Langkah ini menentukan ketepatan dalam pemilihan algoritma berdasarkan hasil pengujian. Pengujian yang lebih baik untuk memeriksa ketepatan model adalah dengan melihat kinerjanya pada data yang tidak digunakan sama sekali selama pembuatan model.
- Meningkatkan kinerja: Langkah ini mungkin melibatkan pemilihan model yang berbeda atau memperkenalkan lebih banyak variabel unntuk meningkatkan efisiensi. Itulah sebabnya dibutuhkan banyak waktu untuk pengumpulan data dan persiapan data.
Sedangkan data mining merupakan suatu proses penambangan data dalam jumlah data yang sangat besar dengan menggunakan metode statistika, matematika, hingga memanfaatkan teknologi artificial intelligence terkini. Menurut para ahli (Efraim Turban, dkk 2005) Tujuan dari penambangan data ini untuk mengekstraksi serta mengidentifikasi suatu data demi informasi tertentu yang berhubungan dengan suatu database besar atau big data.
Tahapan Data Mining
- Seleksi: Tahapan pertama dalam adalah seleksi. Proses seleksi merupakan proses penyeleksian data. Data yang diseleksi akan ditransformasikan ke format yang sesuai untuk analisis data. Seleksi data menggunakan beberapa kriteria. Data hasil seleksi kemudian akan disimpan di suatu berkas terpisah yang kemudian akan diolah atau dilakukan proses data mining.
- Preprocessing: Sebenarnya tahapan ini hampir sama dengan proses pemecahan pola. Hanya saja tahapan ini ditulis secara umum, tidak menjurus ke pemecahan pola. Nah dalam tahap processing, data yang tidak valid dan tidak dibutuhkan akan dibuang. Jadi akan terjadi pembersihan data yang informasinya tidak terlalu dibutuhkan. Data yang duplikat, yang tidak konsisten, dan data yang salah akan diperiksa dan dibersihkan.
- Transformasi: Tahapan selanjutnya adalah transformasi. Proses transformasi atau coding merupakan proses transformasi data ke dalam format tertentu sehingga nantinya data dapat digunakan dan ditelusuri.
- Data Mining: Dalam tahapan ini, akan terjadi proses pencarian pola dengan metode, teknik, dan algoritma tertentu yang bervariasi dan rumit. Pola dan data yang dicari adalah pola dan data yang menarik.
- Interpretasi dan Evaluasi: Setelah menemukan pola dan data menarik, selanjutnya adalah menampilkan data tersebut ke dalam bentuk yang mudah dipahami oleh pengguna atau pihak yang berkepentingan. Jadi pola yang ditemukan nanti akan diperiksa dan dicek apakah bertentangan dengan hipotesis sebelumnya ataukah tidak. Intinya data sudah bisa dibaca dan tentunya akan bermanfaat bagi pihak yang berkepentingan.
Perbedaan dari keduanya adalah data mining digunakan untuk mendapatkan peraturan dari data yang ada, sedangkan machine learning mengajarkan komputer untuk belajar dan memahami aturan yang diberikan.
Sumber:
http://www.podfeeder.com/teknologi/apa-itu-machine-learning-berikut-penjelasannya/
https://inixindojogja.co.id/mengenal-machine-learning/
https://bootup.ai/blog/data-mining-adalah/
https://id.betweenmates.com/difference-between-data-mining-and-machine-learning-3290#menu-1