DATA MINING DAN MACHINE LEARNING

data mining
sumber image: capstonebpo.com


Data Mining seringkali diterjemahkan sebagai Penggalian Data, yang mana sebenarnya kurang tepat karena kata Mining tersebut seharusnya diterjemahkan menjadi Penambangan dan bukanlah Penggalian.

Secara konteks tentunya terdapat perbedaan yang signifikan antara kegiatan penambangan dibandingkan dengan penggalian. Penggalian adalah sebuah aktifitas yang dilakukan untuk memindahkan sejumlah material dari satu tempat ke tempat lainnya, sebagai hasil jumlah material yang dipindahkan tentunya akan sama dengan jumlah material yang diperoleh. Di sisi lain, penambangan adalah sebuah aktifitas yang jauh lebih dari sekedar memindahkan material. Dalam proses penambangan seringkali seseorang hanya akan mendapat sepotong kecil material dari hasil penggalian yang besar, namun sepotong kecil material tersebut memiliki nilai yang jauh lebih tinggi dibandingkan dengan material yang digali. Selain itu, proses penambangan juga harus didahului oleh kegiatan kajian, survey, persiapan dan lain sebagainya.

Data Mining adalah sebuah bidang yang banyak berkembang dari Machine Learning, namun berbeda secara tujuan. Jika Machine Learning fokus pada membuat program yang dapat belajar, Data Mining fokus pada memanfaatkan program untuk membantu manusia belajar dari data. Data Mining dilakukan oleh seseorang, dalam kasus tertentu, pada dataset tertentu, dengan sebuah tujuan tertentu. Jika kedua bidang sebelumnya fokus pada programnya, Data Mining adalah ilmu praktis yang fokus pada manusianya.

Pada sebagian besar kasus, Data Mining digunakan untuk menghasilkan “insights” dari data yang ada, sehingga dapat mendatangkan pengetahuan baru. Hal tersebut lebih banyak digunakan dalam kasus praktis seperti dalam proses pengambilan keputusan sebuah perusahaan. Sebagai contoh, dengan Data Mining, sebuah perusahaan dapat mengetahui informasi detil terkait segmen konsumen yang banyak membeli produk mereka. Hal tersebut kemudian akan digunakan dalam menentukan strategi perusahaan kedepannya.

Istilah Data Mining sendiri sebenarnya adalah sebuah salah kaprah. Data Mining sendiri hanyalah satu langkah dalam proses yang lebih besar yang dikenal sebagai Knowledge Discovery from Database (KDD) atau sekarang lebih banyak dikenal dengan istilah Data Science (DS). Dengan berkembangnya kemampuan komputasi komputer dan bertambahnya juMachine Learningah data di dunia secara eksponensial, sekarang Data Scientist menjadi salah satu pekerjaan paling dicari di dunia karena permintaan yang sangat banyak, namun persediaan tenaga ahli yang sedikit. Dari fenomena tersebut pula muncul dua bidang khusus baru, yaitu Big Data yang berasal dari Data Mining, dan Deep Learning yang berasal dari Machine Learning.

Machine Learning adalah bidang keilmuan yang mempelajari bagaimana membuat program yang dapat menghasilkan pengetahuan baru dari pengetahuan yang sudah ada (disebut experience, atau data) di luar pengetahuan yang “diprogram” secara langsung pada program. Istilah lebih umumnya adalah bagaimana membuat komputer yang dapat belajar dari lingkungan sekitar sehingga memiliki “pengetahuan” yang berkembang. Contoh paling gampang mungkin adalah prediksi kata yang ada di HP kita atau pengenalan wajah pada facebook. Hal tersebut mungkin dilakukan karena program di belakang kedua hal tersebut telah menyusun pengetahuan dari data yang ada, biasanya dalam bentuk sebuah model matematis.

Hal tersebut banyak berhubungan dengan algoritma yang dapat mengekstraksi informasi dari berbagai macam data serta mengenali pola dalam data (pattern recognition), sehingga bidang tersebut sangat erat kaitannya dengan statistika. Namun secara garis besar, segala sesuatu yang melibatkan proses induksi pengetahuan dari data termasuk dalam bidang keilmuan.

Machine Learning ini merupakan bidang keilmuan computer science yang paling sering salah dimengerti. Selain konotasi negatif dalam Indonesia dengan istilah Machine Learning, namun Machine Learning tersebut juga merupakan bidang dengan ranah aplikatif yang sangat luas dalam banyak sekali bidang keilmuan. Hampir seluruh bidang yang berhubungan dengan “komputasi cerdas” membutuhkan adanya pengetahuan dalam sebuah program, dan dalam tahap ini Machine Learning sangat berperan. Jika AI fokus pada membuat komputer yang cerdas, maka untuk mencapai kecerdasan tersebut digunakan Machine Learning. Bahkan sebagian besar ilmu yang dipelajari dalam AI maupun Data Mining adalah Machine Learning itu sendiri. Hal tersebut yang banyak menimbulkan ambiguitas bidang antara ketiga hal tersebut.

Sumber:

Komentar