Data Mining- Klasifikasi part 1
September 6, 2008 at 5:11 pm Tinggalkan komentar
Dalam data mining dikenal sebuah istilah klasifikasi, klasifikasi menurut definisi dari sumber adalah
Classification is a data mining (machine learning) technique used to predict group membership for data instances
Menurut definisi tsb klasifikasi adalah teknik yang dilakukan untuk memprediksi class atau properti dari setiap instance data.
Definisi Data
Untuk mengetahui definisi dari data dalam klasifikasi mari kita lihat tabel dibawah ini
|
|
2 |
2 |
3 |
|
1 |
Tua |
Merokok |
Lemah Jantung |
|
1 |
Tua |
Tidak Merokok |
Agak Lemah Jantung |
- instance : data itu sendiri, setiap instance akan memiliki atribut dan class
- atribut : atribut adalah keterangan yang dikandung dalam data itu sendiri, setiap data bisa memiliki lebih dari 1 atribut. biasanya atribut menggunakan variabel diskrit
- class : class adalah status dari setiap instance, class adalah kesimpulan dari setiap data, setiap data biasanya hanya memiliki 1 class, biasanya class menggunakan variable diskrit
Tahapan
Tahapan dari klasifikasi dalam data mining terdiri dari
- Pembangunan model, dalam tahapan ini dibuat sebuah model untuk menyelesaikan masalah klasifikasi class atau attribut dalam data, model ini dibangun berdasarkan training set-sebuah contoh data dari permasalahan yang dihadapi, training set ini sudah mempunyai informasi yang lengkap baik attribut maupun classnya
- Penerapan model, pada tahapan ini model yang sudah dibangun sebelumnya digunakan untuk menentukan attribut / class dari sebuah data baru yang attribut / classnya belum diketahui sebelumnya
- Evaluasi, pada tahapan ini hasil dari penerapan model pada tahapan sebelumnya dievaluasi menggunakan parameter terukur untuk menentukan apakah model tersebut dapat diterima
Pembangunan Model
|
No |
Usia |
Diabetes |
Rajin Berolahraga |
Lajang |
Cakep |
LS ? |
|
1 |
Muda |
Tidak |
Ya |
Ya |
Tidak |
Tidak |
|
2 |
Muda |
Tidak |
Tidak |
Ya |
Tidak |
Sedikit |
|
3 |
Muda |
Ya |
Ya |
Ya |
Tidak |
Ya |
|
4 |
Muda |
Ya |
Tidak |
Ya |
Tidak |
Ya |
|
5 |
Matang |
Tidak |
Ya |
Tidak |
Ya |
Tidak |
|
6 |
Matang |
Tidak |
Tidak |
Tidak |
Tidak |
Sedikit |
|
7 |
Matang |
Ya |
Ya |
Tidak |
Ya |
Ya |
|
8 |
Matang |
Ya |
Tidak |
Ya |
Tidak |
Ya |
|
No |
Usia |
Diabetes |
Rajin Berolahraga |
Lajang |
Cakep |
LS ? |
Keadaan Nyata |
|
1 |
Muda |
Tidak |
Ya |
Ya |
Tidak |
- |
Tidak |
|
2 |
Muda |
Tidak |
Tidak |
Ya |
Tidak |
- |
Sedikit |
|
3 |
Muda |
Ya |
Ya |
Ya |
Tidak |
- |
Ya |
|
4 |
Muda |
Ya |
Tidak |
Ya |
Tidak |
- |
Ya |
|
5 |
Matang |
Tidak |
Ya |
Tidak |
Ya |
- |
Tidak |
|
6 |
Matang |
Tidak |
Tidak |
Tidak |
Tidak |
- |
Sedikit |
|
7 |
Matang |
Ya |
Ya |
Tidak |
Ya |
- |
Ya |
|
8 |
Lanjut |
Tidak |
Ya |
Tidak |
Tidak |
- |
Ya |
|
No |
LS ? |
Keadaan Nyata |
|
1 |
Tidak |
Tidak |
|
2 |
Sedikit |
Sedikit |
|
3 |
Ya |
Ya |
|
4 |
Ya |
Ya |
|
5 |
Tidak |
Tidak |
|
6 |
Sedikit |
Sedikit |
|
7 |
Ya |
Ya |
|
8 |
Tidak |
Ya |
Evaluasi Model
- algoritma membangun model pohon keputusan menggunakan beberapa algortima populer
- metodelogi evaluasi model yang lebih komprehensif
Entry filed under: Data Mining, Sains Komputer. Tags: Data Mining, Jiawei Han, Klasifikasi, Penggalian Data.

Trackback this post | Subscribe to the comments via RSS Feed