Algoritma dasar untuk membangun pohon keputusan
Algoritma yang efisien telah dikembangkan untuk menghasilkan pohon keputusan yang cukup akurat, meskipun tidak optimal, dalam jumlah waktu yang wajar.
Algoritma ini biasanya menggunakan strategi Greedy untuk menumbuhkan pohon keputusan dengan cara top-down dengan membuat serangkaian keputusan yang optimal tentang atribut mana yang akan digunakan ketika mempartisi data latih.
Salah satu metode yang paling awal adalah algoritma Hunt, yang merupakan dasar bagi banyak implementasi pengklasifikasi pohon keputusan saat ini, termasuk ID3, C4.5, dan CART.
Algoritma Hunt
Dalam algoritma Hunt, pohon keputusan tumbuh secara rekursif.
- Pohon awalnya berisi satu simpul akar yang dikaitkan dengan semua instance latih.
- Jika sebuah node dikaitkan dengan instance dari lebih dari satu kelas, ia diperluas menggunakan kondisi atribut uji yang ditentukan menggunakan kriteria pemisahan.
- Node daun / anak dibuat untuk setiap hasil dari kondisi atribut uji dan instance yang terkait dengan node induk didistribusikan kepada anak-anak berdasarkan hasil tes.
- Langkah ekspansi simpul ini kemudian dapat diterapkan secara rekursif ke setiap simpul anak, asalkan memiliki label lebih dari satu kelas.
- Jika semua instance yang terkait dengan simpul daun memiliki label kelas yang identik, maka simpul tersebut tidak diperluas lebih jauh.
Setiap node daun diberi label kelas yang paling sering terjadi dalam instance latih yang terkait dengan node.
Berikut latihan mengenai algoritma Hunt serta hitungan yg mendasari pembetukan pohon,
Download :
Latihan pohon keputusan