Thuật Toán Cây Quyết Định C4.5
*
Outline
*
Thuật toán cây quyết định
Gốc
Node Trong
Node Lá
Node Lá
Node Lá
Nhánh
*
*
Ví dụ cây quyết định
Thuật toán cây quyết định
*
Thuật toán cây quyết định
*
Thuật toán cây quyết định
*
Thuật toán C4.5
*
Thuật toán C4.5
(1) ComputerClassFrequency(T);
(2) if OneClass or FewCases
return a leaf;
Create a decision node N;
(3) ForEach Attribute A
ComputeGain(A);
(4) N.test=AttributeWithBestGain;
(5) if (N.test is continuous)
find Threshold;
(6) ForEach T' in the splitting of T
(7) If ( T' is Empty )
Child of N is a leaf
else
(8) Child of N=FormTree(T');
(9) ComputeErrors of N;
return N
*
Thuật toán C4.5
*
Thuật toán C4.5
Test B sẽ được chọn nếu có G(S, B) đạt giá trị lớn nhất.
*
Thuật toán C4.5
=I(s1,s2) – Σ|Si| / |S|* I(Si) = 0.246
=>chọn làm thuộc tính phát triển tại node đang xét
*
Thuật toán C4.5
*
Thuật toán C4.5
*
Thuật toán C4.5
*
Thuật toán C4.5
*
Thuật toán C4.5
*
C4.5 và C5.0
Blue: C5.0
*
C4.5 và C5.0
Blue: C5.0
*
Hướng nghiên cứu
*
Tài liệu tham khảo
*
Cảm ơn thầy, anh chị và các bạn
đã theo dõi!
*