本文目錄一覽:
- 1、決策樹算法 CART和C4.5決策樹有什麼區別?各用於什麼領域?
- 2、決策樹分類算法的適用領域,不要概括成經濟、社會、醫療領域,具體到實際問題。且用什麼軟件實現較方便。
- 3、決策樹ID3,C4.5,CART算法中某一屬性分類後,是否能運用該屬性繼續分類
決策樹算法 CART和C4.5決策樹有什麼區別?各用於什麼領域?
1、C4.5算法是在ID3算法的基礎上採用信息增益率的方法選擇測試屬性。CART算法採用一種二分遞歸分割的技術,與基於信息熵的算法不同,CART算法對每次樣本集的劃分計算GINI係數,GINI係數,GINI係數越小則劃分越合理。
2、決策樹算法是一種逼近離散函數值的方法。它是一種典型的分類方法,首先對數據進行處理,利用歸納算法生成可讀的規則和決策樹,然後使用決策對新數據進行分析。本質上決策樹是通過一系列規則對數據進行分類的過程。
3、決策樹算法構造決策樹來發現數據中蘊涵的分類規則.如何構造精度高、規模小的決策樹是決策樹算法的核心內容。決策樹構造可以分兩步進行。第一步,決策樹的生成:由訓練樣本集生成決策樹的過程。一般情況下,訓練樣本數據集是根據實際需要有歷史的、有一定綜合程度的,用於數據分析處理的數據集。第二步,決策樹的剪技:決策樹的剪枝是對上一階段生成的決策樹進行檢驗、校正和修下的過程,主要是用新的樣本數據集(稱為測試數據集)中的數據校驗決策樹生成過程中產生的初步規則,將那些影響預衡準確性的分枝剪除。
決策樹分類算法的適用領域,不要概括成經濟、社會、醫療領域,具體到實際問題。且用什麼軟件實現較方便。
決策樹算法主要用於數據挖掘和機器學習,數據挖掘就是從海量數據中找出規律。一個有名的例子就是啤酒和尿布的例子,這是數據挖掘的典型。決策樹算法包括ID3,C4.5,CART等,各種算法都是利用海量的數據來生成決策樹的,決策樹能幫助人或者機器做出決策。最簡單的一個例子就是你去看病,根據決策樹,醫生能夠判斷這是什麼病。軟件的話用VISUAL STUDIO就可以,C語言,C++,C#,java都可以。
決策樹ID3,C4.5,CART算法中某一屬性分類後,是否能運用該屬性繼續分類
用過的分類屬性是不能在用來分類的,假設:再用來分類的情況下,在數據很充分時,相當於把整個數據集合中的每一條信息用樹結構表達出來。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/289541.html