問答題

考慮下表所示二元分類問題的數(shù)據(jù)集。

(1)計算按照屬性A和B劃分時的信息增益。決策樹歸納算法將會選擇哪個屬性?
(2)計算按照屬性A和B劃分時Gini系數(shù)。決策樹歸納算法將會選擇哪個屬性?


您可能感興趣的試卷

最新試題

假設(shè)屬性的數(shù)量固定,則可以在時間上以線性方式學(xué)習基于高斯的貝葉斯最優(yōu)分類器,而該數(shù)量是數(shù)據(jù)集中記錄的數(shù)量。

題型:判斷題

選擇用于k均值聚類的聚類數(shù)k的一種好方法是嘗試k的多個值,并選擇最小化失真度量的值。

題型:判斷題

數(shù)據(jù)索引是保證數(shù)據(jù)處理高性能的軟件角度的一種手段,不做數(shù)據(jù)索引的數(shù)據(jù)訪問是線性訪問,但是做了索引的數(shù)據(jù)訪問會成倍的降低訪問時間。

題型:判斷題

由于分類是回歸的一種特殊情況,因此邏輯回歸是線性回歸的一種特殊情況。

題型:判斷題

數(shù)據(jù)收集中的拉模式需要通過定時的方式不斷地觸發(fā),才能源源不斷地獲取對應(yīng)的數(shù)據(jù)。

題型:判斷題

任何對數(shù)據(jù)處理與存儲系統(tǒng)的操作均需要記錄,這符合數(shù)據(jù)安全的要求。

題型:判斷題

數(shù)據(jù)壓縮與解壓縮可以使得數(shù)據(jù)處理的速度加快。

題型:判斷題

非結(jié)構(gòu)化數(shù)據(jù)也可以使用關(guān)系型數(shù)據(jù)庫來存儲。

題型:判斷題

數(shù)據(jù)復(fù)制或者備份均是為了從提高數(shù)據(jù)并發(fā)這個角度來設(shè)計和實現(xiàn)的。

題型:判斷題

數(shù)據(jù)索引就像給每條數(shù)據(jù)裝了個信箱。

題型:判斷題