A.關(guān)聯(lián)分析
B.分類和預(yù)測
C.聚類分析
D.孤立點分析
E.演變分析
您可能感興趣的試卷
你可能感興趣的試題
A.所涉及的算法的復(fù)雜性
B.所涉及的數(shù)據(jù)量
C.計算結(jié)果的表現(xiàn)形式
D.是否使用了人工智能技術(shù)
A.目標(biāo)市場分析
B.購物籃分析
C.模式識別
D.信用卡欺詐檢測
A.二分K均值
B.MST
C.Chameleon
D.組平均
A.MIN(單鏈)
B.MAX(全鏈)
C.組平均
D.Chameleon
A.高維性
B.規(guī)模
C.稀疏性
D.噪聲和離群點
最新試題
根據(jù)數(shù)據(jù)科學(xué)家與數(shù)據(jù)工程師對于問題的理解并相互討論,然后確定需要收集數(shù)據(jù)的范圍以及種類,然后數(shù)據(jù)工程師使用數(shù)據(jù)收集工具,架構(gòu),甚至編程的形式來進(jìn)行數(shù)據(jù)收集的工作,然后并把數(shù)據(jù)收集的數(shù)據(jù)放置到對應(yīng)的存儲系統(tǒng)。
小數(shù)據(jù)集的數(shù)據(jù)處理最好也由計算機手段來完成。
如果P(A B)= P(A),則P(A∩B)= P(A)P(B)。
由于決策樹學(xué)會了對離散值輸出而不是實值函數(shù)進(jìn)行分類,因此它們不可能過度擬合。
假設(shè)屬性的數(shù)量固定,則可以在時間上以線性方式學(xué)習(xí)基于高斯的貝葉斯最優(yōu)分類器,而該數(shù)量是數(shù)據(jù)集中記錄的數(shù)量。
完整性,一致性,時效性,唯一性,有效性,準(zhǔn)確性是衡量數(shù)據(jù)質(zhì)量的六個維度指標(biāo)。
數(shù)據(jù)索引就像給每條數(shù)據(jù)裝了個信箱。
訓(xùn)練神經(jīng)網(wǎng)絡(luò)具有過度擬合訓(xùn)練數(shù)據(jù)的潛在問題。
當(dāng)數(shù)據(jù)集標(biāo)簽錯誤的數(shù)據(jù)點時,隨機森林通常比AdaBoost更好。
公司內(nèi)部收集的數(shù)據(jù)不存在需要考慮數(shù)據(jù)隱私的環(huán)節(jié)。