A.K均值丟棄被它識別為噪聲的對象,而DBSCAN一般聚類所有對象
B.K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
C.K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同形狀的簇
D.K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會合并有重疊的簇
您可能感興趣的試卷
你可能感興趣的試題
A.基于圖的凝聚度
B.基于原型的凝聚度
C.基于原型的分離度
D.基于圖的凝聚度和分離度
A.O(m)
B.O(m2)
C.O(logm)
D.O(m*logm)
A.MIN(單鏈)
B.MAX(全鏈)
C.組平均
D.Ward方法
A.MIN(單鏈)
B.MAX(全鏈)
C.組平均
D.Ward方法
A.統(tǒng)計方法
B.鄰近度
C.密度
D.聚類技術
最新試題
小數(shù)據集的數(shù)據處理最好也由計算機手段來完成。
如果P(A B)= P(A),則P(A∩B)= P(A)P(B)。
使用偏差較小的模型總是比偏差較大的模型更好。
數(shù)據索引就像給每條數(shù)據裝了個信箱。
要將工作申請分為兩類,并使用密度估計來檢測離職申請人,我們可以使用生成分類器。
完整性,一致性,時效性,唯一性,有效性,準確性是衡量數(shù)據質量的六個維度指標。
最大似然估計的一個缺點是,在某些情況下(例如,多項式分布),它可能會返回零的概率估計。
當數(shù)據集標簽錯誤的數(shù)據點時,隨機森林通常比AdaBoost更好。
根據數(shù)據科學家與數(shù)據工程師對于問題的理解并相互討論,然后確定需要收集數(shù)據的范圍以及種類,然后數(shù)據工程師使用數(shù)據收集工具,架構,甚至編程的形式來進行數(shù)據收集的工作,然后并把數(shù)據收集的數(shù)據放置到對應的存儲系統(tǒng)。
數(shù)據壓縮與解壓縮可以使得數(shù)據處理的速度加快。