A.去掉數(shù)據(jù)中的噪聲
B.對(duì)數(shù)據(jù)進(jìn)行匯總和聚集
C.使用概念分層,用高層次概念替換低層次“原始”數(shù)據(jù)
D.將屬性按比例縮放,使之落入一個(gè)小的特定區(qū)間
您可能感興趣的試卷
你可能感興趣的試題
A.填補(bǔ)數(shù)據(jù)種的空缺值
B.集成多個(gè)數(shù)據(jù)源的數(shù)據(jù)
C.得到數(shù)據(jù)集的壓縮表示
D.規(guī)范化數(shù)據(jù)
A.概念分層
B.離散化
C.分箱
D.直方圖
A.孤立點(diǎn)
B.空缺值
C.測量變量中的隨即錯(cuò)誤或偏差
D.數(shù)據(jù)變換引起的錯(cuò)誤
A.空間填充曲線
B.散點(diǎn)圖矩陣
C.平行坐標(biāo)
D.圓弓分割
A.標(biāo)稱屬性
B.二元屬性
C.序數(shù)屬性
D.數(shù)值屬性
最新試題
通常,當(dāng)試圖從大量觀察中學(xué)習(xí)具有少量狀態(tài)的HMM時(shí),我們幾乎總是可以通過允許更多隱藏狀態(tài)來增加訓(xùn)練數(shù)據(jù)的可能性。
通過統(tǒng)計(jì)學(xué)可以推測擲兩個(gè)撒子同時(shí)選中3點(diǎn)的幾率。
任務(wù)調(diào)度系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)才能使得數(shù)據(jù)收集工作可以不間斷地按照既定的目標(biāo)從目標(biāo)源獲取數(shù)據(jù)。
經(jīng)常跟管理層打交道并進(jìn)行有效地關(guān)于商業(yè)領(lǐng)域的討論有助于數(shù)據(jù)科學(xué)項(xiàng)目的成功。
無論質(zhì)心的初始化如何,K-Means始終會(huì)給出相同的結(jié)果。
使決策樹更深將確保更好的擬合度,但會(huì)降低魯棒性。
給定用于2類分類問題的線性可分離數(shù)據(jù)集,線性SVM優(yōu)于感知器,因?yàn)镾VM通常能夠在訓(xùn)練集上實(shí)現(xiàn)更好的分類精度。
管理員不需要驗(yàn)證就可以訪問數(shù)據(jù)存儲(chǔ)系統(tǒng)中的任何數(shù)據(jù),這符合數(shù)據(jù)安全的要求。
對(duì)于文本數(shù)據(jù)和多媒體數(shù)據(jù)進(jìn)行特征提取是為了方便對(duì)于這類數(shù)據(jù)的觀察和理解。
小數(shù)據(jù)集的數(shù)據(jù)處理最好也由計(jì)算機(jī)手段來完成。