A.選擇任務(wù)相關(guān)的數(shù)據(jù)
B.選擇要挖掘的知識(shí)類型
C.模式的興趣度度量
D.模式的可視化表示
您可能感興趣的試卷
你可能感興趣的試題
A.關(guān)聯(lián)分析
B.分類和預(yù)測(cè)
C.孤立點(diǎn)分析
D.演變分析
E.概念描述
A.關(guān)聯(lián)分析
B.分類和預(yù)測(cè)
C.聚類分析
D.孤立點(diǎn)分析
E.演變分析
A.所涉及的算法的復(fù)雜性
B.所涉及的數(shù)據(jù)量
C.計(jì)算結(jié)果的表現(xiàn)形式
D.是否使用了人工智能技術(shù)
A.目標(biāo)市場(chǎng)分析
B.購(gòu)物籃分析
C.模式識(shí)別
D.信用卡欺詐檢測(cè)
A.二分K均值
B.MST
C.Chameleon
D.組平均
最新試題
非結(jié)構(gòu)化數(shù)據(jù)也可以使用關(guān)系型數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)。
經(jīng)常跟管理層打交道并進(jìn)行有效地關(guān)于商業(yè)領(lǐng)域的討論有助于數(shù)據(jù)科學(xué)項(xiàng)目的成功。
最大似然估計(jì)的一個(gè)缺點(diǎn)是,在某些情況下(例如,多項(xiàng)式分布),它可能會(huì)返回零的概率估計(jì)。
公司內(nèi)部收集的數(shù)據(jù)不存在需要考慮數(shù)據(jù)隱私的環(huán)節(jié)。
數(shù)據(jù)索引是保證數(shù)據(jù)處理高性能的軟件角度的一種手段,不做數(shù)據(jù)索引的數(shù)據(jù)訪問(wèn)是線性訪問(wèn),但是做了索引的數(shù)據(jù)訪問(wèn)會(huì)成倍的降低訪問(wèn)時(shí)間。
選擇用于k均值聚類的聚類數(shù)k的一種好方法是嘗試k的多個(gè)值,并選擇最小化失真度量的值。
當(dāng)數(shù)據(jù)集標(biāo)簽錯(cuò)誤的數(shù)據(jù)點(diǎn)時(shí),隨機(jī)森林通常比AdaBoost更好。
數(shù)據(jù)壓縮與解壓縮可以使得數(shù)據(jù)處理的速度加快。
使用正則表達(dá)式可以找到一個(gè)文本文件中所有可能出現(xiàn)的手機(jī)號(hào)碼。
完整性,一致性,時(shí)效性,唯一性,有效性,準(zhǔn)確性是衡量數(shù)據(jù)質(zhì)量的六個(gè)維度指標(biāo)。