數(shù)據(jù)挖掘工程師章節(jié)練習(xí)(2020.04.27)

來(lái)源:考試資料網(wǎng)
參考答案:面對(duì)高維,復(fù)雜,異構(gòu)的海量數(shù)據(jù),如何集中獲取有用的信息和知識(shí)。
參考答案:數(shù)據(jù)清洗是一種使用模式識(shí)別和其他技術(shù),在將原始數(shù)據(jù)轉(zhuǎn)換和移到數(shù)據(jù)倉(cāng)庫(kù)之前來(lái)升級(jí)原始數(shù)據(jù)質(zhì)量的技術(shù)。
參考答案:星形模式;雪花模式;事實(shí)星座模式
參考答案:

SQL命令(如Insert或Update)
由DW供應(yīng)商或第三方提供專門(mén)的加載工具
由DW管理員編寫(xiě)自定義程序

參考答案:①盡可能賦予屬性名和屬性值明確的含義;
②統(tǒng)一多數(shù)據(jù)源的屬性值編碼;
③去除無(wú)用的惟一屬性或鍵值(如自動(dòng)...
參考答案:在數(shù)據(jù)抽取方面,未來(lái)的技術(shù)發(fā)展將集中在系統(tǒng)集成化方面。它將互連、轉(zhuǎn)換、復(fù)制、調(diào)度、監(jiān)控納入標(biāo)準(zhǔn)化的統(tǒng)一管理,使系統(tǒng)更便于...