最新試題
選擇用于k均值聚類的聚類數(shù)k的一種好方法是嘗試k的多個值,并選擇最小化失真度量的值。
題型:判斷題
根據(jù)數(shù)據(jù)科學家與數(shù)據(jù)工程師對于問題的理解并相互討論,然后確定需要收集數(shù)據(jù)的范圍以及種類,然后數(shù)據(jù)工程師使用數(shù)據(jù)收集工具,架構,甚至編程的形式來進行數(shù)據(jù)收集的工作,然后并把數(shù)據(jù)收集的數(shù)據(jù)放置到對應的存儲系統(tǒng)。
題型:判斷題
非結構化數(shù)據(jù)也可以使用關系型數(shù)據(jù)庫來存儲。
題型:判斷題
數(shù)據(jù)壓縮與解壓縮可以使得數(shù)據(jù)處理的速度加快。
題型:判斷題
使用偏差較小的模型總是比偏差較大的模型更好。
題型:判斷題
使決策樹更深將確保更好的擬合度,但會降低魯棒性。
題型:判斷題
數(shù)據(jù)復制或者備份均是為了從提高數(shù)據(jù)并發(fā)這個角度來設計和實現(xiàn)的。
題型:判斷題
任何對數(shù)據(jù)處理與存儲系統(tǒng)的操作均需要記錄,這符合數(shù)據(jù)安全的要求。
題型:判斷題
當數(shù)據(jù)集標簽錯誤的數(shù)據(jù)點時,隨機森林通常比AdaBoost更好。
題型:判斷題
隨機梯度下降每次更新執(zhí)行的計算量少于批梯度下降。
題型:判斷題