問答題
考慮下表數據集,請完成以下問題:
(1)估計條件概率。
(2)根據(1)中的條件概率,使用樸素貝葉斯方法預測測試樣本(A=0,B=1,C=0)的類標號;
(3)使用Laplace估計方法,其中p=1/2,l=4,估計條件概率。
(4)同(2),使用(3)中的條件概率。
(5)比較估計概率的兩種方法,哪一種更好,為什么?
您可能感興趣的試卷
你可能感興趣的試題
1.問答題
考慮下表所示二元分類問題的數據集。
(1)計算按照屬性A和B劃分時的信息增益。決策樹歸納算法將會選擇哪個屬性?
(2)計算按照屬性A和B劃分時Gini系數。決策樹歸納算法將會選擇哪個屬性?
2.問答題評估分類模型的性能的方法有哪些?
3.問答題簡述分類模型性能評價的指標。
4.問答題簡述分類模型的評價。
5.問答題簡述決策樹的構建。
最新試題
根據數據科學家與數據工程師對于問題的理解并相互討論,然后確定需要收集數據的范圍以及種類,然后數據工程師使用數據收集工具,架構,甚至編程的形式來進行數據收集的工作,然后并把數據收集的數據放置到對應的存儲系統。
題型:判斷題
數據存儲體系中并不牽扯計算機網絡這一環(huán)節(jié)。
題型:判斷題
要將工作申請分為兩類,并使用密度估計來檢測離職申請人,我們可以使用生成分類器。
題型:判斷題
小數據集的數據處理最好也由計算機手段來完成。
題型:判斷題
假設屬性的數量固定,則可以在時間上以線性方式學習基于高斯的貝葉斯最優(yōu)分類器,而該數量是數據集中記錄的數量。
題型:判斷題
數據索引是保證數據處理高性能的軟件角度的一種手段,不做數據索引的數據訪問是線性訪問,但是做了索引的數據訪問會成倍的降低訪問時間。
題型:判斷題
管理員不需要驗證就可以訪問數據存儲系統中的任何數據,這符合數據安全的要求。
題型:判斷題
數據壓縮與解壓縮可以使得數據處理的速度加快。
題型:判斷題
當數據集標簽錯誤的數據點時,隨機森林通常比AdaBoost更好。
題型:判斷題
使決策樹更深將確保更好的擬合度,但會降低魯棒性。
題型:判斷題