7. 某金融團隊建立信貸風險模型,特徵工程後共產生 200 個變數,其中「月收入」、 「年收入」、「季收入」三者高度相關。模型上線後業務單位反映:每次重新訓練 後,模型輸出的重要特徵清單在這些高度相關特徵間反覆變動,難以向審查單位 解釋。請問下列何者為造成此現象最可能的原因?
(A)模型使用 L2 正則化,導致所有特徵係數被壓縮至接近零,重要性難以區分;
(B)模型使用 L1 正則化,面對高度相關特徵時隨機保留其中之一,導致每次訓練 保留的特徵不穩定;
(C)模型未使用任何正則化,過擬合導致係數每次收斂至不同極值;
(D)特徵數量過多導致梯度消失,應優先進行 PCA 降維再套用正則化

答案:登入後查看
統計: 尚無統計資料