43. 在進行遷移學習微調(Fine-Tuning)時,通常會將優化器的學習率(Learning Rate) 設得非常小(如 1e-4),下列何者為主要的原因?
(A)為了避免記憶體耗盡(OOM);
(B)為了加速模型整體的收斂時間;
(C)為了讓損失函數強制歸零;
(D)為了避免更新步伐過大,破壞預訓練模型原本已學好的良好特徵表示
答案:登入後查看
統計: 尚無統計資料
統計: 尚無統計資料