9. 某企業在訓練生成式 AI 模型時,導入資料增強(Data Augmentation)技術以擴充訓練資料,但觀察到模型效能反而下降。 下列哪一項最可能的原因與對應改善策略最為正確?
(A)增強樣本未經隨機初始化,導致模型梯度更新不穩定,應重新設計訓練啟動流程;
(B)增強後資料的特徵分佈與原始資料不一致,影響模型的泛化能力,應檢查並調整增強策略以維持語意一致性;
(C)增強樣本的比例過高,造成模型對特定資料產生偏好,應適度提 高增強比例並調整學習率;
(D)增強後資料的標註可信度下降,導致訓練訊號偏差,應以半監督學習方式重新校正資料

答案:登入後查看
統計: A(1), B(7), C(11), D(0), E(0) #3773560

詳解 (共 1 筆)

#7373124
原因解析:
在生成式 AI 模型中,數據增強(Data Augmentation)的目的是增加訓練資料的「多樣性」,但若增強手法不當,會導致生成的新資料與原始資料的特徵分佈(Feature Distribution)產生嚴重偏離,或喪失原始語意(Semantic Consistency)。 [1, 2]
  • 舉例: 若使用詞替換(Synonym Replacement)但替換後的詞改變了句子原意,或影像數據增強中錯誤使用翻轉(如 6 與 9 的翻轉),都會引入噪聲或誤導性的樣本,導致模型學習到錯誤特徵,反而降低泛化能力。
改善策略:
應檢查數據增強後的樣本,確保其語意一致性(Semantic Consistency),調整增強強度或策略。 
0
0

私人筆記 (共 1 筆)

私人筆記#8068295
未解鎖
為什麼選 (B)?核心邏輯分析 資料增強...
(共 786 字,隱藏中)
前往觀看
1
0