9. 某企業在訓練生成式 AI 模型時,導入資料增強(Data Augmentation)技術以擴充訓練資料,但觀察到模型效能反而下降。 下列哪一項最可能的原因與對應改善策略最為正確?
(A)增強樣本未經隨機初始化,導致模型梯度更新不穩定,應重新設計訓練啟動流程;
(B)增強後資料的特徵分佈與原始資料不一致,影響模型的泛化能力,應檢查並調整增強策略以維持語意一致性;
(C)增強樣本的比例過高,造成模型對特定資料產生偏好,應適度提 高增強比例並調整學習率;
(D)增強後資料的標註可信度下降,導致訓練訊號偏差,應以半監督學習方式重新校正資料
答案:登入後查看
統計: A(1), B(7), C(11), D(0), E(0) #3773560
統計: A(1), B(7), C(11), D(0), E(0) #3773560
詳解 (共 1 筆)
#7373124
原因解析:
- 舉例: 若使用詞替換(Synonym Replacement)但替換後的詞改變了句子原意,或影像數據增強中錯誤使用翻轉(如 6 與 9 的翻轉),都會引入噪聲或誤導性的樣本,導致模型學習到錯誤特徵,反而降低泛化能力。
改善策略:
應檢查數據增強後的樣本,確保其語意一致性(Semantic Consistency),調整增強強度或策略。
0
0