9. 某企業在訓練生成式 AI 模型時，導入資料增強(Data Augmentation)技術以擴充訓練資料，但觀察到模型效能反而下降。下列哪一項最可能的原因與對應改善策略最為正確？
(A)增強樣本未經隨機初始化，導致模型梯度更新不穩定，應重新設計訓練啟動流程；
(B)增強後資料的特徵分佈與原始資料不一致，影響模型的泛化能力，應檢查並調整增強策略以維持語意一致性；
(C)增強樣本的比例過高，造成模型對特定資料產生偏好，應適度提高增強比例並調整學習率；
(D)增強後資料的標註可信度下降，導致訓練訊號偏差，應以半監督學習方式重新校正資料

答案：登入後查看
統計： A(2), B(25), C(17), D(0), E(0) #3773560

詳解 (共 1 筆)

hchungw

B1 · 2026/05/15

#7373124

原因解析：

在生成式 AI 模型中，數據增強（Data Augmentation）的目的是增加訓練資料的「多樣性」，但若增強手法不當，會導致生成的新資料與原始資料的特徵分佈（Feature Distribution）產生嚴重偏離，或喪失原始語意（Semantic Consistency）。 [1, 2]

舉例： 若使用詞替換（Synonym Replacement）但替換後的詞改變了句子原意，或影像數據增強中錯誤使用翻轉（如 6 與 9 的翻轉），都會引入噪聲或誤導性的樣本，導致模型學習到錯誤特徵，反而降低泛化能力。

改善策略：

應檢查數據增強後的樣本，確保其語意一致性（Semantic Consistency），調整增強強度或策略。

私人筆記 (共 1 筆)

Louis Li

2026/05/10

私人筆記#8068295

未解鎖

為什麼選 (B)？核心邏輯分析資料增強...

(共 786 字，隱藏中）

前往觀看

詳解 (共 1 筆)

私人筆記 (共 1 筆)

相關試題

相關試卷