3. 某工程師在建構搜尋引擎的詞向量模型時,語料庫規模達數十億 token,且包含 大量長尾詞彙(Long-tail Terms)。他在 Word2Vec 的 CBOW 與 Skip-gram 兩種訓 練策略之間進行選擇,需考量訓練效率與低頻詞表示品質之差異。下列何者最能 準確地反映兩者在此情境下的取捨?
(A)CBOW 對長尾詞表現更好,因為它透過多個上下文詞的平均來強化稀疏詞的 訓練訊號;
(B)CBOW 訓練速度較快、整體語意平滑,但對低頻詞的向量品質較差;Skip-gram 以中心詞預測周圍詞,對長尾詞累積更多訓練樣本,向量品質較優;
(C)Skip-gram 訓練速度更快,因為每次只需預測單一目標詞,計算量低於 CBOW;
(D)兩者對低頻詞的表現完全相同,差異僅在於訓練時的 Batch 組織方式

答案:登入後查看
統計: 尚無統計資料