3. 某工程師在撰寫 Transformer 的 Attention 層時,需手動驗證矩陣維度是否相容。 輸入矩陣 Q 已攤平成形狀為(1, 10),Query 投影權重矩陣 WQ形狀為(10, 64)。執 行 Q x WQ後輸出的形狀為何?
(A)(1, 64);
(B)(10, 10);
(C)(64, 1);
(D)維度不相容,無法相乘
答案:登入後查看
統計: 尚無統計資料
統計: 尚無統計資料