43. 某電商平台的演算法工程師開發了一個新版商品推薦模型,在離線 A/B 測試中, 新模型的各項評估指標(AUC、NDCG@10)均顯著優於現行線上模型。然而, 離線測試無法完全反映真實使用者的互動行為(點擊、購買、停留時間)。在正式 全面上線前,若希望在可控制風險下量化真實業務指標,應採用下列何種線上驗 證策略?
(A)影子模式(Shadow Mode):新舊模型同時產生預測,但僅顯示舊模型結果, 於後端比較輸出差異;
(B)回測(Backtesting):使用歷史日誌模擬模型表現作為上線依據;
(C)金絲雀發布(Canary Release):將 1–5%使用者流量導向新模型,量測 CTR、 CVR 等指標並逐步擴量;
(D)負載測試(Load Testing):於測試環境進行高流量壓力測試後直接全面上線
答案:登入後查看
統計: 尚無統計資料
統計: 尚無統計資料