2. 一家新創公司希望對 Llama3 70B 模型進行領域微調(Domain Fine-Tuning)以建立企業專用助理，但 GPU 記憶體有限，無法支撐完整模型的反向傳播梯度計算。工程師希望凍結(freeze)原模型權重、僅訓練少量額外參數的前提下，評估採用 LoRA(Low-Rank Adaptation)方案。請問 LoRA 在此場景下的主要優勢為何？
(A)透過知識蒸餾(Knowledge Distillation)將 70B 模型壓縮為較小的學生模型；
(B)對原始模型各層權重進行剪枝(Pruning)，移除低重要性參數後再進行微調；
(C)凍結原始預訓練權重，僅在各層加入低秩分解的可訓練矩陣，大幅降低可訓練參數量與 GPU 記憶體需求；
(D)將模型中的注意力機制改為稀疏注意力(Sparse Attention)，以降低長序列計算成本

答案：登入後查看
統計： 尚無統計資料

相關試題

3. 某工程師在建構搜尋引擎的詞向量模型時，語料庫規模達數十億 token，且包含大量長尾詞彙(Long-tail Terms)。他在 Word2Vec 的 CBOW 與 Skip-gram 兩種訓練策略之間進行選擇，需考量訓練效率與低頻詞表示品質之差異。下列何者最能準確地反映兩者在此情境下的取捨？ (A)CBOW 對長尾詞表現更好，因為它透過多個上下文詞的平均來強化稀疏詞的訓練訊號； (B)CBOW 訓練速度較快、整體語意平滑，但對低頻詞的向量品質較差；Skip-gram 以中心詞預測周圍詞，對長尾詞累積更多訓練樣本，向量品質較優； (C)Skip-gram 訓練速度更快，因為每次只需預測單一目標詞，計算量低於 CBOW； (D)兩者對低頻詞的表現完全相同，差異僅在於訓練時的 Batch 組織方式

4. 某金融科技公司的工程師正在準備內部客服對話與交易紀錄文本，進行 BERT 模型的預訓練，以提升模型對金融語境的理解能力，並採用遮蔽語言建模(Masked Language Model, MLM)作為訓練任務。請問 MLM 的核心訓練目標為何？ (A)讓模型自左至右逐 token 生成句子，學習自迴歸語言模型(Autoregressive LM) 能力； (B)透過對抗訓練(Adversarial Training)縮小真實句與生成句之間的語意差異；(C)隨機遮蔽輸入序列中部分 token，訓練模型根據雙向上下文預測被遮蔽的原始內容； (D)透過遮蔽低頻詞來減少詞彙表大小，降低 Embedding 的記憶體使用

5. 某電商平台的工程師在開發商品評論情感分析系統時，發現使用 One-Hot 編碼無法表達詞語之間的語意關係，且隨著詞彙表擴大，向量維度與記憶體需求快速增加。工程師因此改用 Word2Vec 進行詞語表示。請問 Word2Vec 從根本上解決了上述問題的哪項限制？ (A)建立詞語之間的序列依賴關係，以捕捉長距離上下文語意； (B)根據詞語在語料中的出現頻率調整其重要性，使模型更重視高頻詞； (C)降低詞彙表示的維度，同時保留語意結構，避免高維稀疏表示所帶來的限制； (D)透過監督式學習利用標註語料，提升詞語分類的準確性

6. 某自駕車感知系統需要在同一張影像中同時完成道路、建築、行人的逐像素分類，並且能夠區分畫面中兩名相鄰行人(標記為「行人#1」和「行人#2」)。工程師在選擇語義分割(Semantic Segmentation)與實例分割(Instance Segmentation)時，請問兩者的根本差異為何？ (A)實例分割對每個像素進行分類但不產生 Bounding Box；語義分割產生 Bounding Box 但不進行像素級標記； (B)實例分割僅用於影像層級的類別分類，語義分割才進行逐像素標記； (C)語義分割將每個像素分配至預定義類別，但同一類別內的不同個體無法區分；實例分割能對同一類別的不同物件(如兩名行人)分別建立獨立遮罩(Mask)； (D)語義分割與實例分割皆為逐像素分類任務，但兩者在是否需要區分不同物件個體上並無差異

7. 某大型超市的防損系統需要即時偵測多名顧客各自手持的購物籃、手機與商品，並需對每個物件進行精確區域標記(Pixel-level Mask)，同時能區分畫面中不同個體(即使不同顧客拿著相同商品，也需分別標記)。請問下列哪一項技術最適合此場景的需求？ (A)影像分類(Image Classification)； (B)目標檢測(Object Detection)； (C)實例分割(Instance Segmentation)； (D)語義分割(Semantic Segmentation)

8. 某工程師訓練了一個皮膚病變二元分類模型(惡性/良性)，在向臨床醫師報告模型效能時，使用 ROC 曲線(Receiver Operating Characteristic Curve)進行呈現。請問 ROC 曲線的橫軸(X 軸)與縱軸(Y 軸)分別代表哪些指標，且在醫療情境中代表哪一種意義？ (A)X 軸為準確率(Accuracy)，Y 軸為召回率(Recall)，表示模型整體分類正確比例與偵測能力； (B)X 軸為假陽率(False Positive Rate, FPR)，Y 軸為真陽率(True Positive Rate, TPR)，反映誤診健康個體的風險與正確識別病患的能力； (C)X 軸為精確率(Precision)，Y 軸為召回率(Recall)，表示預測為陽性樣本的準確性與完整性； (D)X 軸為 IoU 閾值，Y 軸為 mAP，反映物件偵測模型在不同重疊條件下的表現

9. 某團隊在監控影像分類模型的線上效能時，透過儀表板呈現混淆矩陣(Confusion Matrix)，以觀察模型預測結果與實際標籤的分佈情形。請問下列哪一項無法從混淆矩陣中直接計算？ (A)精確率(Precision)； (B)準確率(Accuracy)； (C)召回率(Recall)； (D)ROC 曲線下面積(AUC)

10. 某工廠導入即時影像瑕疵偵測系統，需在高頻影像流中進行快速推論。工程師在 YOLO 與 Faster R-CNN 兩種物件偵測架構之間進行評估，請問下列哪一個針對兩者在偵測流程設計上的差異最為正確？ (A)YOLO 採用單階段偵測，直接從整張影像預測物件位置與類別；Faster R-CNN 則先產生候選區域再進行分類； (B)YOLO 與 Faster R-CNN 皆採用兩階段流程，但在特徵擷取方式上有所不同； (C)YOLO 採用單階段架構，主要透過增加候選區域數量來提升偵測準確率； (D)Faster R-CNN 採用單階段偵測方式，將物件定位與分類整合於同一模型中

11. 某工程師在分析 Transformer 架構時，發現自注意力機制(Self-Attention)能夠有效提升模型對序列中長距離依賴關係的建模能力。請問 Self-Attention 的核心功能為何？ (A)透過隱藏狀態的遞迴傳遞，逐步累積序列中的上下文資訊； (B)讓序列中每個 token 能與其他所有 token 建立關聯，並根據重要性分配權重； (C)對輸入序列進行局部運算，以捕捉相鄰詞之間的關係； (D)將整個序列壓縮為固定長度表示，以提供後續任務使用

12. 某工程師在設計一個二元分類器(Binary Classifier)時，考慮在輸出層使用 Sigmoid 函數。請問 Sigmoid 函數的主要特性與限制為何？ (A)可將輸入轉換為任意實數範圍，適合用於迴歸任務； (B)可將輸入壓縮至(0, 1)區間，可解釋為機率值，但在輸入值過大或過小時可能產生梯度消失問題； (C)可將輸入轉換為多類別機率分布，常用於多分類任務； (D)可在整個輸入範圍內梯度保持穩定，適合用於深層神經網路

相關試卷

115年 - 115-1 AI應用規劃師_中級能力鑑定公告試題_第三科：機器學習技術與應用#141075

2026 年 · #141075

115年 - 115-1 中級AI應用規劃師試題_第二科：大數據處理分析與應用#141063

2026 年 · #141063

115年 - 115-1中級AI應用規劃師公告試題_第一科：人工智慧技術應用與規劃_#141062

2026 年 · #141062

114年 - 114-2 AI 應用規劃師-中級能力鑑定公告試題_第三科：機器學習技術與應用#136329

2025 年 · #136329

114年 - 114-2 AI 應用規劃師-中級能力鑑定公告試題_第二科：大數據處理分析與應用#136306

2025 年 · #136306

114年 - 114-2 AI 應用規劃師-中級能力鑑定公告試題_一科：人工智慧技術應用與規劃#136301

2025 年 · #136301

114年 - iPAS AI應用規劃師中級能力鑑定-考試樣題(114/09)_科目三：機器學習技術與應用#136300

2025 年 · #136300

114年 - iPAS AI應用規劃師中級能力鑑定-考試樣題(114/09)_科目二：大數據處理分析與應用#136295

2025 年 · #136295

114年 - iPAS AI應用規劃師中級能力鑑定-考試樣題(114/09)_科目一：人工智慧技術應用與規劃#136294

2025 年 · #136294

114年 - iPAS AI 應用規劃師能力鑑定考試樣題(中級)#126106

2025 年 · #126106