阿摩線上測驗
登入
首頁
>
iPAS◆資料處理與分析概論◆初級
>
109年 - 109-2 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119179
> 試題詳解
37. 下列何種集群方法可以解決資料中有離群值及類別屬性的問題?
(A) k 平均數(k-means)
(B) k 代表點(k-medoids)
(C) k 近鄰(k nearest neighbor)
(D) k 奇異值分解(k-singular value decomposition)
答案:
登入後查看
統計:
A(0), B(4), C(3), D(2), E(0) #3219321
詳解 (共 1 筆)
MoAI - 您的AI助手
B1 · 2025/10/26
#6971229
1. 題目解析 在這道考題中,我們需要選...
(共 1092 字,隱藏中)
前往觀看
0
0
相關試題
38. 關於探索式資料繪圖,下列敘述何者正確? (A) 直方圖之 X 軸資料是間斷不連續的 (B) 長條圖不適合用於類別型資料分析 (C) 分位數圖(QQ Plot)無法用於常態分佈視覺化檢驗 (D) 盒鬚圖中的盒子下上(或左右)邊界分別為第一與第三四分位數
#3219322
39. 關於 k 平均數(k-means)集群法,下列敘述何者正確? (A) 可以處理類別型資料 (B) 不同的起始群集中心,產生的分群結果皆相同 (C) 穩定性高,對異常值或極端值不敏感 (D) 不適合非球形、數據密度變化大或有離群數據的集群問題
#3219323
40. 關於非監督式學習(unsupervised learning),下列敘述何者正確? (A) 需要事先以人力標記資料 (B) 迴歸分析(regression analysis)是屬於非監督式學習 (C) 無法發現變數間或觀測值間的子群體 (D) 集群分析為非監督式學習的方法之一
#3219324
41. 參考附圖,R 語言中,執行 fpc 套件的 dbscan 函數,進行空間密度集群算法(Density-Based Spatial Clustering of Applications with Noise, DBSCAN)分析,下列敘述何者正確? (A) MinPts 表示可到達區域的最小點個數,本例為 0.45 (B) eps 表示可達區域定義鄰域的距離,本例為 5 (C) db.dbscan 物件最右側集群編號 2 的種子點(seed)個數為 65 (D) DBSCAN 最終集群結果分為三個緊密的群
#3219325
複選題42. 關於類別相關指標,下列敘述何者「不」正確? (A) 普遍率(prevalence)與偵測普遍率(detection prevalence)都必大於偵測率(detection) (B) F 衡量其實是在等權值的假設下,偵測率(detection)與召回率 (recall)兩者的調和平均數 (C) 特異性(specificity)是陰性事件被正確預測出來的比例 (D) 1 減去真陽性(True Positive, TP)後即為假陰性(False Negative, FN),它是陽性事件中被錯誤預測(假陰性)的比例
#3219326
43. 評估分類模型優劣時須先計算混淆矩陣(confusion matrix),關於 2×2 混淆矩陣,下列敘述何者「不」正確? (A) 行列交叉得到真陽性(True Positive, TP)、真陰性(True Negative, TN)、偽陽性(False Positive, FP)、偽陰性(False Negative, FN) 四種情況 (B) 橫列可以表示預測的結果,分別是預測為陰性與陽性 (C) 預測為陽性的個數如果增加,則陰性的預測數自然會減少 (D) 陽性與陰性的預測數量是獨立非相依的
#3219327
44. 下列何者「不」是資料降維的方法? (A) 主成分分析(Principal Component Analysis, PCA) (B) 單熱編碼(one-hot encoding) (C) 局部線性嵌入(locally linear embedding) (D) 等距特徵映射(Isometric feature mapping, Isomap)
#3219328
45. 參考附圖,將機器學習的訓練錯誤(training error)與測試錯誤(testing error)對資料集的大小作圖,紅線位置模型的表現為何? (A) 模擬退火(simulated annealing) (B) 梯度下降(gradient descent) (C) 過度配適(overfitting) (D) 降維(dimension reduction)
#3219329
46. 實務上常見各類樣本分佈差距大的不平衡學習(imbalanced learning) 情況,關於不平衡學習的處理方式,下列何者「不」正確? (A) 以過度抽樣(over sampling)或降低抽樣(down sampling)解決, 此種方法可避免模型過度配適或遺失多數樣本中的重要訊息 (B) 運用正負樣本的懲罰權重來解決,若分析建模的算法支援樣本權 重設定,此方法是簡單有效的解決途徑 (C) 以薈萃式學習(ensemble learning)集成模型解決,形成模型預測 能力良好的森林 (D) 進行屬性挑選(feature selection)以解決類別不平衡問題,透過縱 行的操弄來提高模型績效
#3219330
47. 關於附圖的混淆矩陣(橫列為真實值,蹤行為預測值),請問其正確率與失誤率各是多少? (A) 40%,60% (B) 44%,56% (C) 55%,45% (D) 60%,40%
#3219331
相關試卷
113年 - 113-1 巨量資料分析師能力鑑定初級試題:資料處理與分析概論#122978
2024 年 · #122978
112年 - 112 初級巨量資料分析師能力鑑定考試02:資料處理與分析概論#116824
2023 年 · #116824
111年 - 111 巨量資料分析師能力鑑定考試02:資料處理與分析概論#114287
2022 年 · #114287
110年 - 110-1 初級巨量資料分析師能力鑑定考試02:資料處理與分析概論#119175
2021 年 · #119175
110年 - 110-2 初級巨量資料分析師能力鑑定考試02:資料處理與分析概論#119174
2021 年 · #119174
109年 - 109-2 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119179
2020 年 · #119179
109年 - 109 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119176
2020 年 · #119176
108年 - 108 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119181
2019 年 · #119181