阿摩線上測驗
登入
首頁
>
iPAS◆資料處理與分析概論◆初級
>
111年 - 111 巨量資料分析師能力鑑定考試02:資料處理與分析概論#114287
> 試題詳解
10.下列是進行資料去識別化的動作,請問哪一個行為較「不」恰當?
(A) 將只有唯一一個值的欄位刪去
(B) 將性別的資料男和女轉為 0 和 1
(C) 模擬某欄位的資料分布,重新佈署資料,以保有資料的原有特徵
(D) 將性別欄位和年齡欄位隨機混合在一起
答案:
登入後查看
統計:
A(3), B(1), C(0), D(49), E(0) #3103435
詳解 (共 1 筆)
MoAI - 您的AI助手
B1 · 2025/11/13
#7078842
1. 題目解析 這道題目考查的是資料去識...
(共 800 字,隱藏中)
前往觀看
0
0
相關試題
11.下列哪一項是監督式(Supervised)的特徵工程(Feature Engineering)方法? (A) 線性判別分析(Linear Discriminant Analysis) (B) 主成分分析(Principal Component Analysis) (C) 潛在語意分析(Latent Semantic Analysis) (D) 獨立成分分析(Independent Component Analysis)
#3103436
12.下列哪一種類型資料,適合使用資料增益(Information Gain, IG)進行特 徵選取(Feature Selection)? (A) 擁有大量不同數值的資料特徵 (B) 名目(Nominal)的資料特徵 (C) 非離散化的數值特徵 (D) 連續型的數值
#3103437
13.在使用線性模型時,下列哪一種方法用來將名目(Nominal)類型資料轉 為實數(Real Number)類型資料,可以最公平的進行轉換而沒有對特定的 可能值(Possible Value)造成偏差? (A) 直接將所有不同數值轉為單一維度的布林值,如將性別(男、女)轉為二 維向量男=(1,0)及女=(0,1) (B) 依照名目(Nominal)類型資料的數值資訊轉為相對應的實數值,如將體 重(過重、一般、過輕)轉為(1, 0, -1) (C) 直接將特徵值給予對應的實數值,如將天氣(晴、陰、雨)轉為(0, 1, 2) (D) 依照特徵值給予範圍內隨機數值,如里程(遠、中、近)分別給予 100~ 1000(遠)、50~100(中)、0~50(近)的隨機數值
#3103438
14.在資料準備時,下列敘述哪一項錯誤? (A) 資料準備時,經過資料整合、清理、轉換、減少等步驟架構良好的資料 (B) 資料整合包括蒐集資料、選擇資料、整合資料 (C) 資料清理不包括減少變數數目、消除不一致、平衡偏斜資料 (D) 資料轉換包括正規化資料、分散/整合資料、建構新屬性
#3103439
15.關於特徵(屬性)萃取(Feature Extraction)與轉換(Transformation),下 列敘述哪一項正確? (A) 資料縮減泛指屬性挑選(Selection)與萃取(Extraction) (B) 屬性越多,表示後續建模有越多參數要調校,過度配適(Overfitting)的 風險越低 (C) 各屬性的量綱均一化屬於屬性萃取(Extraction)的工作 (D) 主成分分析(Principal Component Analysis, PCA)是分佈偏斜屬性常用的 轉換方法
#3103440
16.如附圖所示之程式碼,若使用 XPath 的語法要選擇在 plate 標籤層下的 apple,下列哪一項錯誤?(A) //plate/apple (B) /div/plate/apple (C) /plate/apple (D) //apple[1]
#3103441
17.若要確保巨量資料運算平台之服務,不會因為單點毀損導致無法存取服務 (Single Point of Failure, SPOF),我們會進行高可用性(High Availability, HA)的設計,關於 HA 的敘述,下列哪一項錯誤? (A) 服務層級協議(Service-Level Agreement)決定連續不中斷服務的程度, 等級越高表示服務等級越高 (B) Hadoop 上的 HDFS(Hadoop Distributed File System)的高可用性可透過 配置 Active/Active 兩個 NameNodes 節點解決 SPOF 問題 (C) 可以透過 JournalNode 的設計來儲存 HDFS(Hadoop Distributed File System)文件的紀錄,若發生 NameNode 損壞,新的 NameNode 可透過 此紀錄恢復既有的文件紀錄 (D) 具備有高可用性的架構下,發生 NameNode 損壞時,運行中的程式不受 影響,仍會繼續完成工作
#3103442
18.如附圖所示,Hadoop 最基本架構包含下列哪些項目?(A) (1)和(2) (B) (2)和(3) (C) (3)和(4) (D) (1)(2)(3)(4)
#3103443
19.若要取得某一網頁的資料,下列哪一個方法最正確? (A) UPDATE (B) HEAD (C) PUT (D) GET
#3103444
20.如附圖所示,有一個 data 數列,請問經過 MapReduce 模型處理的結果, 下列哪一項正確?(A) 15 (B) 55 (C) 25 (D) 49
#3103445
相關試卷
113年 - 113-1 巨量資料分析師能力鑑定初級試題:資料處理與分析概論#122978
2024 年 · #122978
112年 - 112 初級巨量資料分析師能力鑑定考試02:資料處理與分析概論#116824
2023 年 · #116824
111年 - 111 巨量資料分析師能力鑑定考試02:資料處理與分析概論#114287
2022 年 · #114287
110年 - 110-1 初級巨量資料分析師能力鑑定考試02:資料處理與分析概論#119175
2021 年 · #119175
110年 - 110-2 初級巨量資料分析師能力鑑定考試02:資料處理與分析概論#119174
2021 年 · #119174
109年 - 109-2 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119179
2020 年 · #119179
109年 - 109 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119176
2020 年 · #119176
108年 - 108 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119181
2019 年 · #119181