阿摩線上測驗
登入
首頁
>
iPAS◆資料處理與分析概論◆初級
>
113年 - 113-1 巨量資料分析師能力鑑定初級試題:資料處理與分析概論#122978
> 試題詳解
12. 下列何者為常見的資料標準化及正規化方法?
(A) 計算 Z 分數(Z-score)
(B) 計算峰態(Kurtosis)
(C) 計算偏態係數(Skewness Coefficient)
(D) 計算變異數(Variance)
答案:
登入後查看
統計:
A(18), B(2), C(0), D(3), E(0) #3323442
詳解 (共 1 筆)
MoAI - 您的AI助手
B1 · 2025/10/11
#6874704
1. 題目解析 這道題目考察的是資料的標...
(共 1007 字,隱藏中)
前往觀看
0
0
相關試題
13. 假設有一個電商銷售資料表,其中一個欄位為消費者的「所 在區域」。若要對此欄位進行處理、轉換為數值特徵,下列 哪一個方法較適合? (A) 因素分析(Factor Analysis) (B) 獨熱編碼(One-hot Encoding) (C) 主成份分析(Principal Component Analysis) (D) 關聯規則(Association Rule)
#3323443
14. 當您的資料集中含有一個重要的時間戳記(Time Stamp)特 徵時,如果希望將它轉換為模型能更好理解的格式,下列哪一種方法是將時間戳記特徵轉換為有用特徵的最佳選項? (A) 將時間戳記轉換為自該年度開始的天數 (B) 僅保留小時訊息,因為它是預測日活動的最關鍵因素 (C) 從時間戳記中提取年、月、日、小時等單獨的部分 (D) 將每個時間戳記轉換為其對應的 UNIX 時間戳
#3323444
15. 當您在處理一批大型房地產交易資料時,發現某些數值型特 徵如房屋面積和房價等各樣本數值分佈偏斜不對稱。為了提升模型的效能及預測的精準度,您打算對這些特徵進行轉換。針對這類數據分佈偏斜的問題,下列哪一種調整方法最為適合? (A) 獨熱編碼(One-Hot Encoding),將數值型特徵轉換 為類別型特徵後進行編碼 (B) 正規化(Normalization),將所有數據按比例縮放至 一定範圍,例如[0, 1]區間中 (C) 對數變換(Logarithmic Transformation),對數據進 行對數處理 (D) 主成份分析(Principal Components Analysis, PCA), 透過降維以簡化數據結構,並盡可能保留原數據的 變異性
#3323445
16. 下列哪一項是設計 Hadoop 分散式檔案系統(HDFS)的主要 特色? (A) 儲存大量小檔案 (B) 具有高容錯率 (C) 低寫入延遲 (D) 支援即時查詢
#3323446
17. 下列何者「不」屬於低度結構化(Low Structure)資料? (A) 數值資料 (B) 文字資料 (C) 影像資料 (D) 聲紋資料
#3323447
18. 關於低度結構化(Low Structure)資料的處理方式敘述,下 列何者錯誤? (A) Open CV 是常用的資料處理工具之一 (B) NoSQL 是最常用來存放低度結構化資料的資料庫, NoSQL 代表「不只是 SQL(Not only SQL)」的意思,而非完全不用 SQL 語法 (C) 自然語言處理(NLP)是用來處理文字資料的方法 (D) 影像資料處理多半使用.NET 語言
#3323448
19. 在 Python 3 中,使用多執行緒(Multi Threading)進行網路 爬蟲時,下列哪一個選項「不」是多執行緒可能帶來的效益? (A) 提高整體爬取效率,節省總爬取時間 (B) 提高單個頁面加載的速度 (C) 實現多個網頁同時下載 (D) 實現非阻塞 I/O 操作
#3323449
20. 在對低結構化文字數據進行情感分析前,進行實體識別 (Named Entity Recognition, NER),下列哪一項是主要目的? (A) 確定文本中的語法結構 (B) 識別和分類文本中的專有名詞 (C) 計數文本中的每個字詞出現次數 (D) 建立文本的自動摘要
#3323450
21. 下列哪一項「不」是用來衡量數值變數(Quantitate Variables) 的距離函數(Distance Function)或接近性函數(Proximity Function)(即:相似/不相似函數(Similarity/Dissimilarity Function)之統稱)的衡量指標? (A) 歐幾里德直線距離(Euclidean Distance) (B) 曼哈頓市街直角距離(Manhattan Distance) (C) 明可夫斯基距離(Minkowski Distance) (D) 谷本距離(Tanimoto Distance)
#3323451
22. 下列那一種重抽樣方法是隨機 k 等分樣本集後,每次保留一 份作為測試集樣本,而以其餘 k-1 份樣本進行模型訓練? (A) 拔靴抽樣(Bootstrapping) (B) 交叉驗證(Fold Cross Validation) (C) 保留法(Holdout) (D) 袋外樣本(Out-of-bag Samples)
#3323452
相關試卷
113年 - 113-1 巨量資料分析師能力鑑定初級試題:資料處理與分析概論#122978
2024 年 · #122978
112年 - 112 初級巨量資料分析師能力鑑定考試02:資料處理與分析概論#116824
2023 年 · #116824
111年 - 111 巨量資料分析師能力鑑定考試02:資料處理與分析概論#114287
2022 年 · #114287
110年 - 110-1 初級巨量資料分析師能力鑑定考試02:資料處理與分析概論#119175
2021 年 · #119175
110年 - 110-2 初級巨量資料分析師能力鑑定考試02:資料處理與分析概論#119174
2021 年 · #119174
109年 - 109-2 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119179
2020 年 · #119179
109年 - 109 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119176
2020 年 · #119176
108年 - 108 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119181
2019 年 · #119181