2025年9月26日 星期五

2025 09 26 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 iPAS AI應用規劃師初級能力鑑定-考試樣題 科目一:人工智慧基礎概論公司在整合資料時,發現同一客戶的姓名 在不同系統中拼寫不一致 (例 如「陳大文」與「陳大文先生」), 導致資料無法正確對應。 請問此類 資 料品質問題 應該在ETL(擷取Extract、轉換Transform、載入Load) 哪一個 流程步驟中進行處理? (A) 資料轉換(Data Transformation) (B) 資料擷取(Data Extraction) (C) 資料載入(Data Loading) (D) 型態轉換(Type Conversion)

 

2025 09 26 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 iPAS AI應用規劃師初級能力鑑定-考試樣題 科目一:人工智慧基礎概論公司在整合資料時,發現同一客戶的姓名 在不同系統中拼寫不一致 (例 如「陳大文」與「陳大文先生」), 導致資料無法正確對應。 請問此類 資 料品質問題 應該在ETL(擷取Extract、轉換Transform、載入Load) 哪一個 流程步驟中進行處理? (A) 資料轉換(Data Transformation) (B) 資料擷取(Data Extraction) (C) 資料載入(Data Loading) (D) 型態轉換(Type Conversion)

 iPAS AI應用規劃師初級能力鑑定-考試樣題 


  科目一:人工智慧基礎概論


下列資料型態,何者最常 用來儲存

員工年齡、員工年資、貨品銷售量等 資料?

    (A) 文字型(Text) 

    (B) 數值型(Numeric)

    (C) 日期型(Date)

    (D) 布林型(Boolean) 


   某行銷公司  欲針對新客戶 進行「行銷活動推播」

   目前擁有資料包含:

   客 戶基本資料(尚未有購買紀錄)、

   客戶過往點擊行為(未標記是否完成購 買)、

   類似客戶是否曾購買過(已標記「有/無購買」標籤)。

   若該公司希 望預測新的單一客戶是否可能完成購買行為,

   下列哪一種  學習方式 與  資 料搭配   最合適? 


 (A) 使用非監督式學習,分析所有客戶點擊路徑進行異常偵測

 (B) 使用非監督式學習,將客戶分群後預測其轉換率 

 (C) 使用監督式學習,針對未標記資料直接預測轉換可能性

 (D) 使用監督式學習,以已知購買結果作為標籤進行訓練 


在品質管理中,若一產品的生產過程中  標準差顯著偏大

通常意味著什 麼? 

 (A) 資料點高度集中,產品質量穩定 

 (B) 生產過程波動大,產品品質不穩定 

 (C) 資料無法反映產品實際狀況 

 (D) 中位數數值高,品質良率較高 


   某AI團隊在分析一組  連續型數據  時,發現部分紀錄的

   數值明顯高於其 他資料點。若 專案目標 是 識別高價值客戶

   的行為模式,下列哪一種處理 方式最為合適?

    (A) 立即刪除離群值,以避免模型訓練時出現偏差 

    (B) 視為錯誤值並全部替換為平均值 

    (C) 保留離群值並標註為高價值異常點,納入後續模型訓練考量 

    (D) 將離群值全數轉換為中位數,避免影響平均計算 4 題號 答案 題目 


   在檢視資料品質時,可參考資料變異程度及資料的

   集中趨勢。下列何 者不屬於  資料集中趨勢衡量  的方法?

     (A) 平均數(Mean)

     (B) 中位數(Median)

     (C) 眾數(Mode)

      (D) 標準差(Standard Deviation)


某醫院研究特定心血管疾病的成因,

收集了50名  病患  與  150名正常人 

年齡、血壓、血型等三項屬性變數。

此研究適合使用下列  哪一種機器 學習模型  來建立?

(A) 決策樹(Decision Tree) 

 (B) 線性廻歸(Linear Regression) 

 (C) 基於密度之含噪空間聚類法

     (Density-Based Spatial Clustering of Application with Noise, DBSCAN) 

 (D) K-means聚類(K-means Clustering) 


 公司在整合資料時,發現同一客戶的姓名

 在不同系統中拼寫不一致

(例 如「陳大文」與「陳大文先生」),

 導致資料無法正確對應。

 請問此類  資 料品質問題

  應該在ETL(擷取、轉換、載入) 哪一個  流程步驟中進行處理?

 (A) 資料轉換(Data Transformation) 

 (B) 資料擷取(Data Extraction) 

 (C) 資料載入(Data Loading)

 (D) 型態轉換(Type Conversion)


 銀行想建立聊天機器人,可透過下列哪一種領域技術來達成?

      (A) 資料庫管理技術

      (B) 機器學習與自然語言處理 

      (C) 網頁開發技術 

       (D) 網路安全技術 


線性迴歸模型最適合解決哪種類型的問題? 

     (A) 圖像分類

      (B) 銷售額預測

      (C) 聚類分析 

      (D) 遊戲策略學習



ETL(擷取、轉換、載入)流程

  是一個將資料從來源系統移動到目標系統的過程,

   包含三個主要步驟:

    1.擷取 原始資料,

    2.轉換 資料使其  符合  特定格式並進行驗證,

    3.最後將載入資料  至 目標儲存位置如資料倉儲或資料湖。

    此過程旨在  確保資料  的準確性、一致性,以便後續

     進行分析  和  商業智慧應用。 

 1. 擷取 (Extract)

    目標從一個或多個來源系統中提取資料。 

    資料來源來源可能非常多樣,包括資料庫、API、檔案、IoT 日誌、文件、

                        電子郵件和應用程式等。 

     處理在擷取階段,主要目的是將資料移至一個中繼區域(如暫存區)

                 以進行下一步的處理。 

   2. 轉換 (Transform)

      目標對擷取的資料進行必要的處理,使其符合目的儲存的格式和業務規則。 

      處理

          清理:移除重複、不完整或明顯錯誤的資料記錄。

          格式化:將資料轉換為統一的通用格式,例如調整

                          資料型態、 欄位合併或分割等。

          驗證:根據業務邏輯驗證資料的準確性與可靠性。

          聚合:將資料進行匯總或整理。 

     3. 載入 (Load)

          目標:將轉換後的資料傳送至目的地系統進行儲存。 

          處理將資料載入到目標資料倉儲、資料庫、資料湖或資料儲存庫中。

                      此步驟可包含初始載入所有資料,或只載入自上次流程執行以來

                      新增的增量變更。載入可以是即時的,也可以是按計劃分批進行的。 

結論

             ETL 流程透過「擷取」、「轉換」和「載入」三個步驟,

             將分散且格式各異的原始資料,轉化為可用於進階分析的

             乾淨、結構化資料,從而支援企業做出更好的決策。 




沒有留言:

張貼留言