หน่วยสมรรถนะ

หน่วยสมรรถนะ

เลือกเทคนิควิธีสำหรับการเรียนรู้แบบมีผู้สอน

สาขาวิชาชีพอุตสาหกรรมดิจิทัล


รายละเอียดหน่วยสมรรถนะ


1. รหัสหน่วยสมรรถนะ ICT-LPYX-254B

2. ชื่อหน่วยสมรรถนะ เลือกเทคนิควิธีสำหรับการเรียนรู้แบบมีผู้สอน

3. ทบทวนครั้งที่ - / -

4. สร้างใหม่ ปรับปรุง

5. สำหรับชื่ออาชีพและรหัสอาชีพ (Occupational Classification)

107%;font-family:"TH SarabunPSK",sans-serif;mso-fareast-font-family:"Times New Roman";
mso-fareast-theme-font:minor-fareast;mso-ansi-language:EN-US;mso-fareast-language:
EN-US;mso-bidi-language:TH" lang="TH">นักวิทยาศาสตร์ข้อมูล (
mso-fareast-font-family:"Times New Roman";mso-fareast-theme-font:minor-fareast;
mso-ansi-language:EN-US;mso-fareast-language:EN-US;mso-bidi-language:TH">Data
Scientist)



6. คำอธิบายหน่วยสมรรถนะ (Description of Unit of Competency)
    ผู้ที่ผ่านสมรรถนะนี้จะมีความรู้เกี่ยวกับการเลือกเทคนิควิธีสำหรับการเรียนรู้แบบมีผู้สอน โดยสามารถเลือกเทคนิคสำหรับการสร้างแบบจำลองแบบมีผู้สอนสำหรับการจำแนกข้อมูล (Classification) และการวิเคราะห์ถดถอย (Regression) ที่มีความเหมาะสมกับเครื่องมือที่มี เพื่อใช้ประมวลผลกับข้อมูลทั้งที่มีโครงสร้างที่ชัดเจน และไม่มีโครงสร้างที่ชัดเจน ที่ซึ่งมีความสัมพันธ์กับเป้าหมายธุรกิจ

7. สำหรับระดับคุณวุฒิ
1 2 3 4 5 6 7 8

8. กลุ่มอาชีพ (Sector)
สาขาวิชาชีพอุตสาหกรรมดิจิทัล สาขาวิทยาศาสตร์ข้อมูล (Data Science)  

9. ชื่ออาชีพและรหัสอาชีพอื่นที่หน่วยสมรรถนะนี้สามารถใช้ได้ (ถ้ามี)
N/A

10. ข้อกำหนดหรือกฎระเบียบที่เกี่ยวข้อง (Licensing or Regulation Related) (ถ้ามี)
N/A

11. สมรรถนะย่อยและเกณฑ์การปฏิบัติงาน (Elements and Performance Criteria)
หน่วยสมรรถนะย่อย (EOC) เกณฑ์ในการปฏิบัติงาน (Performance Criteria) รหัส PC
(ตามเล่มมาตรฐาน)
รหัส PC
(จากระบบ)
70401.01 จำแนกเทคนิคการเรียนรู้แบบมีผู้สอนแบบต่าง ๆ 1. ระบุความแตกต่างของเทคนิคการวิเคราะห์แบบมีผู้สอนแบบต่าง ๆ ได้ 70401.01.04 120953
2. ระบุลักษณะข้อมูลที่เหมาะสมกับการเรียนรู้แบบมีผู้สอนได้ 70401.01.05 120954
3. ระบุความแตกต่างของคำตอบหรือผลลัพธ์ที่จะได้ระหว่างเทคนิคต่าง ๆ สำหรับการเรียนรู้แบบมีผู้สอนได้ 70401.01.06 120955
70401.02 เลือกใช้เทคนิคการวิเคราะห์แบบมีผู้สอนแบบการจำแนกข้อมูล (Classification) ด้วยเทคนิค Decision Tree 1. ระบุหลักการของเทคนิคการวิเคราะห์แบบมีผู้สอนแบบการจำแนกข้อมูล (Classification) ด้วยเทคนิค Decision Tree ได้ 70401.02.05 120956
2. บอกถึงผลลัพธ์ที่จะได้รับจากการสร้างสมการหรือต้นแบบจำลองด้วยเทคนิค Decision Tree ได้ 70401.02.06 120957
3. กำหนดเครื่องมือช่วยในการวิเคราะห์แบบมีผู้สอนแบบการจำแนกข้อมูล (Classification) ด้วยเทคนิค Decision Tree ได้ 70401.02.07 120958
4. ตั้งสมมติฐานที่คาดว่าจะได้รับได้ 70401.02.08 120959
70401.03 เลือกใช้เทคนิคการวิเคราะห์แบบมีผู้สอนแบบการจำแนกข้อมูล (Classification) ด้วยเทคนิค SVM 1. ระบุหลักการของเทคนิคการวิเคราะห์แบบมีผู้สอนแบบการจำแนกข้อมูล (Classification) ด้วยเทคนิค SVM ได้ 70401.03.05 120960
2. บอกถึงผลลัพธ์ที่จะได้รับจากการสร้างสมการหรือแบบจำลองด้วยเทคนิค SVM ได้ 70401.03.06 120961
3. กำหนดเครื่องมือช่วยในการวิเคราะห์แบบมีผู้สอนแบบการจำแนกข้อมูล (Classification) ด้วยเทคนิค SVM ได้ 70401.03.07 120962
4. ตั้งสมมติฐานที่คาดว่าจะได้รับได้ 70401.03.08 120963
70401.04 เลือกใช้เทคนิคการวิเคราะห์แบบมีผู้สอนแบบการจำแนกข้อมูล (Classification) ด้วยเทคนิค ANN 1. ระบุหลักการของเทคนิคการวิเคราะห์แบบมีผู้สอนแบบการจำแนกข้อมูล (Classification) ด้วยเทคนิค ANN ได้ 70401.04.05 120964
2. บอกถึงผลลัพธ์ที่จะได้รับจากการสร้างสมการหรือแบบจำลองด้วยเทคนิค ANN ได้ 70401.04.06 120965
3. กำหนดเครื่องมือช่วยในการวิเคราะห์แบบมีผู้สอนแบบการจำแนกข้อมูล (Classification) ด้วยเทคนิค ANN ได้ 70401.04.07 120966
4. ตั้งสมมติฐานที่คาดว่าจะได้รับได้ 70401.04.08 120967
70401.05 เลือกใช้เทคนิคการวิเคราะห์แบบมีผู้สอนแบบการวิเคราะห์การถดถอย(Regression) ด้วยเทคนิค Linear Regression 1. ระบุหลักการของเทคนิคการวิเคราะห์แบบมีผู้สอนแบบการวิเคราะห์การถดถอย (Regression) ด้วยเทคนิค Linear Regression ได้ 70401.05.05 120968
2. บอกถึงผลลัพธ์ที่จะได้รับจากการสร้างสมการหรือแบบจำลองด้วยเทคนิค Linear Regression ได้ 70401.05.06 120969
3. กำหนดเครื่องมือช่วยในการวิเคราะห์แบบมีผู้สอนแบบการวิเคราะห์การถดถอย (Regression) ด้วยเทคนิค Linear Regression ได้ 70401.05.07 120970
4. ตั้งสมมติฐานที่คาดว่าจะได้รับได้ 70401.05.08 120971
70401.06 สื่อสารในระหว่างการดำเนินงาน 1. รับและส่งสารในระหว่างการดำเนินงานได้ 70401.06.04 120972
2. สอบถามและตอบข้อมูลในระหว่างการดำเนินงาน ได้ 70401.06.05 120973
3. สามารถสื่อสารผ่านสื่อสารสนเทศช่องทางต่าง ๆได้ 70401.06.06 120974

12. ความรู้และทักษะก่อนหน้าที่จำเป็น (Pre-requisite Skill & Knowledge)

N/A


13. ทักษะและความรู้ที่ต้องการ (Required Skills and Knowledge)

(ก) ความต้องการด้านทักษะ

1. สามารถใช้วิธีการวิเคราะห์และวิธีทางสถิติเพื่อช่วยเตรียมข้อมูลและเลือกข้อมูลได้

2. สามารถใช้เทคนิคและเครื่องมือสำหรับประมวลผลข้อมูลขนาดใหญ่ได้

3. สามารถใช้เทคนิคและเครื่องมือสำหรับประมวลผล SQL หรือ NoSQL หรือที่เกี่ยวข้องได้


(ข) ความต้องการด้านความรู้

1. เข้าใจธุรกิจและวิเคราะห์ข้อมูลให้สอดคล้องกับวัตถุประสงค์ธุรกิจ


14. หลักฐานที่ต้องการ (Evidence Guide)

(ก) หลักฐานการปฏิบัติงาน (Performance Evidence)

    1. ใบรับรองการปฏิบัติงานจากสถานประกอบการ

 (ข) หลักฐานความรู้ (Knowledge Evidence)

    1. ใบรับรองการเข้ารับการฝึกอบรม

    2. ใบประกาศนียบัตรวุฒิการศึกษา

 (ค) คำแนะนำในการประเมิน

    1. ผู้ประเมินตรวจประเมินเกี่ยวกับการเลือกเทคนิควิธีสำหรับการเรียนรู้แบบมีผู้สอน โดยพิจารณาจากร่องรอยหลักฐานที่เกี่ยวข้องทั้งหลักฐานการปฏิบัติงาน และหลักฐานความรู้

(ง) วิธีการประเมิน

    1. พิจารณาตามหลักฐานการปฏิบัติงาน

    2. พิจารณาตามหลักฐานความรู้



15. ขอบเขต (Range Statement)

(ก) คำแนะนำ

    หน่วยสมรรถนะนี้เป็นการเลือกเทคนิคต่าง ๆ ของการสร้างแบบจำลองแบบมีผู้สอนอย่างสอดคล้องกับปัญหาขององค์กรและข้อมูล รวมทั้งเครื่องมือช่วยต่าง ๆ ได้อย่างเหมาะสม

 (ข) คำอธิบายรายละเอียด

    1. การเข้าใจเทคนิคการวิเคราะห์แบบมีผู้สอน (Supervised Learning)

Supervised Learning หรือการเรียนรู้แบบมีผู้สอน เป็นศาสตร์แขนงหนึ่งใน AI หรือปัญญาประดิษฐ์ ภายใต้หัวข้อ Machine Learning คือการทำให้คอมพิวเตอร์สามารถหาคำตอบของปัญหาได้เอง ภายหลังจากเรียนรู้จากชุดข้อมูลตัวอย่างไปแล้วระยะหนึ่ง เป็นการเน้นการเรียนรู้จากข้อมูลในอดีต เพื่อสร้างเป็นแบบจำลองหรือแบบจำลองเพื่อทำนาย หรือคาดการณ์สิ่งที่จะเกิดในอนาคต โดยแบบจำลองหรือแบบจำลองอาจเป็นสมการคณิตศาสตร์ หรือกฎต่าง ๆ โดยแบ่งเป็นกลุ่มใหญ่ ๆ ดังนี้

1) การจำแนกข้อมูล (Classification) 

2) การวิเคราะห์การถดถอย (Regression)

   2. การจำแนกข้อมูล (Classification)  คือกระบวนการสร้างแบบจำลองจัดการข้อมูลให้อยู่ในกลุ่มที่กำหนดมาให้จากกลุ่มตัวอย่างข้อมูลที่เรียกว่าข้อมูลสอนระบบ (Training data) ที่แต่ละแถวของข้อมูลประกอบด้วยฟิลด์หรือแอทริบิวท์จำนวนมาก แอทริบิวท์นี้อาจเป็นค่าต่อเนื่อง (Continuous) หรือค่ากลุ่ม (Categorical) โดยจะมีแอทริบิวท์แบ่ง (Classifying attribute) ซึ่งเป็นตัวบ่งชี้คลาสของข้อมูล จุดประสงค์ของการจำแนกประเภทข้อมูลคือการสร้างแบบจำลองการแยกแอทริบิวท์หนึ่งโดยขึ้นกับแอทริบิวท์อื่น แบบจำลองที่ได้จากการจำแนกประเภทข้อมูลจะทำให้สามารถพิจารณาคลาสในข้อมูลที่ยังมิได้แบ่งกลุ่มในอนาคตได้ ตัวอย่างเทคนิคการจำแนกข้อมูลพื้นฐานมีดังนี้

    1) Decision Tree คือแบบจำลองทางคณิตศาสตร์ที่ใช้ทำนายประเภท โดยพิจารณาจากลักษณะของวัตถุ เป็นกระบวนการสร้างต้นไม้ขึ้นเพื่อใช้ในการตัดสินใจจากข้อมูลที่มีหมวดหมู่ ต้นไม้ตัดสินใจจะประกอบไปด้วยโหนดต่าง ๆ 

    2) การเข้าใจเทคนิคการวิเคราะห์ SVM

ซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machines : SVM) เป็นตัวแบบที่ใช้ในการแยกแยะข้อมูล โดยจะแบ่งข้อมูลด้วยระนาบหลายมิติ ซึ่งมีความใกล้เคียงกับ ANN 

    หลักการของ SVM คือการให้อินพุท (Input) ที่ใช้ฝึก (Train) เป็นเวคเตอร์ในสเปซ N มิติ เช่นถ้าในกรณีของ 2 มิติ และ 3 มิติ จะเป็นจุดที่อยู่ในระนาบ xy และสเปซ xyz ตามลำดับ จากนั้นทำการสร้างไฮเปอร์เพลน (Hyperplane) เพื่อแยกกลุ่มของเวคเตอร์อินพุตออกเป็นประเภทต่าง ๆ ในกรณีที่เป็น 2 มิติ และ 3 มิติ ไฮเปอร์เพลน คือเส้นตรงและระนาบตามลำดับ 

    3) การเข้าใจเทคนิคการวิเคราะห์ ANN (MLP)

Artificial Neural Networks (ANN) นับเป็นสาขาหนึ่งของปัญญาประดิษฐ์ (Artificial Intelligence, AI) มี Artificial Neurons ที่สามารถเรียนรู้ได้โดยใช้หลักการเช่นเดียวกับสมองมนุษย์ เรียนรู้โดยการปรับค่า Connection Weight เพื่อให้ได้ผลลัพธ์ที่มีความคลาดเคลื่อน (Error) น้อยที่สุด 

  3.  การวิเคราะห์ถดถอย (Regression) 

การทำนายค่าเชิงตัวเลขโดยการใช้หลักการทางสถิติที่เรียกว่า การถดถอย (regression) ซึ่ง Regression Analysis ถือเป็นเครื่องมือทางสถิติที่มีการประยุกต์ใช้ในการประมวลผลข้อมูลในงานวิจัยค่อนข้างมาก การวิเคราะห์การถดถอยจะเป็นแบบจำลองสำหรับการหาความสัมพันธ์ระหว่าง “predictor variable” ซึ่งเป็นค่าในแอทริบิวต่าง ๆที่ใช้ในการอธิบายคุณลักษณะของข้อมูลเรคคอร์ดหนึ่งๆ กับ “response variable”

   เทคนิคการวิเคราะห์ที่จัดอยู่ในกลุ่ม Regression มีหลายเทคนิค โดยมีเทคนิคที่สำคัญคือ

    1) Linear Regression 

    2) non-Linear Regression 

  4. เครื่องมือช่วยการวิเคราะห์ และการทำเหมืองข้อมูล (Data mining) มีหลากหลาย โดยมีโปรแกรมที่สำคัญดังนี้

    1) โปรแกรม Weka, RapidMiner 

    2) ภาษา R, Python, Java



16. หน่วยสมรรถนะร่วม (ถ้ามี)
N/A

17. อุตสาหกรรมร่วม/กลุ่มอาชีพร่วม (ถ้ามี)
N/A

18. รายละเอียดกระบวนการและวิธีการประเมิน (Assessment Description and Procedure)

1 เครื่องมือประเมินการจำแนกเทคนิคการเรียนรู้แบบมีผู้สอนแบบต่าง ๆตามข้อกำหนดมาตรฐาน

  1. ผลข้อสอบข้อเขียน

    ดูรายละเอียดจากคู่มือประเมิน

.2 เครื่องมือประเมินการเลือกใช้เทคนิคการวิเคราะห์แบบมีผู้สอนแบบการจำแนกข้อมูล (Classification) ด้วยเทคนิค Decision Tree ตามข้อกำหนดมาตรฐาน

  1. แบบฟอร์มประเมินผลการสัมภาษณ์

  2. ผลข้อสอบข้อเขียน

    ดูรายละเอียดจากคู่มือประเมิน

.3 เครื่องมือประเมินการเลือกใช้เทคนิคการวิเคราะห์แบบมีผู้สอนแบบการจำแนกข้อมูล (Classification) ด้วยเทคนิค SVM ตามข้อกำหนดมาตรฐาน

   1. แบบฟอร์มประเมินผลการสัมภาษณ์

   2. ผลข้อสอบข้อเขียน

     ดูรายละเอียดจากคู่มือประเมิน

4 เครื่องมือประเมินการเลือกใช้เทคนิคการวิเคราะห์แบบมีผู้สอนแบบการจำแนกข้อมูล (Classification) ด้วยเทคนิค ANN ตามข้อกำหนดมาตรฐาน

   1. แบบฟอร์มประเมินผลการสัมภาษณ์

   2. ผลข้อสอบข้อเขียน

     ดูรายละเอียดจากคู่มือประเมิน

5 เครื่องมือประเมินการเลือกใช้เทคนิคการวิเคราะห์แบบมีผู้สอนแบบการวิเคราะห์การถดถอย (Regression) ด้วยเทคนิค Linear Regression ตามข้อกำหนดมาตรฐาน

  1. แบบฟอร์มประเมินผลการสัมภาษณ์

  2. ผลข้อสอบข้อเขียน

   ดูรายละเอียดจากคู่มือประเมิน

6 เครื่องมือประเมินการสื่อสารในระหว่างการดำเนินงานตามข้อกำหนดมาตรฐาน

  1. แบบฟอร์มประเมินผลการสัมภาษณ์

  2. ผลข้อสอบข้อเขียน

    ดูรายละเอียดจากคู่มือประเมิน