หน่วยสมรรถนะ

หน่วยสมรรถนะ

เลือกเทคนิคการวิเคราะห์แบบไม่มีผู้สอน (Select Modelling Techniques for Unsupervised learning)

สาขาวิชาชีพอุตสาหกรรมดิจิทัล


รายละเอียดหน่วยสมรรถนะ


1. รหัสหน่วยสมรรถนะ ICT-PROI-393B

2. ชื่อหน่วยสมรรถนะ เลือกเทคนิคการวิเคราะห์แบบไม่มีผู้สอน (Select Modelling Techniques for Unsupervised learning)

3. ทบทวนครั้งที่ 1 / 566

4. สร้างใหม่ ปรับปรุง

5. สำหรับชื่ออาชีพและรหัสอาชีพ (Occupational Classification)

นักวิทยาศาสตร์ข้อมูล (Data Scientist)



6. คำอธิบายหน่วยสมรรถนะ (Description of Unit of Competency)
สามารถเลือกเทคนิคสำหรับการวิเคราะห์แบบไม่มีผู้สอนสำหรับการแบ่งกลุ่มข้อมูล (Clustering) และการค้นหากฎความสัมพันธ์ (Association) ที่มีความเหมาะสมกับเครื่องมือที่มี สำหรับข้อมูลทั้งที่มีโครงสร้างที่ชัดเจน และไม่มีโครงสร้างที่ชัดเจน ที่ซึ่งมีความสัมพันธ์กับเป้าหมายธุรกิจ

7. สำหรับระดับคุณวุฒิ
1 2 3 4 5 6 7 8

8. กลุ่มอาชีพ (Sector)
สาขาวิชาชีพอุตสาหกรรมดิจิทัล สาขาวิทยาศาสตร์ข้อมูล  (Data Science)  

9. ชื่ออาชีพและรหัสอาชีพอื่นที่หน่วยสมรรถนะนี้สามารถใช้ได้ (ถ้ามี)
N/A

10. ข้อกำหนดหรือกฎระเบียบที่เกี่ยวข้อง (Licensing or Regulation Related) (ถ้ามี)
N/A

11. สมรรถนะย่อยและเกณฑ์การปฏิบัติงาน (Elements and Performance Criteria)
หน่วยสมรรถนะย่อย (EOC) เกณฑ์ในการปฏิบัติงาน (Performance Criteria) รหัส PC
(ตามเล่มมาตรฐาน)
รหัส PC
(จากระบบ)
70402.01 จำแนกเทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบต่าง ๆ 1. ระบุเทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบต่าง ๆ ได้ 179857
70402.01 จำแนกเทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบต่าง ๆ 2. ระบุถึงแหล่งที่มาของข้อมูลที่เหมาะสมกับเทคนิคการวิเคราะห์แบบไม่มีผู้สอนได้ 179858
70402.01 จำแนกเทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบต่าง ๆ 3. บอกความแตกต่างของคำตอบหรือผลลัพธ์ที่จะได้ระหว่างเทคนิคต่าง ๆ ที่จัดอยู่ในกลุ่มนี้ได้ 179859
70402.02 เลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค k-Mean 1. ระบุหลักการของเทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค k-Mean ได้ 179860
70402.02 เลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค k-Mean 2. บอกถึงผลลัพธ์ที่จะได้รับจากการสร้างสมการหรือแบบจำลองด้วยเทคนิค k-Mean ได้ 179861
70402.02 เลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค k-Mean 3. กำหนดเครื่องมือช่วยในการวิเคราะห์แบบมีไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค k-Mean ได้ 179862
70402.02 เลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค k-Mean 4. ตั้งสมมติฐานที่คาดว่าจะได้รับได้ 179863
70402.03 เลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค Hierarchical 1. ระบุหลักการของเทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค Hierarchical ได้ 179864
70402.03 เลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค Hierarchical 2. บอกถึงผลลัพธ์ที่จะได้รับจากการสร้างสมการหรือแบบจำลองด้วยด้วยเทคนิค Hierarchical ได้ 179865
70402.03 เลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค Hierarchical 3. กำหนดเครื่องมือช่วยในการวิเคราะห์แบบมีไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค Hierarchical ได้ 179866
70402.03 เลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค Hierarchical 4. ตั้งสมมติฐานที่คาดว่าจะได้รับได้ 179867
70402.04 เลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการค้นหากฎความสัมพันธ์ (Association) ด้วยเทคนิค Apriori 1. ระบุหลักการของเทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการค้นหากฎความสัมพันธ์ (Association) ด้วยเทคนิค Apriori ได้ 179868
70402.04 เลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการค้นหากฎความสัมพันธ์ (Association) ด้วยเทคนิค Apriori 2. บอกถึงผลลัพธ์ที่จะได้รับจากการสร้างสมการหรือแบบจำลองด้วยด้วยเทคนิค Apriori ได้ 179869
70402.04 เลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการค้นหากฎความสัมพันธ์ (Association) ด้วยเทคนิค Apriori 3. กำหนดเครื่องมือช่วยในการวิเคราะห์แบบมีไม่มีผู้สอนแบบการค้นหากฎความสัมพันธ์ (Association) ด้วยเทคนิค Apriori ได้ 179870
70402.04 เลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการค้นหากฎความสัมพันธ์ (Association) ด้วยเทคนิค Apriori 4. ตั้งสมมติฐานที่คาดว่าจะได้รับได้ 179871

12. ความรู้และทักษะก่อนหน้าที่จำเป็น (Pre-requisite Skill & Knowledge)
N/A

13. ทักษะและความรู้ที่ต้องการ (Required Skills and Knowledge)

(ก) ความต้องการด้านทักษะ

1.  สามารถใช้วิธีการวิเคราะห์และวิธีทางสถิติเพื่อช่วยเตรียมข้อมูลและเลือกข้อมูลได้

2.  สามารถใช้เทคนิคและเครื่องมือสำหรับประมวลผลข้อมูลขนาดใหญ่ได้

3.  สามารถใช้เทคนิคและเครื่องมือสำหรับประมวลผล SQL หรือ NoSQL หรือที่เกี่ยวข้องได้

(ข) ความต้องการด้านความรู้

1.เข้าใจธุรกิจและวิเคราะห์ข้อมูลให้สอดคล้องกับวัตถุประสงค์ธุรกิจ


14. หลักฐานที่ต้องการ (Evidence Guide)

(ก) หลักฐานการปฏิบัติงาน (Performance Evidence)

1. ใบรับรองการปฏิบัติงานจากสถานประกอบการ

(ข) หลักฐานความรู้ (Knowledge Evidence)

1. ใบรับรองการเข้ารับการฝึกอบรม

2. ใบประกาศนียบัตรวุฒิการศึกษา

 (ค) คำแนะนำในการประเมิน

1. ผู้ประเมินตรวจประเมินเกี่ยวกับการเลือกเทคนิควิธีสำหรับการเรียนรู้แบบไม่มีผู้สอน โดยพิจารณาจากร่องรอยหลักฐานที่เกี่ยวข้องทั้งหลักฐานการปฏิบัติงาน และหลักฐานความรู้

(ง) วิธีการประเมิน

1. พิจารณาตามหลักฐานการปฏิบัติงาน

2. พิจารณาตามหลักฐานความรู้


15. ขอบเขต (Range Statement)

(ก) คำแนะนำ

หน่วยสมรรถนะนี้เป็นการเลือกเทคนิคต่าง ๆ ของการสร้างแบบจำลองแบบไม่มีผู้สอนอย่างสอดคล้องกับปัญหาขององค์กรและข้อมูล รวมทั้งเครื่องมือช่วยต่าง ๆ ได้อย่างเหมาะสม

 (ข) คำอธิบายรายละเอียด

1. การเข้าใจเทคนิคการวิเคราะห์แบบไม่มีผู้สอน (Unsupervised Learning) คือการเรียนรู้แบบระบบจะไม่ได้รับการป้อนรูปแบบผลลัพธ์ที่ต้องการไปในการเรียนรู้ และต้องเรียนรู้จากข้อมูลที่ได้จากการกระทำต่าง ๆ เอง และพัฒนาดีขึ้นเมื่อเรียนรู้จากความผิดพลาดในอดีตบ่อยครั้งขึ้น โดยสามารถแบ่งแยกย่อยได้เป็นดังนี้ 

    1) การจัดกลุ่มข้อมูล (Clustering) 

    2) การค้นหาความสัมพันธ์ (Association Rule) 

2. การจัดกลุ่มข้อมูล (Clustering) เป็นเทคนิคที่ใช้จำแนกหรือแบ่ง Case ของข้อมูล หรือแบ่งตัวแปรออกเป็นกลุ่มย่อย ๆ ตั้งแต่ 2 กลุ่มขึ้นไป Case ที่อยู่ในกลุ่มเดียวกันจะมีคุณลักษณะที่เหมือนกันหรือคล้ายกัน ส่วน Case ที่อยู่ต่างกลุ่มกัน จะมีลักษณะที่แตกต่างกัน โดยสามารถแบ่งกลุ่มหรือจัดกลุ่มได้ตามความเหมือน (Similarity) หรือตามความแตกต่าง (Dissimilarity or Distance) ของข้อมูลนั้น ๆ การจัดกลุ่มจะแตกต่างจากการแบ่งประเภทข้อมูล (Classification) โดยจะแบ่งกลุ่มข้อมูลจากความคล้าย โดยไม่มีการกำหนดคลาส (Class) ประเภทข้อมูลไว้ก่อนหรือไม่ทราบจำนวนกลุ่มล่วงหน้า โดยมีเทคนิคที่สำคัญดังนี้

        1) k-Mean หรือเรียกอีกอย่างหนึ่งว่า การวิเคราะห์กลุ่มแบบไม่เป็นขั้นตอน (Nonhierarchical Cluster Analysis) หรือ การแบ่งส่วน (Partitioning) เป็นอัลกอริทึมเทคนิคการเรียนรู้โดยไม่มีผู้สอนที่ง่ายที่สุด

        2) Hierarchical หรือการแบ่งกลุ่มแบบลำดับระดับ เป็นการแบ่งกลุ่มจากกลุ่มย่อยที่ถูกแบ่งไว้ก่อนหน้านั้นซ้ำหลายครั้ง เป็นเทคนิคที่นิยมใช้กันมากในการจัดกลุ่ม Case หรือจัดกลุ่มตัวแปร 

3. การค้นหาความสัมพันธ์ (Association Rule) เป็นเทคนิคหนึ่งของ Data Mining เพื่อการค้นหาความสัมพันธ์ของข้อมูลจากข้อมูลขนาดใหญ่ที่มีอยู่ เพื่อนำไปหารูปแบบที่เกิดขึ้นบ่อยๆ (frequent pattern) และใช้ในการวิเคราะห์ความสัมพันธ์หรือทำนายปรากฏการณ์ต่าง ๆ โดยมีเทคนิคที่สำคัญดังนี้

    1) Apriorism เป็นอัลกอริทึมพื้นฐานที่ใช้ในการหาความสัมพันธ์ของข้อมูลโดยใช้หลักการค้นหาแบบวงกว้างก่อนนับทรานแซคชัน 

4.เครื่องมือช่วยการวิเคราะห์ และการทำเหมืองข้อมูล (Data mining) มีหลากหลาย โดยมีโปรแกรมที่สำคัญดังนี้

    1) โปรแกรม Weka, RapidMiner 

2) ภาษา R, Python, Java


16. หน่วยสมรรถนะร่วม (ถ้ามี)
N/A

17. อุตสาหกรรมร่วม/กลุ่มอาชีพร่วม (ถ้ามี)
N/A

18. รายละเอียดกระบวนการและวิธีการประเมิน (Assessment Description and Procedure)

18.1 เครื่องมือประเมินการจำแนกเทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบต่าง ๆ ตามข้อกำหนดมาตรฐาน

1. ผลข้อสอบข้อเขียน

ดูรายละเอียดจากคู่มือประเมิน

18.2 เครื่องมือประเมินการเลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค k-Mean ตามข้อกำหนดมาตรฐาน

1. แบบฟอร์มประเมินผลการสัมภาษณ์

2. ผลข้อสอบข้อเขียน

ดูรายละเอียดจากคู่มือประเมิน

18.3 เครื่องมือประเมินการเลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการแบ่งกลุ่มข้อมูล (Clustering) ด้วยเทคนิค Hierarchical ตามข้อกำหนดมาตรฐาน

1. แบบฟอร์มประเมินผลการสัมภาษณ์

2. ผลข้อสอบข้อเขียน

ดูรายละเอียดจากคู่มือประเมิน

18.4 เครื่องมือประเมินการเลือกใช้เทคนิคการวิเคราะห์แบบไม่มีผู้สอนแบบการค้นหากฎความสัมพันธ์ (Association) ด้วยเทคนิค Apriori ตามข้อกำหนดมาตรฐาน

1. แบบฟอร์มประเมินผลการสัมภาษณ์

2. ผลข้อสอบข้อเขียน

ดูรายละเอียดจากคู่มือประเมิน



ยินดีต้อนรับ