การแบ่งกลุ่มข้อมูลแบบเคมีน

การแบ่งกลุ่มข้อมูลแบบเคมีน (k-means clustering) เป็นวิธีหนึ่งในวิธีการแบ่งเวกเตอร์ ที่มีรากฐานมาจากการประมวลผลสัญญาณ วิธีนี้เป็นที่นิยมสำหรับการแบ่งกลุ่มข้อมูล (cluster analysis) ในการทำเหมืองข้อมูล (data mining) การแบ่งกลุ่มข้อมูลแบบเคมีนใช้สำหรับการแบ่งการสังเกตจำนวน n สิ่งเป็น k กลุ่ม โดยแต่ละการสังเกตจะอยู่ในกลุ่มที่มีค่าเฉลี่ย(ที่ใช้เป็นแม่แบบ)ใกล้เคียงกันที่สุด โดยวิธีนี้จะเป็นการแบ่งพื้นที่ข้อมูลไปเป็นแผนภาพโวโรนอย วิธีการจัดกลุ่มนี้อยู่ในกลุ่มความซับซ้อนของปัญหาเอ็นพีแบบยาก (NP-hard) แต่อย่างไรเราสามารถนำขั้นตอนวิธีแบบศึกษาสำนึก (heuristic algorithm) มาใช้หาจุดศูนย์กลางของกลุ่มข้อมูลจากการลู่เข้าได้อย่างมีประสิทธิภาพ ซึ่งจะเหมือนกับขั้นตอนวิธีหาค่าคาดหมายสูงสุด (expectation-maximization algorithm) สำหรับโมเดลแบบผสม (Mixture Model) ของการแจกแจงปรกติ (Gaussian distribution) เนื่องจากทั้งสองขั้นตอนวิธีจะใช้แนวทางกระทำซ้ำการกลั่นกรอง (iterative refinement approach) นอกจากนี้ ทั้งสองขั้นตอนวิธียังใช้จุดศูนย์กลางของคลัสเตอร์สร้างแบบจำลองข้อมูล อย่างไรก็ตาม การแบ่งกลุ่มข้อมูลแบบเคมีนมีแนวโน้มจะได้คลัสเตอร์ผลลัพธ์ที่มีตำแหน่งขอบเขตใกล้เคียงกัน ในขณะที่ขั้นตอนวิธีหาค่าคาดหมายสูงสุดนั้นยอมให้คลัสเตอร์ผลลัพธ์มีรูปร่างที่แตกต่างกันได้ ขั้นตอนวิธีนี้ไม่มีอะไรเกี่ยวข้องกับวิธีการค้นหาเพื่อนบ้านใกล้สุด (k-nearest neighbor) ซึ่งเป็นเทคนิคการเรียนรู้ของเครื่อง (machine learning) ที่เป็นที่นิยมอีกอย่างหนึ่ง.

1 ความสัมพันธ์: การแบ่งกลุ่มข้อมูล

การแบ่งกลุ่มข้อมูล

การแบ่งกลุ่มข้อมูล (data clustering) เป็นวิธีการวิเคราะห์ข้อมูล ซึ่งใช้ในการเรียนรู้ของเครื่อง การทำเหมืองข้อมูล โดยจะแบ่งชุดข้อมูล (มักจะเป็นเวกเตอร์) ออกเป็นกลุ่ม (cluster) นำข้อมูลที่มีคุณลักษณะเหมือนกัน หรือคล้ายกันจัดไว้ในกลุ่มเดียวกัน ขั้นตอนวิธีที่ใช้ในการแบ่งกลุ่มจะอาศัยความเหมือน (similarity) หรือ ความใกล้ชิด (proximity) โดยคำนวณจากการวัดระยะระหว่างเวกเตอร์ของข้อมูลเข้า โดยใช้การวัดระยะแบบต่าง ๆ เช่น การวัดระยะแบบยูคลิด (Euclidean distance) การวัดระยะแบบแมนฮัตตัน (Manhattan distance) การวัดระยะแบบเชบิเชฟ (Chebychev distance) การแบ่งกลุ่มข้อมูลจะแตกต่างจากการแบ่งประเภทข้อมูล (classification) โดยจะแบ่งกลุ่มข้อมูลจากความคล้าย โดยไม่มีการกำหนดประเภทของข้อมูลไว้ก่อน จึงกล่าวได้ว่าการแบ่งกลุ่มข้อมูล เป็นการเรียนรู้แบบไม่มีผู้สอน ขั้นตอนวิธีการแบ่งกลุ่ม ได้แก่ k-means clustering, hierarchical clustering, self-organizing map (som) การแบ่งกลุ่มข้อมูลอาจใช้เป็นข้อตอนเบื้องต้นของการวิเคราะห์ข้อมูล เพื่อช่วยในการลดขนาดข้อมูล (แยกเป็นหลาย ๆ กลุ่มและคัดเฉพาะบางกลุ่มเพื่อทำการวิเคราะห์ต่อไป หรือแยกการวิเคราะห์ออกเป็นสำหรับแต่ละกลุ่ม) ก่อนที่จะนำไปวิเคราะห์ด้วยวิธีการอื่นต่อไป ขั้นตอนวิธีในการแบ่งกลุ่มข้อมูล โดยทั่วไปแบ่งได้เป็น 2 ประเภทใหญ่ๆ คือ การแบ่งแบบเป็นลำดับขั้น (hierarchical) และ การแบ่งแบบตัดเป็นส่วน (partitional) การแบ่งแบบเป็นลำดับขั้นนั้น จะมีทำการแบ่งกลุ่มจากกลุ่มย่อยที่ถูกแบ่งไว้ก่อนหน้านั้นซ้ำหลายครั้ง ส่วนการแบ่งแบบตัดเป็นส่วนนั้น การแบ่งจะทำเพียงครั้งเดียว การแบ่งแบบเป็นลำดับขั้น จะมี 2 ลักษณะคือ แบบล่างขึ้นบน (bottom-up) หรือ เป็นการแบ่งแบบรวมกลุ่มจากกลุ่มย่อยให้ใหญ่ขึ้นไปเรื่อยๆ โดยเริ่มจากกลุ่มเล็กสุดคือในแต่ละกลุ่มมีข้อมูลเพียงตัวเดียว และ แบบบนลงล่าง (top-down) หรือ เป็นการแบ่งแบบกลุ่มจากกลุ่มใหญ่ให้ย่อยไปเรื่อยๆ โดยเริ่มจากกลุ่มใหญ่ที่สุด คือกลุ่มเดียวมีข้อมูลทุกตัวอยู่ในกลุ่ม หมวดหมู่:การเรียนรู้ของเครื่อง หมวดหมู่:การค้นหาความรู้ในฐานข้อมูล.

ใหม่!!: การแบ่งกลุ่มข้อมูลแบบเคมีนและการแบ่งกลุ่มข้อมูล · ดูเพิ่มเติม »

เปลี่ยนเส้นทางที่นี่:

K-means clustering

ยูเนี่ยนพีเดียเป็นแผนที่แนวคิดหรือเครือข่ายความหมายจัดเป็นสารานุกรม - dictionary มันให้คำนิยามสั้น ๆ ของแต่ละแนวคิดและความสัมพันธ์ของมัน

นี่เป็นแผนที่ออนไลน์แบบยักษ์ซึ่งทำหน้าที่เป็นพื้นฐานสำหรับแผนผังแนวคิด สามารถใช้งานได้ฟรีและสามารถอ่านบทความหรือเอกสารแต่ละฉบับได้ เป็นเครื่องมือทรัพยากรหรือข้อมูลอ้างอิงสำหรับการศึกษาการวิจัยการศึกษาการเรียนการสอนหรือการสอนซึ่งครูหรือนักการศึกษานักเรียนหรือนักศึกษาสามารถนำมาใช้ได้ สำหรับโลกการศึกษา: สำหรับโรงเรียนระดับประถมศึกษามัธยมศึกษาตอนปลายระดับกลางระดับกลางระดับปริญญาตรีวิทยาลัยมหาวิทยาลัยระดับปริญญาตรีปริญญาโทปริญญาเอกหรือปริญญาเอก สำหรับเอกสารรายงานโครงการความคิดเอกสารการสำรวจผลสรุปหรือวิทยานิพนธ์ ต่อไปนี้เป็นคำจำกัดความคำอธิบายรายละเอียดหรือความหมายของข้อมูลสำคัญที่คุณต้องการข้อมูลและรายการแนวคิดที่เกี่ยวข้องของพวกเขาเป็นอภิธานศัพท์ มีอยู่ในไทย, ภาษาอังกฤษ, ภาษาสเปน, ภาษาโปรตุเกส, ญี่ปุ่น, ชาวจีน, ภาษาฝรั่งเศส, ภาษาเยอรมัน, อิตาลี, ขัด, ดัตช์, ภาษารัสเซีย, ภาษาอาหรับ, ฮินดู, สวีเดน, ยูเครน, ฮังการี, คาตาลัน, ภาษาเช็ก, ฮีบรู, เดนมาร์ก, ภาษาฟินแลนด์, ชาวอินโดนีเซีย, ภาษานอร์เวย์, โรมาเนีย, ตุรกี, ภาษาเวียดนาม, เกาหลี, กรีก, ภาษาบัลแกเรีย, โครเอเชีย, ภาษาสโลวัก, ภาษาลิทัวเนีย, ฟิลิปปินส์, ภาษาลัตเวีย, ภาษาเอสโตเนีย และ ภาษาสโลวีเนีย ภาษาอื่น ๆ เร็ว ๆ นี้

ข้อมูลทั้งหมดถูกดึงออกจาก วิกิพีเดีย และมีให้บริการภายใต้ใบอนุญาต สัญญาอนุญาตครีเอทีฟคอมมอนส์ แบบแสดงที่มา-อนุญาตแบบเดียวกัน

ยูเนี่ยนพีเดีย ไม่ได้รับการรับรองโดยหรือร่วมกับมูลนิธิวิกิมีเดีย

Google Play Android และโลโก้ของ Google Play เป็นเครื่องหมายการค้าของ Google Inc.

นโยบายความเป็นส่วนตัว