5 ความสัมพันธ์: การบีบอัดข้อมูลการแบ่งกลุ่มข้อมูลการแจกแจงความน่าจะเป็นการเรียนรู้ของเครื่องการเรียนรู้แบบมีผู้สอน
การบีบอัดข้อมูล
การบีบอัดข้อมูล (data compression) เป็นสาขาวิชาหนึ่งในวิทยาการคอมพิวเตอร์ หมายถึง การศึกษาวิธีการในการจัดเก็บข้อมูล ที่ทำให้ใช้เนื้อที่ในการจัดเก็บน้อยลง การบีบอัดข้อมูล มีความสำคัญในระบบการสื่อสารและจัดเก็บข้อมูล เนื่องจากทำให้เก็บหรือรับส่งข้อมูลได้มากขึ้น โดยใช้เนื้อที่เท่าเดิม (คำว่าเนื้อที่นี้ อาจจะเป็นเนื้อที่จัดเก็บข้อมูล หรือเนื้อที่ในช่องสัญญาณก็ได้) การบีบอัดข้อมูลแบ่งได้เป็นสองประเภทใหญ่ ๆ ตามคุณภาพของข้อมูลที่ถูกบีบอัดแล้ว คือ.
ใหม่!!: การเรียนรู้แบบไม่มีผู้สอนและการบีบอัดข้อมูล · ดูเพิ่มเติม »
การแบ่งกลุ่มข้อมูล
การแบ่งกลุ่มข้อมูล (data clustering) เป็นวิธีการวิเคราะห์ข้อมูล ซึ่งใช้ในการเรียนรู้ของเครื่อง การทำเหมืองข้อมูล โดยจะแบ่งชุดข้อมูล (มักจะเป็นเวกเตอร์) ออกเป็นกลุ่ม (cluster) นำข้อมูลที่มีคุณลักษณะเหมือนกัน หรือคล้ายกันจัดไว้ในกลุ่มเดียวกัน ขั้นตอนวิธีที่ใช้ในการแบ่งกลุ่มจะอาศัยความเหมือน (similarity) หรือ ความใกล้ชิด (proximity) โดยคำนวณจากการวัดระยะระหว่างเวกเตอร์ของข้อมูลเข้า โดยใช้การวัดระยะแบบต่าง ๆ เช่น การวัดระยะแบบยูคลิด (Euclidean distance) การวัดระยะแบบแมนฮัตตัน (Manhattan distance) การวัดระยะแบบเชบิเชฟ (Chebychev distance) การแบ่งกลุ่มข้อมูลจะแตกต่างจากการแบ่งประเภทข้อมูล (classification) โดยจะแบ่งกลุ่มข้อมูลจากความคล้าย โดยไม่มีการกำหนดประเภทของข้อมูลไว้ก่อน จึงกล่าวได้ว่าการแบ่งกลุ่มข้อมูล เป็นการเรียนรู้แบบไม่มีผู้สอน ขั้นตอนวิธีการแบ่งกลุ่ม ได้แก่ k-means clustering, hierarchical clustering, self-organizing map (som) การแบ่งกลุ่มข้อมูลอาจใช้เป็นข้อตอนเบื้องต้นของการวิเคราะห์ข้อมูล เพื่อช่วยในการลดขนาดข้อมูล (แยกเป็นหลาย ๆ กลุ่มและคัดเฉพาะบางกลุ่มเพื่อทำการวิเคราะห์ต่อไป หรือแยกการวิเคราะห์ออกเป็นสำหรับแต่ละกลุ่ม) ก่อนที่จะนำไปวิเคราะห์ด้วยวิธีการอื่นต่อไป ขั้นตอนวิธีในการแบ่งกลุ่มข้อมูล โดยทั่วไปแบ่งได้เป็น 2 ประเภทใหญ่ๆ คือ การแบ่งแบบเป็นลำดับขั้น (hierarchical) และ การแบ่งแบบตัดเป็นส่วน (partitional) การแบ่งแบบเป็นลำดับขั้นนั้น จะมีทำการแบ่งกลุ่มจากกลุ่มย่อยที่ถูกแบ่งไว้ก่อนหน้านั้นซ้ำหลายครั้ง ส่วนการแบ่งแบบตัดเป็นส่วนนั้น การแบ่งจะทำเพียงครั้งเดียว การแบ่งแบบเป็นลำดับขั้น จะมี 2 ลักษณะคือ แบบล่างขึ้นบน (bottom-up) หรือ เป็นการแบ่งแบบรวมกลุ่มจากกลุ่มย่อยให้ใหญ่ขึ้นไปเรื่อยๆ โดยเริ่มจากกลุ่มเล็กสุดคือในแต่ละกลุ่มมีข้อมูลเพียงตัวเดียว และ แบบบนลงล่าง (top-down) หรือ เป็นการแบ่งแบบกลุ่มจากกลุ่มใหญ่ให้ย่อยไปเรื่อยๆ โดยเริ่มจากกลุ่มใหญ่ที่สุด คือกลุ่มเดียวมีข้อมูลทุกตัวอยู่ในกลุ่ม หมวดหมู่:การเรียนรู้ของเครื่อง หมวดหมู่:การค้นหาความรู้ในฐานข้อมูล.
ใหม่!!: การเรียนรู้แบบไม่มีผู้สอนและการแบ่งกลุ่มข้อมูล · ดูเพิ่มเติม »
การแจกแจงความน่าจะเป็น
ในความน่าจะเป็นและสถิติศาสตร์ การแจกแจงความน่าจะเป็นกำหนดความน่าจะเป็นให้เซตย่อยของผลลัพธ์การทดลองสุ่ม การสำรวจหรือวิธีอนุมานทางสถิติที่วัดได้ทั้งหมด ตัวอย่างการแจกแจงความน่าจะเป็นพบได้ในการทดลองที่ปริภูมิตัวอย่างไม่เป็นตัวเลข ซึ่งการแจกแจงจะเป็นการแจกแจงประเภท, การทดลองที่ปริภูมิตัวอย่างเข้ารหัสด้วยตัวแปรสุ่มวิยุต ซึ่งการแจกแจงสามารถระบุได้ด้วยฟังก์ชันมวลของความน่าจะเป็น, และการทดลองที่ปริภูมิตัวอย่างเข้ารหัสด้วยตัวแปรสุ่มต่อเนื่อง ซึ่งการแจกแจงสามารถเจาะจงได้ด้วยฟังก์ชันความหนาแน่นของความน่าจะเป็น การทดลองที่ซับซ้อนกว่า เช่น การทดลองที่เกี่ยวข้องกับกระบวนการสโทแคสติกที่นิยามในเวลาต่อเนื่อง อาจต้องใช้เมเชอร์ความน่าจะเป็นที่เจาะจงน้อยกว.
ใหม่!!: การเรียนรู้แบบไม่มีผู้สอนและการแจกแจงความน่าจะเป็น · ดูเพิ่มเติม »
การเรียนรู้ของเครื่อง
การเรียนรู้ของเครื่อง (machine learning) เป็นสาขาหนึ่งของปัญญาประดิษฐ์ที่พัฒนามาจากการศึกษาการรู้จำแบบ เกี่ยวข้องกับการศึกษาและการสร้างอัลกอริทึมที่สามารถเรียนรู้ข้อมูลและทำนายข้อมูลได้ อัลกอริทึมนั้นจะทำงานโดยอาศัยโมเดลที่สร้างมาจากชุดข้อมูลตัวอย่างขาเข้าเพื่อการทำนายหรือตัดสินใจในภายหลัง แทนที่จะทำงานตามลำดับของคำสั่งโปรแกรมคอมพิวเตอร์ การเรียนรู้ของเครื่องมีเกี่ยวข้องอย่างมากกับสถิติศาสตร์ เนื่องจากทั้งสองสาขาศึกษาการวิเคราะห์ข้อมูลเพื่อการทำนายเช่นกัน นอกจากนี้ยังมีความสัมพันธ์กับสาขาการหาค่าเหมาะที่สุดในทางคณิตศาสตร์ที่แงของวิธีการ ทฤษฎี และการประยุกต์ใช้ การเรียนรู้ของเครื่องสามารถนำไปประยุกต์ใช้งานได้หลากหมาย ไม่ว่าจะเป็นการกรองอีเมล์ขยะ การรู้จำตัวอักษร เครื่องมือค้นหา และคอมพิวเตอร์วิทัศน.
ใหม่!!: การเรียนรู้แบบไม่มีผู้สอนและการเรียนรู้ของเครื่อง · ดูเพิ่มเติม »
การเรียนรู้แบบมีผู้สอน
การเรียนรู้แบบมีผู้สอน (supervised learning) เป็นเทคนิคการเรียนรู้ของเครื่องซึ่งสร้างฟังก์ชันจากข้อมูลสอน (training data) ข้อมูลสอนประกอบด้วยวัตถุเข้า (มักจะเป็น เวกเตอร์) และผลที่ต้องการ ผลจากการเรียนรู้จะเป็นฟังก์ชันที่อาจจะให้ค่าต่อเนื่อง (จะเรียกวิธีการว่า การถดถอย -- regression) หรือ ใช้ทำนายประเภทของวัตถุ (เรียกว่า การแบ่งประเภท -- classification) ภารกิจของเครื่องเรียนรู้แบบมีผู้สอนคือการทำนายค่าของฟังก์ชันจากวัตถุเข้าที่ถูกต้องโดยใช้ตัวอย่างสอนจำนวนน้อย (training examples -- คู่ของข้อมูลเข้าและผลที่เป็นเป้าหมาย) โดยเครื่องเรียนรู้จะต้องวางนัยทั่วไป (generalize) จากข้อมูลที่มีอยู่ไปยังกรณีที่ไม่เคยพบอย่างมีเหตุผล (ดู inductive bias) การแก้ปัญหาการเรียนรู้แบบมีผู้สอน (เช่น การเรียนรู้เพื่อรู้จำลายมือ) มีขั้นตอนต่าง ๆ ที่ต้องพิจารณา ได้แก.
ใหม่!!: การเรียนรู้แบบไม่มีผู้สอนและการเรียนรู้แบบมีผู้สอน · ดูเพิ่มเติม »