โลโก้
ยูเนี่ยนพีเดีย
การสื่อสาร
ดาวน์โหลดได้จาก Google Play
ใหม่! ดาวน์โหลด ยูเนี่ยนพีเดีย บน Android ™ของคุณ!
ฟรี
เร็วกว่าเบราว์เซอร์!
 

การทำเหมืองข้อมูล

ดัชนี การทำเหมืองข้อมูล

การทำเหมืองข้อมูล (data mining) หรืออาจจะเรียกว่า การค้นหาความรู้ในฐานข้อมูล (Knowledge Discovery in Databases - KDD) เป็นเทคนิคเพื่อค้นหารูปแบบ (pattern) ของจากข้อมูลจำนวนมหาศาลโดยอัตโนมัติ โดยใช้ขั้นตอนวิธีจากวิชาสถิติ การเรียนรู้ของเครื่อง และ การรู้จำแบบ หรือในอีกนิยามหนึ่ง การทำเหมืองข้อมูล คือ กระบวนการที่กระทำกับข้อมูล(โดยส่วนใหญ่จะมีจำนวนมาก) เพื่อค้นหารูปแบบ แนวทาง และความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูลนั้น โดยอาศัยหลักสถิติ การรู้จำ การเรียนรู้ของเครื่อง และหลักคณิตศาสตร์ ความรู้ที่ได้จากการทำเหมืองข้อมูลมีหลายรูปแบบ ได้แก่; กฎความสัมพันธ์ (Association rule): แสดงความสัมพันธ์ของเหตุการณ์หรือวัตถุ ที่เกิดขึ้นพร้อมกัน ตัวอย่างของการประยุกต์ใช้กฎเชื่อมโยง เช่น การวิเคราะห์ข้อมูลการขายสินค้า โดยเก็บข้อมูลจากระบบ ณ จุดขาย (POS) หรือร้านค้าออนไลน์ แล้วพิจารณาสินค้าที่ผู้ซื้อมักจะซื้อพร้อมกัน เช่น ถ้าพบว่าคนที่ซื้อเทปวิดีโอมักจะซื้อเทปกาวด้วย ร้านค้าก็อาจจะจัดร้านให้สินค้าสองอย่างอยู่ใกล้กัน เพื่อเพิ่มยอดขาย หรืออาจจะพบว่าหลังจากคนซื้อหนังสือ ก แล้ว มักจะซื้อหนังสือ ข ด้วย ก็สามารถนำความรู้นี้ไปแนะนำผู้ที่กำลังจะซื้อหนังสือ ก ได้; การจำแนกประเภทข้อมูล (Data classification): หากฎเพื่อระบุประเภทของวัตถุจากคุณสมบัติของวัตถุ เช่น หาความสัมพันธ์ระหว่างผลการตรวจร่างกายต่าง ๆ กับการเกิดโรค โดยใช้ข้อมูลผู้ป่วยและการวินิจฉัยของแพทย์ที่เก็บไว้ เพื่อนำมาช่วยวินิจฉัยโรคของผู้ป่วย หรือการวิจัยทางการแพทย์ ในทางธุรกิจจะใช้เพื่อดูคุณสมบัติของผู้ที่จะก่อหนี้ดีหรือหนี้เสีย เพื่อประกอบการพิจารณาการอนุมัติเงินกู้; การแบ่งกลุ่มข้อมูล (Data clustering): แบ่งข้อมูลที่มีลักษณะคล้ายกันออกเป็นกลุ่ม แบ่งกลุ่มผู้ป่วยที่เป็นโรคเดียวกันตามลักษณะอาการ เพื่อนำไปใช้ประโยชน์ในการวิเคราะห์หาสาเหตุของโรค โดยพิจารณาจากผู้ป่วยที่มีอาการคล้ายคลึงกัน; การสร้างมโนภาพ (Visualization): สร้างภาพคอมพิวเตอร์กราฟิกที่สามารถนำเสนอข้อมูลมากมายอย่างครบถ้วนแทนการใช้ขัอความนำเสนอข้อมูลที่มากมาย เราอาจพบข้อมูลที่ซ้อนเร้นเมื่อดูข้อมูลชุดนั้นด้วยจินตทัศน.

15 ความสัมพันธ์: กฎความสัมพันธ์การรู้จำแบบการทำให้เห็นได้การทำเหมืองข้อความการทำเหมืองเว็บการแบ่งกลุ่มข้อมูลการแบ่งประเภทข้อมูลการเรียนรู้ของเครื่องฐานข้อมูลมหาวิทยาลัยมหิดลมหาวิทยาลัยเกษตรศาสตร์สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบังสถาบันเทคโนโลยีนานาชาติสิรินธร มหาวิทยาลัยธรรมศาสตร์สถิติศาสตร์คลังข้อมูล

กฎความสัมพันธ์

กฎความสัมพันธ์ (Association Rules) เป็นกระบวนการหนึ่งในการทำ Data Mining ที่ได้รับความนิยมมาก โดยจะใช้ Association Rules ในการหาความสัมพันธ์ของข้อมูลสองชุดหรือมากกว่าสองชุดขึ้นไปภายในกลุ่มข้อมูลที่มีขนาดใหญ่ ในการหากฎความสัมพันธ์นั้นจะมีขั้นตอนวิธีการหาหลายวิธีด้วยกัน แต่ขั้นตอนวิธีที่เป็นที่รู้จักและใช้อย่างแพร่หลายคือ ขั้นตอนวิธี Apriori ตัวอย่างหนึ่งของ Association Rules ที่ใช้กันก็คือ Market Basket Analysis ที่ใช้ในการหาความสัมพันธ์ของสินค้าที่ลูกค้ามักจะซื้อพร้อมกัน เพื่อใช้ในการจัดรายการส่งเสริมการ.

ใหม่!!: การทำเหมืองข้อมูลและกฎความสัมพันธ์ · ดูเพิ่มเติม »

การรู้จำแบบ

การรู้จำแบบ (pattern recognition) เป็นสาขาย่อยหนึ่งของ วิทยาการคอมพิวเตอร์ เป็นศาสตร์ที่มีจุดประสงค์ในเพื่อการจำแนก วัตถุ (objects) ออกเป็นประเภท (classes) ตาม รูปแบบของวัตถุ โดยในการคำนวณจะมีการใช้เทคนิคจากสาขาอื่น ๆ มากมาย เช่น การประมวลผลสัญญาณ ปัญญาประดิษฐ์ และสถิติ รูปแบบ (pattern) ในที่นี้หมายถึง รูปร่าง หรือ คุณลักษณะ ของวัตถุ ที่เราสนใจ โดยวัตถุนั้นอาจเป็น รูปธรรม หรือ นามธรรม ก็ได้ หรือจะเป็นรูปแบบ ที่กระจายบนพื้นที่ หรือ เปลี่ยนแปลงตามเวลา ก็ได้.

ใหม่!!: การทำเหมืองข้อมูลและการรู้จำแบบ · ดูเพิ่มเติม »

การทำให้เห็นได้

ำลองของการรถยนต์ที่เปลี่ยนรูปร่าง ภายหลังจากการชน การทำให้เห็นได้ หรือ วิชวลไลเซชัน (visualization) และมีการเรียกว่า จินตทัศน์ เป็นการกล่าวถึงการสร้างภาพ แผนผัง หรือ ภาพเคลื่อนไหว ใช้ในการสื่อสารแทนข้อความ โดยวิธีการนี้สามารถใช้ได้ทั้งในทางรูปธรรม และนามธรรม โดยมีทั้งการจำลองเหตุการณ์ที่เกิดขึ้นจริงในอดีต เหตุการณ์ที่ไม่สามารถมองเห็นได้ หรือการสร้างภาพในอนาคตเพื่อใช้ในการสื่อสาร การทำให้เห็นได้เป็นหนึ่งในวิธีการทำเหมืองข้อมูล โดยการสร้างภาพคอมพิวเตอร์กราฟิก ที่สามารถนำเสนอข้อมูลมากมายอย่างครบถ้วนแทนการใช้ขัอความนำเสนอข้อมูลที่มากมาย เราอาจพบข้อมูลที่ซ้อนเร้นเมื่อดูข้อมูลชุดนั้นด้วยการทำให้เห็นได้ ถ้าเรามีข้อมูลชุดหนึ่งที่มีข้อมูลอยู่จำนวน 100,000 รายการ แต่เราใช้รูปแบบการนำเสนอเป็นข้อความ ผลลัพธ์คงจะไม่เหมาะสมเพราะจะทำให้เราต้องสร้างรายงานจำนวนมหาศาล กล่าวคือ ถ้าเราสามารถใช้ภาพคอมพิวเตอร์กราฟิกมาช่วยในการนำเสนอข้อมูลชุดนี้แทนการใช้ข้อความ ผลลัพธ์คือเราไม่ต้องสร้างรายงานจำนวนมหาศาล การนำเสนอข้อมูลด้วยการทำให้เห็นได้เพียง 1 ภาพแต่สามารถแทนค่าของชุดข้อมูลจำนวนมหาศาลได้ หรือกล่าวอีกนัยหนึ่งคือ ภาพเพียง 1 ภาพอาจใช้แทนข้อมูลข่าวสารได้เป็น 100 คำหรือ 1,000 คำ จึงเป็นแนวคิดของการทำการทำให้เห็นได้ นอกจากนี้เรายังสามารถทำการโต้ตอบกับการทำให้เห็นได้ (interactive visualization) ได้อีกด้วย ซึ่งการนำเสนอข้อมูลในรูปแบบข้อความไม่สามารถโต้ตอบได้ ข้อมูลที่มีปริมาณมหาศาลถ้าสามารถนำเสนอให้เห็นในแบบการทำให้เห็นได้ อาจทำให้เราพบข้อมูลที่ซ่อนเร้นอยู่ ยกตัวอย่างเช่น ถ้าเรานำชุดข้อมูล IRIS ซึ่งเป็นข้อมูลตัวเลขของดอกไม้ชนิดหนึ่งจำนวน 150 รายการ นำชุดข้อมูลนนี้มาแสดงให้เห็นในแบบการทำให้เห็นได้โดยวิธี scatter plot เราจะเห็นว่าจุด plot ที่แสดงมีการเกาะกลุ่มกันจำนวน 3 กลุ่ม บางส่วนของกลุ่มที่ 1 intersaction กับบางส่วนของกลุ่มที่ 2 ส่วนกลุ่มที่ 3 ไม่มีส่วนใด intersaction กับกลุ่มที่ 1 และกลุ่มที่ 2 แสดงให้เห็นว่าชุดข้อมูลดอกไม้ IRIS นี้มีจำนวน 3 กลุ่มที่คล้ายคลึงกันและบางสมาชิกของกลุ่มแรกมีความคล้ายคลึงกับบางสมาชิกของกลุ่มที่ 2 ส่วนสมาชิกทั้งหมดของกลุ่มที่ 3 มีความแตกต่างกับสมาชิกในกลุ่มที่ 1 และกลุ่มที่ 2 อย่างมีนัยสำคัญ.

ใหม่!!: การทำเหมืองข้อมูลและการทำให้เห็นได้ · ดูเพิ่มเติม »

การทำเหมืองข้อความ

การทำเหมืองข้อความ (text mining) หรืออาจจะเรียกว่า "การค้นหาความรู้ในฐานข้อมูลเอกสาร" (Knowledge Discovery in Document Databases) เป็นเทคนิคเพื่อค้นหารูปแบบ (pattern) ของจากข้อความจำนวนมหาศาลโดยอัตโนมัติ โดยใช้ขั้นตอนวิธีจากวิชาสถิติ การเรียนรู้ของเครื่อง และ การรู้จำแบบ หรือในอีกนิยามหนึ่ง การทำเหมืองข้อความ คือ กระบวนการที่กระทำกับข้อความ (โดยส่วนใหญ่จะมีจำนวนมาก) เพื่อค้นหารูปแบบ แนวทาง และความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อความนั้น โดยอาศัยหลักสถิติ การรู้จำ การเรียนรู้ของเครื่อง หลักคณิตศาสตร์ หลักการประมวลเอกสาร (Document Processing) หลักการประมวลผลข้อความ (Text Processing) และหลักการประมวลผลภาษาธรรมชาติ (Natural Language Processing).

ใหม่!!: การทำเหมืองข้อมูลและการทำเหมืองข้อความ · ดูเพิ่มเติม »

การทำเหมืองเว็บ

การทำเหมืองเว็บ (web mining) เป็นส่วนหนึ่งของการทำเหมืองข้อมูล มักจะนำมาใช้ในพื้นที่ต่อไปนี้ ทำการคัดกรองสารสนเทศ, surveillance, mining of web- access logs สำหรับทำการวิเคราห์ผู้ใช้, assisted browsing, และ การบริการต่าง ๆ ที่ต่อสู้กับอาชญากรรมบนอินเทอร์เน็ต Web mining สามารถรองรับฟังก์ชันต่อไปนี้.

ใหม่!!: การทำเหมืองข้อมูลและการทำเหมืองเว็บ · ดูเพิ่มเติม »

การแบ่งกลุ่มข้อมูล

การแบ่งกลุ่มข้อมูล (data clustering) เป็นวิธีการวิเคราะห์ข้อมูล ซึ่งใช้ในการเรียนรู้ของเครื่อง การทำเหมืองข้อมูล โดยจะแบ่งชุดข้อมูล (มักจะเป็นเวกเตอร์) ออกเป็นกลุ่ม (cluster) นำข้อมูลที่มีคุณลักษณะเหมือนกัน หรือคล้ายกันจัดไว้ในกลุ่มเดียวกัน ขั้นตอนวิธีที่ใช้ในการแบ่งกลุ่มจะอาศัยความเหมือน (similarity) หรือ ความใกล้ชิด (proximity) โดยคำนวณจากการวัดระยะระหว่างเวกเตอร์ของข้อมูลเข้า โดยใช้การวัดระยะแบบต่าง ๆ เช่น การวัดระยะแบบยูคลิด (Euclidean distance) การวัดระยะแบบแมนฮัตตัน (Manhattan distance) การวัดระยะแบบเชบิเชฟ (Chebychev distance) การแบ่งกลุ่มข้อมูลจะแตกต่างจากการแบ่งประเภทข้อมูล (classification) โดยจะแบ่งกลุ่มข้อมูลจากความคล้าย โดยไม่มีการกำหนดประเภทของข้อมูลไว้ก่อน จึงกล่าวได้ว่าการแบ่งกลุ่มข้อมูล เป็นการเรียนรู้แบบไม่มีผู้สอน ขั้นตอนวิธีการแบ่งกลุ่ม ได้แก่ k-means clustering, hierarchical clustering, self-organizing map (som) การแบ่งกลุ่มข้อมูลอาจใช้เป็นข้อตอนเบื้องต้นของการวิเคราะห์ข้อมูล เพื่อช่วยในการลดขนาดข้อมูล (แยกเป็นหลาย ๆ กลุ่มและคัดเฉพาะบางกลุ่มเพื่อทำการวิเคราะห์ต่อไป หรือแยกการวิเคราะห์ออกเป็นสำหรับแต่ละกลุ่ม) ก่อนที่จะนำไปวิเคราะห์ด้วยวิธีการอื่นต่อไป ขั้นตอนวิธีในการแบ่งกลุ่มข้อมูล โดยทั่วไปแบ่งได้เป็น 2 ประเภทใหญ่ๆ คือ การแบ่งแบบเป็นลำดับขั้น (hierarchical) และ การแบ่งแบบตัดเป็นส่วน (partitional) การแบ่งแบบเป็นลำดับขั้นนั้น จะมีทำการแบ่งกลุ่มจากกลุ่มย่อยที่ถูกแบ่งไว้ก่อนหน้านั้นซ้ำหลายครั้ง ส่วนการแบ่งแบบตัดเป็นส่วนนั้น การแบ่งจะทำเพียงครั้งเดียว การแบ่งแบบเป็นลำดับขั้น จะมี 2 ลักษณะคือ แบบล่างขึ้นบน (bottom-up) หรือ เป็นการแบ่งแบบรวมกลุ่มจากกลุ่มย่อยให้ใหญ่ขึ้นไปเรื่อยๆ โดยเริ่มจากกลุ่มเล็กสุดคือในแต่ละกลุ่มมีข้อมูลเพียงตัวเดียว และ แบบบนลงล่าง (top-down) หรือ เป็นการแบ่งแบบกลุ่มจากกลุ่มใหญ่ให้ย่อยไปเรื่อยๆ โดยเริ่มจากกลุ่มใหญ่ที่สุด คือกลุ่มเดียวมีข้อมูลทุกตัวอยู่ในกลุ่ม หมวดหมู่:การเรียนรู้ของเครื่อง หมวดหมู่:การค้นหาความรู้ในฐานข้อมูล.

ใหม่!!: การทำเหมืองข้อมูลและการแบ่งกลุ่มข้อมูล · ดูเพิ่มเติม »

การแบ่งประเภทข้อมูล

ในวิทยาการคอมพิวเตอร์ การแบ่งประเภทข้อมูล (data classification) เป็นปัญหาพื้นฐานของการเรียนรู้แบบมีผู้สอน โดยปัญหาคือการทำนายประเภทของวัตถุจากคุณสมบัติต่าง ๆ ของวัตถุ ซึ่งการเรียนรู้แบบมีผู้สอนจะสร้างฟังก์ชันเชื่อมโยง ระหว่างคุณสมบัติของวัตถุ กับประเภทของวัตถุจากตัวอย่างสอน แล้วจึงใช้ฟังก์ชันนี้ทำนายประเภทของวัตถุที่ไม่เคยพบ เครื่องมือหรือขั้นตอนวิธีที่ใช้สำหรับการแบ่งประเภทข้อมูลเช่น โครงข่ายประสาทเทียม ต้นไมตัดสินใ.

ใหม่!!: การทำเหมืองข้อมูลและการแบ่งประเภทข้อมูล · ดูเพิ่มเติม »

การเรียนรู้ของเครื่อง

การเรียนรู้ของเครื่อง (machine learning) เป็นสาขาหนึ่งของปัญญาประดิษฐ์ที่พัฒนามาจากการศึกษาการรู้จำแบบ เกี่ยวข้องกับการศึกษาและการสร้างอัลกอริทึมที่สามารถเรียนรู้ข้อมูลและทำนายข้อมูลได้ อัลกอริทึมนั้นจะทำงานโดยอาศัยโมเดลที่สร้างมาจากชุดข้อมูลตัวอย่างขาเข้าเพื่อการทำนายหรือตัดสินใจในภายหลัง แทนที่จะทำงานตามลำดับของคำสั่งโปรแกรมคอมพิวเตอร์ การเรียนรู้ของเครื่องมีเกี่ยวข้องอย่างมากกับสถิติศาสตร์ เนื่องจากทั้งสองสาขาศึกษาการวิเคราะห์ข้อมูลเพื่อการทำนายเช่นกัน นอกจากนี้ยังมีความสัมพันธ์กับสาขาการหาค่าเหมาะที่สุดในทางคณิตศาสตร์ที่แงของวิธีการ ทฤษฎี และการประยุกต์ใช้ การเรียนรู้ของเครื่องสามารถนำไปประยุกต์ใช้งานได้หลากหมาย ไม่ว่าจะเป็นการกรองอีเมล์ขยะ การรู้จำตัวอักษร เครื่องมือค้นหา และคอมพิวเตอร์วิทัศน.

ใหม่!!: การทำเหมืองข้อมูลและการเรียนรู้ของเครื่อง · ดูเพิ่มเติม »

ฐานข้อมูล

นข้อมูลประกอบด้วยกลุ่มการจัดการข้อมูลสำหรับผู้ใช้หนึ่งคนหรือหลายๆ คน โดยทั่วไปมักอยู่ในรูปแบบดิจิทัล วิธีการแบ่งชนิดของฐานข้อมูลได้รูปแบบหนึ่งคือแบ่งตามชนิดของเนื้อหา เช่น บรรณานุกรม, เอกสารตัวอักษร, สถิติ โดยฐานข้อมูลดิจิทัลจะถูกจัดการโดยใช้ระบบจัดการฐานข้อมูลซึ่งเก็บเนื้อหาฐานข้อมูล โดยอนุญาตให้สร้าง, ดูแลรักษา, ค้นหา และการเข้าถึงในรูปแบบอื่น.

ใหม่!!: การทำเหมืองข้อมูลและฐานข้อมูล · ดูเพิ่มเติม »

มหาวิทยาลัยมหิดล

มหาวิทยาลัยมหิดล (Mahidol University; ชื่อย่อ: ม.มหิดล / MU) เป็นสถาบันที่มีที่มาจากการเป็นโรงเรียนแพทย์ ณ โรงพยาบาลศิริราช ชื่อว่า โรงเรียนแพทยากร ซึ่งก่อตั้งขึ้นในปี..

ใหม่!!: การทำเหมืองข้อมูลและมหาวิทยาลัยมหิดล · ดูเพิ่มเติม »

มหาวิทยาลัยเกษตรศาสตร์

มหาวิทยาลัยเกษตรศาสตร์ (อังกฤษ: Kasetsart University; อักษรย่อ: มก.) เป็นมหาวิทยาลัยของรัฐแห่งแรกของประเทศไทยที่เปิดสอนหลักสูตรทางด้านการเกษตร ก่อตั้งขึ้นเป็นลำดับที่ 3 ของประเทศ เดิมเป็นโรงเรียนช่างไหมในปี..

ใหม่!!: การทำเหมืองข้อมูลและมหาวิทยาลัยเกษตรศาสตร์ · ดูเพิ่มเติม »

สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง

ันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง (สจล.) เป็นมหาวิทยาลัยในกำกับของรัฐ ก่อตั้งด้วยความช่วยเหลือของรัฐบาลญี่ปุ่น โดยเน้นการเรียนการสอนด้านวิทยาศาสตร์และเทคโนโลยี ตั้งอยู่เขตลาดกระบัง กรุงเทพมหานคร.

ใหม่!!: การทำเหมืองข้อมูลและสถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง · ดูเพิ่มเติม »

สถาบันเทคโนโลยีนานาชาติสิรินธร มหาวิทยาลัยธรรมศาสตร์

ันเทคโนโลยีนานาชาติสิรินธร (เอสไอไอที) เป็นสถาบันการศึกษาด้านวิศวกรรมศาสตร์ เทคโนโลยี และการจัดการ สังกัดมหาวิทยาลัยธรรมศาสตร์Nishino, Fumio and Taweep Chaisomphob, 1997,, Inauguration of the Institute's New Name 'Sirindhorn International Institute of Technology', Commemorative publication, pp.18-24.

ใหม่!!: การทำเหมืองข้อมูลและสถาบันเทคโนโลยีนานาชาติสิรินธร มหาวิทยาลัยธรรมศาสตร์ · ดูเพิ่มเติม »

สถิติศาสตร์

ติศาสตร์ (Statistic Science) เป็นการศึกษาการเก็บ การวิเคราะห์ การตีความ การนำเสนอและการจัดระเบียบข้อมูล ในการประยุกต์สถิติศาสตร์กับปัญหาทางวิทยาศาสตร์ อุตสาหกรรมหรือสังคม ฯลฯ จำเป็นต้องเริ่มด้วยประชากรหรือกระบวนการที่จะศึกษา ประชากรเป็นได้หลากหลาย เช่น "ทุกคนที่อาศัยอยู่ในประเทศหนึ่ง" หรือ "ทุกอะตอมซึ่งประกอบเป็นผลึก" สถิติศาสตร์ว่าด้วยทุกแง่มุมของข้อมูลซึ่งรวมการวางแผนการเก็บข้อมูลในแง่การออกแบบการสำรวจและการทดลอง ในกรณีไม่สามารถเก็บข้อมูลสำมะโนได้ นักสถิติศาสตร์เก็บข้อมูลโดยการพัฒนาการออกแบบการทดลองจำเพาะและตัวอย่างสำรวจ การชักตัวอย่างเพื่อเป็นตัวแทนประกันว่าการอนุมานและการสรุปสามารถขยายจากตัวอย่างไปยังประชากรโดยรวมได้โดยปลอดภัย การศึกษาทดลองเกี่ยวข้องกับการวัดระบบที่กำลังศึกษา จัดดำเนินการระบบ แล้ววัดเพิ่มโดยใช้วิธีดำเนินการเดียวกันเพื่อตัดสินว่าการจัดดำเนินการดัดแปรค่าของการวัดหรือไม่ ในทางกลับกัน การศึกษาสังเกตไม่เกี่ยวข้องกับการจัดดำเนินการทดลอง มีการใช้ระเบียบวิธีสถิติศาสตร์สองอย่างหลักในการวิเคราะห์ข้อมูล ได้แก่ สถิติศาสตร์พรรณนา ซึ่งสรุปข้อมูลจากตัวอย่างโดยใช้ดัชนีอย่างค่าเฉลี่ยหรือค่าเบี่ยงเบนมาตรฐาน และสถิติศาสตร์อนุมาน ซึ่งดึงข้อสรุปจากข้อมูลซึ่งมีการกระจายสุ่ม (เช่น ข้อผิดพลาดสังเกต การกระจายการชักตัวอย่าง) สถิติศาสตร์พรรณนาส่วนใหญ่ว่าด้วยชุดคุณสมบัติของการกระจายสองชุด ได้แก่ แนวโน้มสู่ส่วนกลางซึ่งมุ่งให้ลักษระค่ากลางหรือตรงแบบของการกระจาย ขณะที่การกระจายให้ลักษณะขอบเขตซึ่งสมาชิกของการกระจายอยู่ห่างจากส่วนกลางและสมาชิกอื่น การอนุมานสถิติศาสตร์คณิตศาสตร์กระทำภายใต้กรอบทฤษฎีความน่าจะเป็น ซึ่งว่าด้วยการวิเคราะห์ปรากฏการณ์สุ่ม ในการอนุมานปริมาณไม่ทราบค่า มีการประเมินค่าตัวประมาณค่าตั้งแต่หนึ่งตัวโดยใช้ตัวอย่าง 1.สถิติ (Statistics) 2.เซตและการให้เหตุผล (Set and reasoning) 3.

ใหม่!!: การทำเหมืองข้อมูลและสถิติศาสตร์ · ดูเพิ่มเติม »

คลังข้อมูล

ลังข้อมูล (data warehouse) คือ ฐานข้อมูลขนาดยักษ์ ที่รวบรวมฐานข้อมูลจากหลายแหล่งหลายช่วงเวลา ซึ่งอาจมี schema แตกต่างกัน มาไว้รวม ณ ที่เดียวกัน (และใช้ schema เดียวกัน).

ใหม่!!: การทำเหมืองข้อมูลและคลังข้อมูล · ดูเพิ่มเติม »

เปลี่ยนเส้นทางที่นี่:

Data miningเหมืองข้อมูล

ขาออกขาเข้า
Hey! เราอยู่ใน Facebook ตอนนี้! »