บทเรียนที่ 8
การแจกแจงความถี่ของข้อมูล
การแจกแจงความถี่ของข้อมูล
สาระการเรียนรู้
การแจกแจงความถี่โดยใช้กราฟ
การแจกแจงความถี่สะสมโดยใช้กราฟ
ข้อมูลที่ได้จากการเก็บรวบรวมข้อมูลโดยวิธีต่าง ๆ อาจจะอยู่ในลักษณะที่ไม่เป็นระเบียบ จําเป็นต้องจัดข้อมูลดังกล่าวให้มีระเบียบเป็นหมวดเป็นหมู่ เพื่อให้ง่ายต่อการคํานวณและสะดวกต่อการจัดทําข้อมูลเพื่อการวิเคราะห์ข้อมูลขั้นต่อไป
เราเรียกวิธีทางสถิติว่า การแจกแจงความถี่ของข้อมูล
ความถี่ของค่าจากการสังเกตหรือข้อมูล คือ จํานวนครั้งของค่าของข้อมูลแต่ละค่าที่ได้มาจากการเก็บรวบรวมข้อมูล การหาความถี่นิยมใช้วิธีทํารอยขีด (tally) แล้วจึงสร้างตารางแจกแจงความถี่ (Frequency table)
การแจกแจงความถี่ของข้อมูล
การแจกแจงความถี่ของข้อมูล
การแจกแจงความถี่ด้วยตาราง ทําได้
2 วิธี คือ
การแจกแจงความถี่ สามารถจัดเป็นลักษณะดังต่อไปนี้
1. การแจกแจงความถี่ (Frequency Distribution)
2. การแจกแจงความถี่สัมพัทธ์ (Relative Frequency Distribution)
3. การแจกแจงความถี่สะสม (Cumulative Frequency Distribution)
4. การแจกแจงความถี่สะสมสัมพัทธ์ (Relative Cumulative Frequency Distribution)
1. การแจกแจงความถี่โดยวิธีจัดเรียงค่าของข้อมูลตามลําดับ
2. การแจกแจงความถี่โดยวิธีจัดข้อมูลเป็นช่วงหรืออันตรภาคชั้น
การแจกแจงความถี่ของข้อมูล
สร้างตารางแจกแจงความถี่ได้ดังนี้
1. การแจกแจงความถี่โดยวิธีจัดเรียงค่าของข้อมูลตามลําดับ
เป็นการนําข้อมูลทั้งหมดมาเรียงตามลําดับจากค่ามากไปน้อยหรือค่าน้อยไปมาก เหมาะสําหรับข้อมูลที่มีค่าแตกต่างกันน้อยและมีจํานวนขอมูลไม่มากนัก
ตัวอย่างที่ 1 ในการสอบวิชาคณิตศาสตร์พื้นฐานอาชีพของนักเรียน 20 คน ทําคะแนนได้ดังนี้
17 15 21 19 14 20 15 18 15 16
17 20 21 15 18 19 19 20 20 15
การแจกแจงความถี่ของข้อมูล
2. การแจกแจงความถี่โดยวิธีจัดข้อมูลเป็นช่วงหรืออันตรภาคชั้น
ในกรณีข้อมูลที่มีเป็นจํานวนมาก ถ้านําข้อมูลทําการแจกแจงความถี่โดยวิธีจัดเรียงค่าของข้อมูลตามลําดับ อาจจะทําให้ตารางมีขนาดใหญ่ คงจะไม่สะดวกและไม่มีประโยชน์มากนัก ดังนั้นจึงแบ่งข้อมูลออกเป็นช่วง ซึ่งเรียกว่า อันตรภาคชั้น (Class Interval) แล้วหารอยขีด จากนั้นนับรอยขีดรวมเป็นความถี่
1.1.1 อันตรภาคชั้น (Class Interval) เป็นช่วงคะแนนแต่ละช่วง คือ 30 - 39, 40 - 49, 50 - 59
1.1 คําสําคัญที่เกี่ยวกับตารางแจกแจงความถี่
การแจกแจงความถี่ของข้อมูล
ตารางที่ 1 ความถี่ของคะแนนสอบวิชาคณิตศาสตร์ของนักเรียนห้องหนึ่ง
การแจกแจงความถี่ของข้อมูล
1.1.2 จํานวนอันตรภาคชั้น หมายถึง จํานวนอันตรภาคชั้นทั้งหมดในตารางแจกแจงความถี่
ดังตารางที่ 1 นี้มีจํานวนอันตรภาคชั้น 3 ชั้น
หมายถึง ตัวเลขที่แสดงถึงช่วงหรือบอกให้ทราบว่ามีตัวเลขอะไรที่อยู่ในชั้นนั้นบ้าง ซึ่งขีดจํากัดอันตรภาคชั้นประกอบด้วย
1.1.3 ขีดจํากัดของอันตรภาคชั้น
(Class limit)
การแจกแจงความถี่ของข้อมูล
1) ขีดจํากัดล่างของอันตรภาคชั้น (Lower class limit)คือ ค่าน้อยที่สุดของแต่ละอันตรภาคชั้นนั้น
2) ขีดจํากัดบนของอันตรภาคชั้น (Upper class limit) คือ ค่ามากที่สุดของแต่ละอันตรภาคชั้นนั้น
จากตารางที่1
อันตรภาคชั้นที่ 1 มีขีดจํากัดล่างคือ 30 ขีดจํากัดบนคือ 39
อันตรภาคชั้นที่ 2 มีขีดจํากัดล่างคือ 40 ขีดจํากัดบนคือ 49
อันตรภาคชั้นที่ 3 มีขีดจํากัดล่างคือ 50 ขีดจํากัดบนคือ 59
การแจกแจงความถี่ของข้อมูล
1.1.4 ขอบเขตอันตรภาคชั้น (Class boundary) หมายถึง ขีดจํากัดชั้นที่แท้จริงของข้อมูล เป็นค่าที่ขยายหรือครอบคลุมขีดจํากัดชั้น เพื่อทําให้ขอบเขตในแต่ละชั้นต่อเนื่องกัน
การแจกแจงความถี่ของข้อมูล
1.1.5 ความกว้างของอันตรภาคชัั้น (Class Interval) คือ ค่าที่เป็นไปได้ทั้งหมดในอันตรภาคชั้นนั้น เขียนแทนด้วย I หรือ C เช่น อันตรภาคชั้นที่ 1 มีช่วงคะแนน 30 - 39 ประกอบด้วยค่าที่เป็นไปได้ 10 ค่า คือ 30, 31, ... , 39 หรือหาได้จากผลต่างระหว่างขอบบนและขอบล่างของแต่ละอันตรภาคชั้น
1.1.6 จุดกึ่งกลางของอันตรภาคชั้น (Mid point) คือ ค่ากึ่งกลางระหว่างขอบล่างกับขอบบนของอันตรภาคชั้น หรือค่ากึ่งกลางระหว่างขีดจํากัดล่างกับขีดจํากัดบนของอันตรภาคชั้นนั้น นั่นคือ
นั่นคือ
พิสัย(R) = ค่าสูงสุด − ค่าตํ่าสุด
การแจกแจงความถี่ของข้อมูล
โดยจัดข้อมูลเป็นช่วงหรืออันตรภาคชั้น มีขั้นตอนดังนี้ิ
1.2.1 หาพิสัย (Range) ของข้อมูล คือ หาผลต่างของค่าสูงสุดกับค่าตํ่าสุดของข้อมูลชุดนั้น
1.2.2 กําหนดจํานวนอันต่ภาคชั้นพอสมควรที่นิยมใช่กัน ประมาณ 5 - 15 ชั้น
1.2.3 กําหนดความกว้างของอันตรภาคชั้นโดยประมาณได้จากสูตร
1.2 การสรางตารางแจกแจงความถี่
การแจกแจงความถี่ของข้อมูล
1.2.4 เขียนอันตรภาคชั้นแต่ละอันตรภาคชั้น เรียงตามลําดับโดยยึดหลักว่าค่าตํ่าสุดต้องอยู่ใน
อันตรภาคชั้นตํ่าสุด และค่าสูงสุดต้องอยู่ในอันตรภาคชั้นสูงสุด
1.2.5 นับรอยขีดและหาความถี่
1.2 การสร้างตารางแจกแจงความถี่
ข้อสังเกต
โดยทั่วไปการหาความถี่สะสม
นิยมใช้ความถี่สะสมจากน้อยไปมาก
การแจกแจงความถี่ของข้อมูล
1.3 การแจกแจงความถี่สัมพัทธ์
ความถี่สัมพัทธ์ (RelatIve frequency) ของแต่ละอันตรภาคชั้น คือ อัตราส่วนระหว่างความถี่ของอันตรภาคชั้นนั้นกับผลรวมของความถี่ทั้งหมด
ความถี่สัมพัทธ์อาจแสดงอยู่ในรูปของเศษส่วน ทศนิยม หรือบางครั้งอาจแสดงอยู่ในรูปร้อยละ เรียกว่า “ร้อยละของความถี่สัมพัทธ์” นั่นคือ
1.4 การแจกแจงความถี่สะสม
ความถี่สะสม (Cumulative frequency)
ของแต่ละอันตรภาคชั้น คือ ผลรวมของความถี่ของอันตรภาคชั้นนั้นกับความถี่ของอันตรภาคชั้นที่ตํ่ากว่าทั้งหมดหรือสูงกว่าทั้งหมดอย่างใดอยางหนึ่ง
ข้อสังเกต
1. ผลรวมของความถี่สัมพัทธ์ของทุกอันตรภาคชั้นจะมีค่าเท่ากับ 1 เสมอ
2. ผลรวมของร้อยละความถี่สัมพัทธ์ของทุกอันตรภาคชั้นจะมีค่าเท่ากับ 100 เสมอ
การแจกแจงความถี่ของข้อมูล
1.5 การแจกแจงความถี่สะสมสัมพัทธ์
ความถี่สะสมสัมพัทธ์ (RelatIve cumulatIve frequency) ของแต่ละอันตรภาคชั้น คือ อัตราส่วนระหว่างความถี่สะสมของอันตรภาคชั้นนั้นกับผลรวมของความถี่ทั้งหมด
ความถี่สะสมสัมพัทธ์อาจแสดงในรูปเศษส่วน ทศนิยม หรือบางครั้งอาจจะแสดงอยู่ในรูปร้อยละ เรียกว่า “ร้อยละของความถี่สะสมสัมพัทธ์” นั่นคือ
1.6 ข้อสังเกตเกี่ยวกับการแจกแจงความถี่
1) ความกว้างของแต่ละอันตรภาคชั้นไม่จําเป็นต้องเท่ากันทุกอันตรภาคชั้น ทั้งนี้ขึ้นอยู่กับวัตถุประสงค์ของการใช้ข้อมูล และอาจขึ้นอยู่กับความแตกต่างระหว่างค่าจากการสังเกตของข้อมูลชุดนั้น
2) ถ้าค่าจากการสังเกตบางค่าซึ่งมีค่าต่างไปจากค่าอื่นๆ ในข้อมูลชุดนั้นมาก ควรกําหนดอันตรภาคชั้นแรกหรือชั้นสุดท้ายเป็นอันตรภาคชั้นเปิด (Open - end class Interval) กล่าวคือเป็นอันตรภาคชั้นที่ไม่มีขอบล่างหรือขอบบน
3) การสร้างตารางแจกแจงความถี่บางอันตรภาคชั้นอาจมีความถี่เป็นศูนย์ได้
การแจกแจงความถี่
โดยใช้กราฟ
การแจกแจงความถี่โดยใช้กราฟ จะทําให้
เห็นการกระจายของข้อมูลได้ชัดเจนกว่าการดู
จากตารางแจกแจงความถี่ กราฟที่แสดง
การแจกแจงความถี่มีดังนี้
ฮิสโทแกรม (Histogram)
แผนภาพต้น - ใบ (Stem and leaf display)
เส้นโค้งความถี่ (Frequency curve)
รูปหลายเหลี่ยมของความถี่
(Frequency polygon)
เป็นกราฟแท่งรูปสี่เหลี่ยมมุมฉากวางติดกัน โดยความกว้างของรูปสี่เหลี่ยมมุมฉากแทนความกว้างของแต่ละอันตรภาคชั้นตามแกนนอน และความยาวของรูปสี่เหลี่ยมมุมฉากแต่ละรูปแทนความถี่ของแต่ละอันตรภาคชั้นตามแกนตั้ง
วิธีการเขียนรูปฮิสโทแกรมอาจใช้
ขอบล่าง ขอบบน หรือจุดกึ่งกลางชั้น
แต่ละอันตรภาคชั้นในตารางแจกแจงความถี่ก็ได้
ฮิสโทแกรม (Histogram)
ฮิสโทแกรม (Histogram)
คือ รูปเหลี่ยมที่เกิดจากการต่อจุดกึ่งกลางของยอดของแท่งสี่เหลี่ยมมุมฉากของฮิสโทแกรม รวมทั้งจุดกึ่งกลางของอันตรภาคชั้นที่ตํ่ากว่าและสูงกว่าอย่างละ 1 ชั้น
รูปหลายเหลี่ยม
ของความถี่ (Frequency polygon)
รูปหลายเหลี่ยมของความถี่
(Frequency polygon)
คือ เส้นโค้งที่ได้จากการปรับด้านของรูปหลายเหลี่ยมของความถี่ให้เรียบขึ้น โดยการปรับ
พื้นที่ใต้เส้นโค้ง ให้มีพื้นที่ใกล้เคียงกับพื้นที่รูปหลายเหลี่ยมของความถี่
เส้นโค้งความถี่
(Frequency curve)
เส้นโค้ง
ความถี่ (Frequency curve)
ในการจัดข้อมูลเป็นกลุ่ม ๆ นอกจากจะใช้ตารางแจกแจงความถี่หรือการแจกแจงความถี่โดยใช้กราฟแล้ว อาจจะใช้วิธีการสร้างแผนภาพเพื่อแจกแจงความถี่และสามารถวิเคราะห์ข้อมูลเบื้องต้นไปพร้อมๆ กันที่เรียกว่า แผนภาพต้น-ใบ ( stem and leaf display) โดยมีขั้นตอนดังต่อไปนี้
แผนภาพต้น - ใบ
(Stem and leaf display)
แผนภาพต้น - ใบ (Stem and leaf display)
1. จัดแบ่งข้อมูลออกเป็นกลุ่ม ๆ โดยเรียงลําดับจากน้อยไปหามาก หรือมากไปน้อย
ถ้ากลุ่มข้อมูลเป็นเลขสองหลักให้ ใช้เลขโดดของหลักแรก (หลักสิบ)
ถ้ากลุ่มข้อมูลเป็นเลขสามหลักให้ ใช้เลขโดดของสองหลักแรก คือ หลักร้อยและหลักสิบ
2. นํากลุ่มข้อมูลในข้อ 1 มาใส่ในหลัก (แนวตั้งในหลักแรก) เพื่อสร้างเป็นลําตน (stem)
แผนภาพต้น - ใบ
(Stem and leaf display)
แผนภาพต้น - ใบ (Stem and leaf display)
3. เมื่่อได้ลําต้น จึงแจกแจงความถี่
โดยพิจารณาจากข้อมูลที่มีอยู่ในแต่ละแถว
แนวนอน นํามาต่อเป็นใบ (leaf) ของแต่ละกลุ่ม
4. เรียงลําดับข้อมูลจากน้อยไปมากของแต่ละกลุ่ม (แต่ละแถวแนวนอน) ก็จะได้แผนภาพ
ต้น-ใบ (stem and leaf display)
แผนภาพต้น - ใบ
(Stem and leaf display)
แผนภาพต้น - ใบ (Stem and leaf display)
การแจกแจงความถี่สะสมโดยใช้กราฟ
(Ogive curve)
กราฟแสดงความถี่สะสม เรียกว่า “เส้นโค้งความถี่สะสม” หรือเส้นโค้งโอจีฟ (Ogive curve) เส้นโค้งความถี่่สะสม เป็นกราฟแสดงความสัมพันธ์ระหว่างขอบบนของอันตรภาคชั้นกับความถี่สะสม แล้วโยงจุดนั้นด้วยเส้นตรง จากนั้นปรับให้เป็นเส้นโค้งเรียบ กราฟแสดงความถี่สะสมสามารถนําไป
ใช้ประโยชน์ในการประมาณความถี่ของค่าของข้อมูลที่ตํ่ากว่าหรือสูงกว่าคะแนนที่กําหนดให้