1 of 23

บทเรียนที่ 8

การแจกแจงความถี่ของข้อมูล

2 of 23

การแจกแจงความถี่ของข้อมูล

สาระการเรียนรู้

การแจกแจงความถี่โดยใช้กราฟ

การแจกแจงความถี่สะสมโดยใช้กราฟ

3 of 23

ข้อมูลที่ได้จากการเก็บรวบรวมข้อมูลโดยวิธีต่าง ๆ อาจจะอยู่ในลักษณะที่ไม่เป็นระเบียบ จําเป็นต้องจัดข้อมูลดังกล่าวให้มีระเบียบเป็นหมวดเป็นหมู่ เพื่อให้ง่ายต่อการคํานวณและสะดวกต่อการจัดทําข้อมูลเพื่อการวิเคราะห์ข้อมูลขั้นต่อไป

เราเรียกวิธีทางสถิติว่า การแจกแจงความถี่ของข้อมูล

ความถี่ของค่าจากการสังเกตหรือข้อมูล คือ จํานวนครั้งของค่าของข้อมูลแต่ละค่าที่ได้มาจากการเก็บรวบรวมข้อมูล การหาความถี่นิยมใช้วิธีทํารอยขีด (tally) แล้วจึงสร้างตารางแจกแจงความถี่ (Frequency table)

การแจกแจงความถี่ของข้อมูล

4 of 23

การแจกแจงความถี่ของข้อมูล

การแจกแจงความถี่ด้วยตาราง ทําได้

2 วิธี คือ

การแจกแจงความถี่ สามารถจัดเป็นลักษณะดังต่อไปนี้

1. การแจกแจงความถี่ (Frequency Distribution)

2. การแจกแจงความถี่สัมพัทธ์ (Relative Frequency Distribution)

3. การแจกแจงความถี่สะสม (Cumulative Frequency Distribution)

4. การแจกแจงความถี่สะสมสัมพัทธ์ (Relative Cumulative Frequency Distribution)

1. การแจกแจงความถี่โดยวิธีจัดเรียงค่าของข้อมูลตามลําดับ

2. การแจกแจงความถี่โดยวิธีจัดข้อมูลเป็นช่วงหรืออันตรภาคชั้น

5 of 23

การแจกแจงความถี่ของข้อมูล

สร้างตารางแจกแจงความถี่ได้ดังนี้

1. การแจกแจงความถี่โดยวิธีจัดเรียงค่าของข้อมูลตามลําดับ

เป็นการนําข้อมูลทั้งหมดมาเรียงตามลําดับจากค่ามากไปน้อยหรือค่าน้อยไปมาก เหมาะสําหรับข้อมูลที่มีค่าแตกต่างกันน้อยและมีจํานวนขอมูลไม่มากนัก

ตัวอย่างที่ 1 ในการสอบวิชาคณิตศาสตร์พื้นฐานอาชีพของนักเรียน 20 คน ทําคะแนนได้ดังนี้

17 15 21 19 14 20 15 18 15 16

17 20 21 15 18 19 19 20 20 15

6 of 23

การแจกแจงความถี่ของข้อมูล

2. การแจกแจงความถี่โดยวิธีจัดข้อมูลเป็นช่วงหรืออันตรภาคชั้น

ในกรณีข้อมูลที่มีเป็นจํานวนมาก ถ้านําข้อมูลทําการแจกแจงความถี่โดยวิธีจัดเรียงค่าของข้อมูลตามลําดับ อาจจะทําให้ตารางมีขนาดใหญ่ คงจะไม่สะดวกและไม่มีประโยชน์มากนัก ดังนั้นจึงแบ่งข้อมูลออกเป็นช่วง ซึ่งเรียกว่า อันตรภาคชั้น (Class Interval) แล้วหารอยขีด จากนั้นนับรอยขีดรวมเป็นความถี่

7 of 23

1.1.1 อันตรภาคชั้น (Class Interval) เป็นช่วงคะแนนแต่ละช่วง คือ 30 - 39, 40 - 49, 50 - 59

1.1 คําสําคัญที่เกี่ยวกับตารางแจกแจงความถี่

การแจกแจงความถี่ของข้อมูล

ตารางที่ 1 ความถี่ของคะแนนสอบวิชาคณิตศาสตร์ของนักเรียนห้องหนึ่ง

8 of 23

การแจกแจงความถี่ของข้อมูล

1.1.2 จํานวนอันตรภาคชั้น หมายถึง จํานวนอันตรภาคชั้นทั้งหมดในตารางแจกแจงความถี่

ดังตารางที่ 1 นี้มีจํานวนอันตรภาคชั้น 3 ชั้น

9 of 23

หมายถึง ตัวเลขที่แสดงถึงช่วงหรือบอกให้ทราบว่ามีตัวเลขอะไรที่อยู่ในชั้นนั้นบ้าง ซึ่งขีดจํากัดอันตรภาคชั้นประกอบด้วย

1.1.3 ขีดจํากัดของอันตรภาคชั้น

(Class limit)

การแจกแจงความถี่ของข้อมูล

1) ขีดจํากัดล่างของอันตรภาคชั้น (Lower class limit)คือ ค่าน้อยที่สุดของแต่ละอันตรภาคชั้นนั้น

2) ขีดจํากัดบนของอันตรภาคชั้น (Upper class limit) คือ ค่ามากที่สุดของแต่ละอันตรภาคชั้นนั้น

จากตารางที่1

อันตรภาคชั้นที่ 1 มีขีดจํากัดล่างคือ 30 ขีดจํากัดบนคือ 39

อันตรภาคชั้นที่ 2 มีขีดจํากัดล่างคือ 40 ขีดจํากัดบนคือ 49

อันตรภาคชั้นที่ 3 มีขีดจํากัดล่างคือ 50 ขีดจํากัดบนคือ 59

10 of 23

การแจกแจงความถี่ของข้อมูล

1.1.4 ขอบเขตอันตรภาคชั้น (Class boundary) หมายถึง ขีดจํากัดชั้นที่แท้จริงของข้อมูล เป็นค่าที่ขยายหรือครอบคลุมขีดจํากัดชั้น เพื่อทําให้ขอบเขตในแต่ละชั้นต่อเนื่องกัน

11 of 23

การแจกแจงความถี่ของข้อมูล

1.1.5 ความกว้างของอันตรภาคชัั้น (Class Interval) คือ ค่าที่เป็นไปได้ทั้งหมดในอันตรภาคชั้นนั้น เขียนแทนด้วย I หรือ C เช่น อันตรภาคชั้นที่ 1 มีช่วงคะแนน 30 - 39 ประกอบด้วยค่าที่เป็นไปได้ 10 ค่า คือ 30, 31, ... , 39 หรือหาได้จากผลต่างระหว่างขอบบนและขอบล่างของแต่ละอันตรภาคชั้น

1.1.6 จุดกึ่งกลางของอันตรภาคชั้น (Mid point) คือ ค่ากึ่งกลางระหว่างขอบล่างกับขอบบนของอันตรภาคชั้น หรือค่ากึ่งกลางระหว่างขีดจํากัดล่างกับขีดจํากัดบนของอันตรภาคชั้นนั้น นั่นคือ

12 of 23

นั่นคือ

พิสัย(R) = ค่าสูงสุด − ค่าตํ่าสุด

การแจกแจงความถี่ของข้อมูล

โดยจัดข้อมูลเป็นช่วงหรืออันตรภาคชั้น มีขั้นตอนดังนี้ิ

1.2.1 หาพิสัย (Range) ของข้อมูล คือ หาผลต่างของค่าสูงสุดกับค่าตํ่าสุดของข้อมูลชุดนั้น

1.2.2 กําหนดจํานวนอันต่ภาคชั้นพอสมควรที่นิยมใช่กัน ประมาณ 5 - 15 ชั้น

1.2.3 กําหนดความกว้างของอันตรภาคชั้นโดยประมาณได้จากสูตร

1.2 การสรางตารางแจกแจงความถี่

13 of 23

การแจกแจงความถี่ของข้อมูล

1.2.4 เขียนอันตรภาคชั้นแต่ละอันตรภาคชั้น เรียงตามลําดับโดยยึดหลักว่าค่าตํ่าสุดต้องอยู่ใน

อันตรภาคชั้นตํ่าสุด และค่าสูงสุดต้องอยู่ในอันตรภาคชั้นสูงสุด

1.2.5 นับรอยขีดและหาความถี่

1.2 การสร้างตารางแจกแจงความถี่

14 of 23

ข้อสังเกต

โดยทั่วไปการหาความถี่สะสม

นิยมใช้ความถี่สะสมจากน้อยไปมาก

การแจกแจงความถี่ของข้อมูล

1.3 การแจกแจงความถี่สัมพัทธ์

ความถี่สัมพัทธ์ (RelatIve frequency) ของแต่ละอันตรภาคชั้น คือ อัตราส่วนระหว่างความถี่ของอันตรภาคชั้นนั้นกับผลรวมของความถี่ทั้งหมด

ความถี่สัมพัทธ์อาจแสดงอยู่ในรูปของเศษส่วน ทศนิยม หรือบางครั้งอาจแสดงอยู่ในรูปร้อยละ เรียกว่า “ร้อยละของความถี่สัมพัทธ์” นั่นคือ

1.4 การแจกแจงความถี่สะสม

ความถี่สะสม (Cumulative frequency)

ของแต่ละอันตรภาคชั้น คือ ผลรวมของความถี่ของอันตรภาคชั้นนั้นกับความถี่ของอันตรภาคชั้นที่ตํ่ากว่าทั้งหมดหรือสูงกว่าทั้งหมดอย่างใดอยางหนึ่ง

ข้อสังเกต

1. ผลรวมของความถี่สัมพัทธ์ของทุกอันตรภาคชั้นจะมีค่าเท่ากับ 1 เสมอ

2. ผลรวมของร้อยละความถี่สัมพัทธ์ของทุกอันตรภาคชั้นจะมีค่าเท่ากับ 100 เสมอ

15 of 23

การแจกแจงความถี่ของข้อมูล

1.5 การแจกแจงความถี่สะสมสัมพัทธ์

ความถี่สะสมสัมพัทธ์ (RelatIve cumulatIve frequency) ของแต่ละอันตรภาคชั้น คือ อัตราส่วนระหว่างความถี่สะสมของอันตรภาคชั้นนั้นกับผลรวมของความถี่ทั้งหมด

ความถี่สะสมสัมพัทธ์อาจแสดงในรูปเศษส่วน ทศนิยม หรือบางครั้งอาจจะแสดงอยู่ในรูปร้อยละ เรียกว่า “ร้อยละของความถี่สะสมสัมพัทธ์” นั่นคือ

1.6 ข้อสังเกตเกี่ยวกับการแจกแจงความถี่

1) ความกว้างของแต่ละอันตรภาคชั้นไม่จําเป็นต้องเท่ากันทุกอันตรภาคชั้น ทั้งนี้ขึ้นอยู่กับวัตถุประสงค์ของการใช้ข้อมูล และอาจขึ้นอยู่กับความแตกต่างระหว่างค่าจากการสังเกตของข้อมูลชุดนั้น

2) ถ้าค่าจากการสังเกตบางค่าซึ่งมีค่าต่างไปจากค่าอื่นๆ ในข้อมูลชุดนั้นมาก ควรกําหนดอันตรภาคชั้นแรกหรือชั้นสุดท้ายเป็นอันตรภาคชั้นเปิด (Open - end class Interval) กล่าวคือเป็นอันตรภาคชั้นที่ไม่มีขอบล่างหรือขอบบน

3) การสร้างตารางแจกแจงความถี่บางอันตรภาคชั้นอาจมีความถี่เป็นศูนย์ได้

16 of 23

การแจกแจงความถี่

โดยใช้กราฟ

การแจกแจงความถี่โดยใช้กราฟ จะทําให้

เห็นการกระจายของข้อมูลได้ชัดเจนกว่าการดู

จากตารางแจกแจงความถี่ กราฟที่แสดง

การแจกแจงความถี่มีดังนี้

ฮิสโทแกรม (Histogram)

แผนภาพต้น - ใบ (Stem and leaf display)

เส้นโค้งความถี่ (Frequency curve)

รูปหลายเหลี่ยมของความถี่

(Frequency polygon)

17 of 23

เป็นกราฟแท่งรูปสี่เหลี่ยมมุมฉากวางติดกัน โดยความกว้างของรูปสี่เหลี่ยมมุมฉากแทนความกว้างของแต่ละอันตรภาคชั้นตามแกนนอน และความยาวของรูปสี่เหลี่ยมมุมฉากแต่ละรูปแทนความถี่ของแต่ละอันตรภาคชั้นตามแกนตั้ง

วิธีการเขียนรูปฮิสโทแกรมอาจใช้

ขอบล่าง ขอบบน หรือจุดกึ่งกลางชั้น

แต่ละอันตรภาคชั้นในตารางแจกแจงความถี่ก็ได้

ฮิสโทแกรม (Histogram)

ฮิสโทแกรม (Histogram)

18 of 23

คือ รูปเหลี่ยมที่เกิดจากการต่อจุดกึ่งกลางของยอดของแท่งสี่เหลี่ยมมุมฉากของฮิสโทแกรม รวมทั้งจุดกึ่งกลางของอันตรภาคชั้นที่ตํ่ากว่าและสูงกว่าอย่างละ 1 ชั้น

รูปหลายเหลี่ยม

ของความถี่ (Frequency polygon)

รูปหลายเหลี่ยมของความถี่

(Frequency polygon)

19 of 23

คือ เส้นโค้งที่ได้จากการปรับด้านของรูปหลายเหลี่ยมของความถี่ให้เรียบขึ้น โดยการปรับ

พื้นที่ใต้เส้นโค้ง ให้มีพื้นที่ใกล้เคียงกับพื้นที่รูปหลายเหลี่ยมของความถี่

เส้นโค้งความถี่

(Frequency curve)

เส้นโค้ง

ความถี่ (Frequency curve)

20 of 23

ในการจัดข้อมูลเป็นกลุ่ม ๆ นอกจากจะใช้ตารางแจกแจงความถี่หรือการแจกแจงความถี่โดยใช้กราฟแล้ว อาจจะใช้วิธีการสร้างแผนภาพเพื่อแจกแจงความถี่และสามารถวิเคราะห์ข้อมูลเบื้องต้นไปพร้อมๆ กันที่เรียกว่า แผนภาพต้น-ใบ ( stem and leaf display) โดยมีขั้นตอนดังต่อไปนี้

แผนภาพต้น - ใบ

(Stem and leaf display)

แผนภาพต้น - ใบ (Stem and leaf display)

21 of 23

1. จัดแบ่งข้อมูลออกเป็นกลุ่ม ๆ โดยเรียงลําดับจากน้อยไปหามาก หรือมากไปน้อย

ถ้ากลุ่มข้อมูลเป็นเลขสองหลักให้ ใช้เลขโดดของหลักแรก (หลักสิบ)

ถ้ากลุ่มข้อมูลเป็นเลขสามหลักให้ ใช้เลขโดดของสองหลักแรก คือ หลักร้อยและหลักสิบ

2. นํากลุ่มข้อมูลในข้อ 1 มาใส่ในหลัก (แนวตั้งในหลักแรก) เพื่อสร้างเป็นลําตน (stem)

แผนภาพต้น - ใบ

(Stem and leaf display)

แผนภาพต้น - ใบ (Stem and leaf display)

22 of 23

3. เมื่่อได้ลําต้น จึงแจกแจงความถี่

โดยพิจารณาจากข้อมูลที่มีอยู่ในแต่ละแถว

แนวนอน นํามาต่อเป็นใบ (leaf) ของแต่ละกลุ่ม

4. เรียงลําดับข้อมูลจากน้อยไปมากของแต่ละกลุ่ม (แต่ละแถวแนวนอน) ก็จะได้แผนภาพ

ต้น-ใบ (stem and leaf display)

แผนภาพต้น - ใบ

(Stem and leaf display)

แผนภาพต้น - ใบ (Stem and leaf display)

23 of 23

การแจกแจงความถี่สะสมโดยใช้กราฟ

(Ogive curve)

กราฟแสดงความถี่สะสม เรียกว่า “เส้นโค้งความถี่สะสม” หรือเส้นโค้งโอจีฟ (Ogive curve) เส้นโค้งความถี่่สะสม เป็นกราฟแสดงความสัมพันธ์ระหว่างขอบบนของอันตรภาคชั้นกับความถี่สะสม แล้วโยงจุดนั้นด้วยเส้นตรง จากนั้นปรับให้เป็นเส้นโค้งเรียบ กราฟแสดงความถี่สะสมสามารถนําไป

ใช้ประโยชน์ในการประมาณความถี่ของค่าของข้อมูลที่ตํ่ากว่าหรือสูงกว่าคะแนนที่กําหนดให้