مبادئ الاحصاء STAT101 - المستوى الاول - جامعة الامام عبدالرحمن بن فيصل - التعلم عن بعد -
مذكرة مبادئ الاحصاء ١٤٣٨ - المستوى الاول - شكرا لاستاذ المادة : د.فراس حداد
سوف يتم اضافة القوانين المطلوبة للحل في الصفحة الاخيرة من الاختبار النهائي ( بداية من مقاييس النزعة المركزية )
طول الفئة : ∆
الوسط الحسابي للعينة:
μ معناه في الاحصاء الوسط الحسابي لكافة المجتمع. ( يكون تقديرياً). هذه معلمة.
σ معناه في الاحصاء الانحراف المعياري لكافة المجتمع. هذه معلمة.
حجم المجتمع: N
حجم العينة: n وهو عدد المشاهدات اذا كانت البيانات اولية
ومن توزيع تكراري يعرف كما يلي
n= |
h : عدد الفئات
التباين للعينة و رمزه S2
الانحراف المعياري للعينة و رمزه S
x = مركز الفئة
الفئة الوسيطية: هي اول فئة يزيد تكرارها المتجمع عن n على اثنين او يساويها
يكون هو المئين
الوسط الحسابي الهندسي للبيانات الاولية =
الوسيط M للبيانات الاولية للبيانات الفردية
الوسيط M للبيانات الاولية للبيانات الزوجية
المدى المئيني = المئين ٩٠ - المئين ١٠ اي نزيل ١٠٪ من الطرفين
المدى الربيعي = الربيع الثالث - الربيع الاول
نصف المدى الربيعي = ( الربيع الثالث - الربيع الاول) / ٢
من مقاييس النزعة المركزية measures of central tendency | من مقاييس التشتت measures of dispersion |
الوسط الحسابي | المدى Range |
الوسط الحسابي المرجح | التباين S2 |
الوسط الهندسي | الانحراف المعياري S |
الوسيط M | الانحراف المتوسط M.D. |
المنوال Mode | معامل التغير C.V. |
الربيعات - العشيرات - المئينات |
تمرين بناء جدول توزيع تكراري - علامات ٨٠ طالب https://goo.gl/9H72ns - حساس لحالة الحرف - (من محاضرات جامعة الامام عبدالرحمن بن فيصل)
الة حاسبة للرسم https://www.desmos.com/calculator
موقع تدخل به المسألة في المواضيع - الجبر٬ الاحصاء٬ الكيمياء٫ علم المثلثات٬التفاضل و التكامل٬ وغيرها - فيظهر لك الحل النهائي https://www.mathway.com/Algebra
للاطلاع على طريقة الحل يجب ان تدفع رسوم الاشتراك في الموقع
http://www.jmasi.com/ehsa/ موقع محمد شكري الجماصي
س ١٦ : من اكثر مقاييس التشتت استخداما في الدراسات ؟ الاجابة: التباين
س : معامل التغيير يعتمد في حسابه على مقايسين هما ؟ الوسط الحسابي و الانحراف المعياري
س ٥٨ : التكرار النسبي لفئة من فئات التوزيع التكراري هو: الاجابة :خارج قسمة تكرار الفئة على مجموع التكرارات
س ٦٠: طوال الفئة في التوزيع التكراري تمثل في المدرج التكراري؟ الاجابة : عرض المستطيل
س ٦٥: نعين على المحور الافقي في المدرج التكراري؟ الفئات الفعلية
س: اتخاذ القرار في الاحصاء التحليلي يكون على شكل: الاجابة : جميع ما ذكر
- قبول او رفض - تعميم - تقدير - جميع ما ذكر
س : قسم الاحصاء المسؤول عن اتخاذ القرار في اي دراسة هو a. الوصفي b.الاستقرائي (الجواب b)
س:مقدار الفرق بين متوسط العينة و متوسط المجتمع يسمى : ؟
تجمعات طلابية لطلاب الانتساب - جامعة الامام عبدالرحمن بن فيصل
http://www.cofe-cup.net/vb/
http://www.multqa-ud.com/vb/
https://vb.ckfu.org/
اذا كنت تقرأ الملف علي صيغة بي دي اف حاول تدوير الصفحة الثانية باستخدام زر التدوير ( او اصبعين)
م | الموضوع | الاتمام | الصفحة |
١ | ١ مقدمة | تمت المراجعة | 4 |
٢ | ٢ طرق سحب العينات | تمت المراجعة | 5 |
٣ | ٣ ج١ طرق عرض البيانات المفردة | تمت المراجعة | 7 |
٤ | ٣ ج٢ تكملة طرق عرض البيانات المفردة | تمت المراجعة | 9 |
٥ | ٤ بناء التوزيع التكراري | تمت المراجعة | 10 |
٦ | ٥ تتمة شرح بناء التوزيع التكراري | نعم | 11 |
٧ | ٦ طرق تمثيل جدول التوزيع التكراري | نعم | 13 |
٨ | ٧ مقاييس النزعة المركزية | نعم | 17 |
٩ | المباشرة الاولى لفصل دراسي سابق الرابط | لا توجد على البلاكبورد | 19 |
١٠ | ٨ تتمة مقاييس النزعة المركزية | نعم | 21 |
١١ | المحاضرة التاسعة لفصل دراسي سابق الرابط | لا توجد على البلاكبورد | 24 |
١٢ | ٩ مقاييس التشتت | نعم | 26 |
١٣ | ١٠ تتمة مقاييس التشتت | نعم | 29 |
١٤ | المباشرة الثانية | نعم | 30 |
١٥ | ١١ الارتباط و الانحدار معامل بيرسون | نعم | 31 |
١٦ | ١٢ الارتباط و الانحدار معامل سبيرمان للرتب | نعم | 33 |
١٧ | ١٣ الارتباط و الانحدار معادلة خط الانحدار | نعم | 35 |
١٨ | ١٤ وحدة الارقام القياسية | نعم | 37 |
١٩ | ١٥ وحدة الارقام القياسية | نعم | 38 |
٢٠ | ١٦ السلاسل الزمنية | نعم | 40 |
٢١ | ١٧ حساب مركبة الاتجاه | نعم | 41 |
٢٢ | ١٨ مثال حساب مركبة التذبذب | نعم | 42 |
٢٣ | المباشرة الثالثة | نعم | 44 |
٢٤ | اسئلة الاختبار النصفي | نعم | 44 |
٢٥ | اسئلة الواجب الاول١٤٣٨ | نعم | 48 |
٢٦ | اسئلة الواجب الثاني١٤٣٨ | نعم | 48 |
٢٧ | اسئلة الواجب الثالث١٤٣٨ | نعم | 49 |
٢٩ | مثال على طول الفئة | نعم | 50 |
المحاضرة الاولى / مقدمة في الاحصاء https://youtu.be/D5SO0427M80
علم الاحصاء/ العلم الذي يهتم بطرق جمع و عرض و تحليل البيانات لاتخاذ القرار المناسب بناءا على هذا التحليل.
يستخدم علم الاحصاء في كل الحقول العلمية التي تعامل معها الانسان مثل: التعليم الصحة الادارة الزراعة … الخ .
الاحصاء له خاصيتان :
أ. نظرية : وهو ما يسمى الاحصاء الرياضي.
النظرية حيث يتعامل علم الاحصاء مع البرهان لبعض (النظريات الاحصائية٬ الاشتقاق٬ القوانين٬ المعادلات).
الاحصاء النظري يخص بالمتخصصين في الاحصاء.
ب. عملية: ( التطبيقي)
العملية وهي تطبيق هذه النظريات او القوانين او القواعد الرياضية لحل بعض المشكلات الحقيقية في المجتمع.
يقسم الاحصاء العملي الى قسمين حسب التعامل مع البيانات وهما:
١- الوصفيdescribtive: ويتضمن جمع و عرض و تحليل بيانات العينة باستخدام ( الرسومات الاحصائية٬ المقاييس الاحصائية٬ و الجدول) حيث تؤدي هذه الى وصف البيانات.
٢- التحليليinferential (الاستقرائي): يقوم بتفسير النتائج التي يصل اليها الاحصاء الوصفي لاتخاذ القرارات المناسبة و تعميمها على المجتمع.
بعض المصطلحات الاحصائية المهمة :
- المجتمع (اومجتمع الدراسة): هو مجموع جميع الافراد موضوع البحث.
هنالك نوعان من المجتمع بالنسبة الى عدد افراده:
١- منتهي اي يمكن حصره و عدّ افراده ( مثل اعداد الكتب في مكتبة الجامعة)
٢- غير منتهية اي لا نستطيع حصر عدد افراد هذا المجتمع مثل ( عدد افراد المجتمع الذي يستخدم دواء panadol
- العينة : مجموعة جزئية من المجتمع.
- المعلمة Parameter ( وهي مهمة في مادة الاحصاء القادمة) :
هو قيمة عددية توصف جميع بيانات التي تمثل المجتمع و يرمز لها بالحروف اليونانية.
مثال/ معدل اطوال طلاب جامعة الدمام (μ) و الانحراف المعياري لاطوال هؤلاء الطلاب(σ).
μ معناه في الاحصاء الوسط الحسابي لكافة المجتمع. اما الوسط الحسابي للعينة فهو
σ الانحراف المعياري للمجتمع
- الاحصائيات statistics: قيمة عددية تمثل بيانات العينة و يرمز لها بالحروف الانجليزية مثل M ,S
مثال: معدل اطوال عينة مكونة من ٣٠ طالب من طلاب الجامعة.
- المتغير variable : الخصائص التي يتصف فيها كل افراد المجتمع او العينة ( العمر٬ الطول٬ الوزن… الخ)
اول مهمة يقدمها علم الاحصاء هي جمع البيانات و لهذا يجب سحب عينة من المجتمع . اذا كانت العينة ممثلة حقيقية للمجتمع كانت نتائجها قريبة من تمثيل المجتمع. ومن المهم العشوائية وعدم التحيز لاي قيمة.
مراحل البحث الاحصائي: من اهم مراحل البحث هي عملية جمع البيانات:
تحديد مجتمع الدراسة؟ من هم المستفيدين من الدراسة؟
عملية جمع البيانات: استبدال المجتمع بعينة يجب ان يتم بطريقة صحيحة.
حتى نقوم بجمع البيانات فاننا لابد ان نسحب عينة من المجتمع. نستخدم العينة لان المجتمع كبير جدا.
الاحصاء الوصفي: نصف بيانات العينة == العينة
الاحصاء التحليلي - الاستقرائي - الاستدلالي - : نصف بيانات ( نعمم النتائج على مستوى المجتمع) == المجتمع
المحاضرة الثانية : https://www.youtube.com/watch?v=fIB3bCIt2-Y
الاحصاء له وجهان نظري و تطبيقي٬ التطبيقية تنقسم الى وصفي و تحليلي٬ اما الوصفي يصف البيانات٬ مثل مقاييس النزعة المركزية و مقاييس التشتت. الوسط الحسابي يعطي وسط و مركز البيانات و هذا سبب تسميتها النزعة المركزية. و يفضل استخدام مقاييس اكثر مثل التباين او الانحراف المعياري لنعرف بعد البيانات عن الوسط الحسابي. فاذا كانت قيمة مقياس التشتت كبيرة كان بعد البيانات عن الوسط الحسابي كبير.
جمع البيانات: حتى نقوم بجمع البيانات فاننا لابد ان نسحب عينة من المجتمع. يجب ان يكون سحب العينة عشوائيا و غير متحيز.
طرق سحب العينات: وهنالك 5 طرق. و هي اعلى استخدام اي ٩٥٪.
1- العينة العشوائية البسيطة: simple random sample
من اهم صفات استخدام هذه الطريقة هو
أ) حجم المجتمع يجب ان يكون معلوماً مسبقاً. نرمز لحجم المجتمع بالحرف N.
ب) ان يكون افراد المجتمع متجانسين. - اي لا يكون هنالك فروق بين الافراد -
مثال: معدل اطوال طلاب كلية الدراسات التطبيقية و خدمة المجتمع.
افضل طريقة هي العينة العشوائية البسيطة ونجري الدراسة على العينة
اذا عدد الطلاب معروف - و نلاحظ عدم وجود اختلافات بين الطلاب
حجم المجتمع تم تحديده ب N=1000 اريد ان اسحب عينة حجمها n=50 - يُعطى حجم العينة في السؤال - ورمزه n
نستخدم ما يعرف في علم الاحصاء - بجداول الارقام العشوائية -. نعطي كل طالب رقم من ٠٠٠ حتى ٩٩٩ اي اننا انقصنا ١ من ١٠٠٠ . لو كان الرقم اربع خانات لوجدنا صعوبة في سحب العينة.
نلاحظ ان كل رقم من جدول الارقام العشوائية عدد خاناته ٥ خانات - و عليك استخدام ٣ خانات فقط من اليسار خلال عملية سحب العينة n مرات.
نأتي بجدول الارقام العشوائية و نضعه على طاولة - ونسقط القلم على الجدول- ونسحب ارقام المختارين في العينة.
٤٧٣٩٠ - ٢٨٢٠٢ - ٣٧٩٨٨ - ٧٢٩٦٧ - ١٣٧٩٤ -
ناخذ اطوال الطلاب العينة ثم نوجد الوسط الحسابي للعينة ورمزه: اكس بار
الناتج يصف العينة لا المجتمع و نعمم النتيجة على المجتمع وهذه وظيفة الاحصاء الاستقرائي.
جدول الارقام العشوائية يوجد في كتب الاحصاء والأرقام فيه موزعة عشوائيا لاستخراج العينة بطريقة عشوائية.
2- العينة الطبقية:
من خصائص هذه الطريقة ان يكون المجتمع غير متجانس و عدد افراده N غير معلوم -
الدافع الى استخدام هذه الطريقة ان يكون المجتمع غير متجانس.
مثال: معدل دخل الفرد السنوي. تم تمثيل المجتمع بشكل مستطيل و لدينا اربع طبقات
N2=400 n2= 20 | N4=100 n4=5 | N N=1000 n=50 | ||
N3=300 n3= 15 | N1=200 n1=10 | |||
N1 متجانس N2 متجانس N3 متجانس N4 متجانس
استطعنا تقسيم المجتمع الى ٤ طبقات٬ افراد كل طبقة متجانسين.
n = n1 + n2 + n3 + n4 N = N1 + N2 + N3 + N4
لايجاد حجم العينة لكل مجتمع مقسم نستخدم القانون التالي حيث i هي تعداد الطبقة
لايجاد العينة للطبقة n1 نعوض في القانون كما يلي
n1= حجم العينة للطبقة الاولى | n= حجم العينة |
N= حجم المجتمع | N1= حجم المجتمع للطبقة الاولى |
بالتعويض نجد ان العينة للطبقة الاولى يساوي ٥ وهكذا لسائر الطبقات.
يتم تحديد العينة بطريقة النسبة و التناسب. - الرجاء التدريب على ايجاد حجم العينة فمنها ياتي اسئلة في الامتحان-
ملاحظة: هنا نستخدم طريقتين لسحب افراد العينة٬ الطريقة الاولى باستخدام العينة الطبقية اما الطريقة الثانية فهي العينة العشوائية البسيطة.
3- العينة العنقودية: انظر سؤال الواجب الاول ١٤٣٨ رقم ٢
للدراسات التي يكون فيها المجتمع متجانس و غير معلوم حجمه. اختار بعشوائية اذا كان افراد المنطقة تقسيمها كبير و تستمر هذه العملية حتى تستطيع اخذ جزء من المجتمع كعينة. ناخذها بطريقة رسم مثال/ يقسم المجتمع الى اربعة اقسام٬ ويتم اختيار قسم عشوائيا٬ ونقرر ان كانت العينة لا تزال كبيرة٫ حينها يتم تقسيمها الى ٤ أقسام٬ و يتم اختيار احد الاقسام عشوائيا٬ ونقرر ان كان حجم العينة مناسب٬ ثم نكرر حتى نستطيع اخذ كامل القسم كعينة. و تجرى عليهم الدراسة. | |
المجتمع متجانس و الحجم غير معلوم N=? |
هنا نستخدم طريقتين هما الطريقة الطبقية٬ اما الطريقة الثانية فهي العينة الشوائية البسيطة. فبعد تحديد الطبقات نسحب من كل طبقة عينة عشوائية بسيطة تناسب حجم الطبقة.
4- العينة المنتظمة:
تستخدم عندما يكون المجتمع في مكان محصور. تهتم بنوعية منتج معين. مثل دراسة نوعية الأكل الذي يقدم في مطعم الجامعة٬ ناخذ من الطلاب الذين يغادرون المطعم الى العينة. مع تثبيت عدد الاشخاص الذين بعدهم نسحب الى العينة.
الاول٬ الثاني٬ الثالث٬ الرابع٬ ثم ناخذ الخامس الى العينة - الاول٬ الثاني٬ الثالث٬ الرابع٬ ثم ناخذ الخامس الى العينة - حتى يكتمل عدد العينة n المراد اجراء الدراسه عليه.
5- العينة المعيارية: تستخدم في الدراسات الطبية.
المعيارية اي افضل عينة يمكن استخدامها.
مثال\ نسبة نجاح العملية الطبية. يجري المستشفى دراسة على نسبة نجاح عملية٫ يتم اخذ اول عشر عمليات. وجدت نسبة النجاح ٦٠٪ ٬ عند رفع عدد العمليات الى اول ٢٠ عملية وجدت نسبة النجاح ٦٥٪ وبعد ثلاثين عملية وجدت نسبة النجاح ٧٠٪ . يتم تثبيت النسبة عند الحصول على نفس نسبة النجاح عند زيادة عدد العمليات في العينة. فبعد ٤٠ عملية وجدت النسبة عند ٧٠٪ . و بعد ٧٠ عملية وجدت النسبة عند ٧٠٪. و بعد ٩٠ عملية وجدت النسبة عند ٧٠٪ .
تستخدم هذه الطرق الخمس في معظم الدراسات الموجودة٬ و ليس سهل على الدارس تحديد الطريقة المناسبة التي تناسب مجتمع الدراسة.
بعد جمع البيانات سنتعلم كيف نعرضها بطريقة جيدة. من اهم خطوات و اجزاء اي بحث هو الوصف. يجب وصفها بشكل دقيق و عميق. كلما وصفت البيانات عُرف عنها شيء جديد. و دعا ذلك الى مواصلة البحث.
الاحصاء هو وسيلة لا غاية. مثال:
قبول الطلبة لعملية التعلم باستخدام الموبايل. هنا يحتاج الباحث الى الاحصاء.
1- يحدد مجتمع الدراسة. هل يجريها على الجامعة؟ وهل يجريها على البكالريوس ام الماجستير ام الدكتوراه.
2- يحدد حجم العينة و اختيار طريقة سحب العينة + سحب العينة.
3- جمع البيانات من افراد العينة. هنالك عدة طرق لجمع البيانات/ أ- الهاتف،ب- المقابلة الشخصية، ج- الاستبانة،
4- عرض البيانات بطريقة صحيحة. الرسومات او بعض المقاييس الاحصائية التي تصف هذه البيانات ٬ …..
5- تحليل هذه البيانات. باستخدام بعض القوانين و القواعد الاحصائية. جميع الخطوات السابقة قام بها الاحصائي
6- اتخاذ القرار. قبول او رفض٬ او تعميم نتائج العينة على المجتمع٬ او تقدير من نتائج العينة الى نتائج المجتمع٬…..
7- الهدف من الدراسة.
المحاضرة الثالثة - الجزء الاول / عرض البيانات. https://www.youtube.com/watch?v=1RMum4pxgI4
عرض البيانات المفردة. طرق عرض البيانات الوصفية/ ستة انواع:
1 طريقة الجدول:
وهي عبارة عن وضع البيانات في جدول٬ حيث يوضع عنوان لكل جدول بما يحتوي هذا الجدول من معلومات وهو ما يسمى التبويب. يجب وضع عنوان للجدول ليفهم الناظر الجدول + الوحدات المستخدمة + مذكرات المصادر التي اخذت منها البيانات + مذكرات تفسيرية تفسر القيم الشاذة ان وجدت..
مثال: كان عدد الطلبة في احد المدارس الاساسية في عام ١٩٩٥ كما في الجدول (١) :
الصف | عدد الطلبة | الصف | عدد الطلبة |
الاول | ٤٥ | السادس | ٣٠ |
الثاني | ٤٠ | السابع | ٢٥ |
الثالث | ٤٠ | الثامن | ٢٥ |
الرابع | ٣٢ | التاسع | ٢٥ |
الخامس | ٣٠ | العاشر | ٢٥ |
الجدول (١) عدد طلاب مدرسة لعام ١٩٩٥
من هذا الجدول نستطيع ان نفسر ما داخل هذه المدرسة مثل الصفوف وعدد الطلاب في كل فصل. ان اكبر عدد للطلاب كان في الصف الاول و ان الصفوف من السابع و حتى العاشر لهم نفس عدد الطلبة.
2 طريقة المستطيلات او الاعمدة:
تستخدم هذه الطريقة للمقارنة بين قيم الظواهر حسب الزمن او المسميات.
توضع المسميات على محور افقي ورسم مستطيل على كل مسمى يكون طول ارتفاعه ممثلاً للقيمة المقابلة لذلك المسمى وذلك باستعمال مقياس رسم مناسب. يوضع عنوان للجدول + الوحدات المستعملة + مصادر البيانات. لاحظ في المثال انه لدينا ٣ احصائيات
مثال: يمثل الجدول (٢) اعداد الطلبة في احدى الكليات في جامعة الدمام خلال الاعوام ٩٤/١٩٩٥ - ٩٧/١٩٩٨
السنة | الذكور | الاناث | المجموع |
٩٤/٩٥ | ٦٠٠ | ٢٠٠ | ٨٠٠ |
٩٥/٩٦ | ٧٠٠ | ٣٠٠ | ١٠٠٠ |
٩٦/٩٧ | ٨٥٠ | ٤٥٠ | ١٣٠٠ |
٩٧/٩٨ | ١٠٥٠ | ٨٠٠ | ١٨٥٠ |
الجدول(٢) عدد الطلاب حسب الجنس في احد كليات جامعة الدمام
كان عدد الذكور اكبر من عدد الاناث في كل عام. كان عدد الذكور ٦٠٠ طالب في العام ٩٤/٩٥ و كان مجموع الطلبة ٨٠٠ طالب و طالبة. اكبر عدد من الطلبة كان ١٨٥٠ و ذلك عام ٩٧/٩٨ و كان عدد الاناث ٨٠٠ طالبة.
نضع الاعوام على المحور الافقي في المنتصف لكل عام حتى يظهر لنا انها تمثل جميع البيانات.
يمثل اللون الازرق الذكور و يمثل اللون الرمادي عدد الاناث. يمثل اللون الاصفر مجموع الطلاب.
3 طريقة الخط المنكسر: تستخدم لعرض بيانات الناتجة من لتغير ظاهرة او عدة ظواهر مع مسميات او مع الزمن او تغيير اعداد الطلبة في جامعة مع الاعوام او تغير درجة حرارة مريض مع الزمن. مثل مخططات القلب.
تفيد هذه الطريقة متابعة التغير مثل نبض مريض او درجات الحرارة.
الخط االازرق يمثل الذكور و يمثل الخط الاحمر الاناث و يمثل الخط الاصفر المجموع.
علينا ان نضع لاي رسمة رقم للشكل
الشكل (٢) عدد الطلاب لمدرسة
4 طريقة الخط المنحنى هي نفسها طريقة الخط المنكسر و الفرق الوحيد هو طريقة التوصيل بين النقاط المتتالية حيث تكون هنا على شكل منحنى. تستخدم هذه الطريقة عندما تتغير الظاهرة على فترات زمنية قصيرة و كثيرة. مثل هطول الامطار و درجة الحرارة.
المحاضرة المسجلة الثالثة ج٢ تكملة طرق عرض البيانات المفردة RHZFuuHlU6A
5 طريقة الدائرة: انظر سؤال الواجب الاول ١٤٣٨ رقم ١
نقوم بتقسيم الكل الى أجزائه٬ فيمثل المجموع الكلي بدائرة كاملة ويمثل كل جزء بقطاع دائرة.
زاوية القطاع = | العدد | X ٣٦٠ |
المجموع الكلي |
مثال: يمثل الجدول (٣) عدد اعضاء هيئة التدريس في احدى الجامعات خلال الاعوام ٩٥/٩٦ - ٩٨/٩٩
العام الجامعي | عدد اعضاء هيئة التدريس |
٩٥/٩٦ | ٩٠ |
٩٦/٩٧ | ١٠٥ |
٩٧/٩٨ | ١٢٠ |
٩٨/٩٩ | ١٣٥ |
الجدول (٣) عدد اعضاء هيئة التدريس في احدى الجامعات خلال الاعوام ٩٥/٩٦ - ٩٨/٩٩
اعرض هذه البيانات بطريقة دائرة.
مجموع درجات الدائرة ٣٦٠ درجة نقسم هذه الدائرة الى عدة اجزاء او قطاعات دائرية.
المجموع الكلي لجميع السنوات/ 90+105+120+135=450 حتى نحسب الزاوية لاي قطاع نطبق القانون التالي ٩٥/٩٦ ٩٦/٩٧ ٩٧/٩٨ ٩٨/٩٩ |
تمرين/ اوجد المجهول. كم عدد الساعات التي قضاها الطالب في دراسة مادة الاحصاء. اذا علمت انها تمثل بزاوية مقدارها ١٠٨ درجة. وعلمت ان مجموع الساعات الكلية التي قضاها الطالب في الدراسة تساوي ٤٠ ساعة.
زاوية القطاع
تمرين/ لمجموعة من القيم٫ اذا مثلت احدى القيم بطريقة الدائرة و كانت زاوية القطاع ٣٠ درجة وكان تكرار تلك القيمة تساوي ٦ فان مجموع جميع التكرارات لجميع القيم يساوي؟
زاوية القطاع
6 الطريقة التصويرية.
التوزيع التكراري
التعريف : هو عبارة عن جدول يحتوي على عمودين الاول يمثل الفئات و الثاني يمثل التكرارات.
ان احد الطرق لعرض بيانات عددها كبير هو التوزيع التكراري٬ وهو احد الطرق التي نتمكن بواسطتها من تنظيم البيانات الكثيرة بحيث لا تخسر هذه البيانات اهميتها. الطريقة الاساسية لبناء التوزيع التكراري هي عبارة عن تقسيم مدى قيم البيانات الى فئات و حصر عدد البيانات الواقعة ضمن كل فئة.
خصائص التوزيع التكراري :
1 الفئات تكون غير متداخلة. ( اي لا تبدا الفئة التالية من داخل الفئة السابقة)
2 يجب ان تكون الفئات ذات اطوال متساوية.
3 ان تحتوي هذه الفئات على جميع البيانات التي نريد تمثيلها. يجب ان يحتوي على جميع البيانات الاولية التي جمعها الباحث.
يجب دراسة اعمدة هذا التوزيع بشكل صحيح لما لها من اهمية في علم الاحصاء و المحاضرات القادمة.
المحاضرة الرابعة بناء التوزيع التكراري https://youtu.be/4BVANS1zQjc
مثال/ ابن التوزيع التكراري للبيانات التالية: التي تمثل علامات ٥٠ طالب في امتحان نهائي لمادة مبادئ الاحصاء
21,22,25,30,35,33,18,41,42,47,
26,19,20,29,30,38,36,35,15,19,
17,16,21,22,32,33,35,41,45,46
يتم بناء التوزيع حسب الخطوات التالية:
١) الخطوة الاولى/ نحدد عدد الفئات و عادة تكون بين 5 و 15 اذا كانت البيانات كبيرة. في مثالنا لتكن عدد الفئات 6 .
٢) الخطوة الثانية/ نحدد المدى وهو = اكبر مشاهدة ناقص اصغر مشاهدة ( اكبر مشاهدة - اصغر مشاهدة )
=47-15=32
اذا كان المدى صغيرا فإننا نستخدم قيم المشاهدات٫ ونضع التكرارت امامها.
٣) نجد طول الفئة ( يقرأ دلتا): ( انظر الصفحة الاخيرة)
طول الفئة = المدى على عدد الفئات ونقرب طول الفئة الى الاعلى
= 5.3333 ≈ 6 التقريب يكون الى الاعلى دائما
ملاحظة: طول الفئة يجب ان يكون متناسق مع البيانات، فإذا كانت البيانات اعداد صحيحة يجب ان يكون طول الفئة عدد صحيح. واذا كانت البيانات ذات منزلة عشرية واحدة يجب ان يكون كذلك طول الفئة ذو منزلة عشرية واحدة و هكذا.
مثال: حول كيف نقرب دلتا حسب البيانات الموجودة في الدراسة؟
لنفرض ان حاصل كان ذا منزلتين عشريتين٬ علينا ان نقربها الى منزلة واحدة كما في البيانات
= 2.56 ≈ 2.6 التقريب دائما الى الاعلى
= 6.333 ≈ 6.4 التقريب دائما الى الاعلى
= 4.2476812 ≈ 4.3 نقرب دائما الى الاعلى
= 4.2476812 ≈ 4.25 نقرب دائما الى الاعلى
= 6.333 ≈ 6.34 نقرب دائما الى الاعلى
تمرين/ وجد أن طول الفئة يساوي ٦ ٬ وان عدد الفئات هو ٥. ماهي القيمة المجهولة٬ ثم اوجدها.
6= | ? | لحل هذه المسئلة تخلص من الخمسة بضرب الطرف الايمن و الايسر في خمسة |
5 |
نختصر الخمسة مع الخمسة
٤) نعين الحد الادني للفئة الاولى ( اقل قيمة ) الفئة الاولى هي الاهم : لان الفئات الاخرى معتمدة على هذه الفئة.
الفئة تتكون من حدين، حد ادنى و حد اعلى
الحد الادنى للفئة هو اصغر من او يساوي اصغر مشاهدة. ويفضل اختيار اصغر مشاهدة من بين المشاهدات.
في مثالنا: الحد الادني = ١٥
٥) نعين الحد الاعلى للفئة الاولى وهو = الحد الادنى + - وحدة دقة
اذا الفئة الاولى في التوزيع التكراري
وحدة الدقة تتناسب مع شكل البيانات:
-اذا كانت البيانات اعداد صحيحة كانت وحدة الدقة وفي مثالنا وحدة الدقة هي ١ لان البيانات اعداد صحيحة.
- واذا كانت البيانات ذات منزلة عشرية واحدة كانت وحدة الدقة تساوي
- اذا كانت البيانات ذات منزلتين عشريتين كانت وحدة الدقة هي
- اذا كانت البيانات ذات ثلاث منازل عشرية كانت وحدة الدقة هي
الفئات | التفريغ | التكرارت i | مركز الفئة Xi | الفئات الفعلية | التكرارات النسبية | التكرار المئوي | الفئات الفعلية العليا | التكرار المتجمع |
15-20 | |||| || | 7 | 17.5 | 14.5 - 20.5 |
| 23.3% | اقل من ٢٠.٥ | 7 |
21-26 | |||| | | 6 | 23.5 | 20.5 - 26.5 |
| 20% | اقل من ٢٦.٥ | 13 |
27-32 | |||| | 4 | 29.5 | 26.5 - 32.5 |
| 13.3% | اقل من ٣٢.٥ | 17 |
33-38 | |||| || | 7 | 35.5 | 32.5 - 38.5 |
| 23.3% | اقل من ٣٨.٥ | 24 |
39-44 | ||| | 3 | 41.5 | 38.5 - 44.5 |
| 10% | اقل من ٤٤.٥ | 27 |
45-50 | ||| | 3 | 47.5 | 44.5 - 50.5 |
| 10% | اقل من ٥٠.٥ | 30 |
Σ | 30 | 1 | 100% |
٦) لبناء الفئات الاخرى فقط نضيفالى كل حد من الحدين الاعلى و الادنى.
الحد الادنى = ١٥ - ٢١ - ٢٧ - ٣٣ - ٣٩ - ٤٥
الحد الاعلى = ٢٠ - ٢٦ - ٣٢ - ٣٨ - ٤٤- ٥٠
- ملاحظة: الفرق بين كل حد والحد الذي يسبقه هو يمثل ب .
مثال/ لدينا توزيع تكراري ذو فئات متساوية٬ماهو طول الفئة؟ سؤال الواجب الاول ١٤٣٨ رقم ٥
الفئات | ٩-٥ | ١٤-١٠ | ١٩-١٥ | ٢٤-٢٠ | المجموع |
التكرار | ٢ | ٥ | ٨ | ١٠ | ٢٥ |
الجواب = الحد الادني للفئة - الحد الادنى للفئة
او الحد الاعلى للفئة - الحد الاعلى للفئة
مثال/ انظر الصفحة ٥٠
المحاضرة الخامسة تكملة شرح بناء التوزيع التكراري
التكرارات i / نضيف عمود التكرارات٬ ورمزه i
. بعد كتابة التكرارات٬ قم بكتابة المجموع بعد الخانة الاخيرة.
و اصبح اسمه جدول التوزيع التكراري باتمام عمودين الفئات و التكرارات.
=7+6+4+7+3+3=30
حتى الان لم نضف غير الفئات العادية.
نضيف الى الجدول مايلي:
مركز الفئة xi / احد اعمدة جدول التوزيع التكراري هو مركز الفئة و نستخدمه احيانا بدل الفئة نفسها.
مركز الفئة xi= | الحد الادنى للفئة + الحد الاعلى للفئة |
2 |
الفرق بين كل مركز الفئة و التالي هو وهو في مثالنا ٥: انظر الاختبار النصفي السؤال ٤٠
١٧.٥ - ٢٣.٥ - ٢٩.٥ - ٣٥.٥ - ٤١.٥ - ٤٧.٥
الفئات الفعلية/ لضمان دقة النتائج نوسع الفئة بمقدار وحدة الدقة٬ في مثالنا وحدة الدقة = ١
نطرح من الحد الادني نصف وحدة دقة و نجمع الى الحد الاعلى نصف وحدة دقة
الحدان الفعليان للفئة ٢٠-١٥ هما ٢٠.٥ - ١٤.٥
ملاحظة/ اذا كانت وحدة الدقة ٠.١ فان نصفها ٠.٠٥ وهكذا
التكرارات النسبية / نضيف للتوزيع التكراري عمود التكرارات النسبية٫ والتي يجب ان يكون مجموعها واحد.
التكرار النسبي= | تكرار الفئة | |
مجموع التكرارات | ||
تمرين/ 0.233 = | 7 | نضرب ؟ في الطرفين ثم نقسم على معامل ؟ وهو 0.233 |
؟ |
التكرار المئوي / هو التكرار النسبي ضرب 100%
التوزيع التكراري المتجمع الصاعد/ جدول يحتوي على الحدود الفعلية العليا مع التكرارات المتجمعة
يجب ان يبدأ من الصفر لذلك نضيف فئة تكرارها يساوي صفر. الفئة الجديدة حدها الفعلي الاعلى هو ١٤.٥ وحدودها الفعلية 14.5 - 8.5 وهذا ما نحتاجه لتكوين الفئات الفعلية العليا.
التكرار المتجمع | الفئات الفعلية العليا | الفئات الفعلية | التكرارت i | الفئات |
0 | اقل من ١٤.٥ | 8.5 - 14.5 | 0 | فئة |
7 | اقل من ٢٠.٥ | 14.5 - 20.5 | 7 | 15-20 |
13 | اقل من ٢٦.٥ | 20.5 - 26.5 | 6 | 21-26 |
17 | اقل من ٣٢.٥ | 26.5 - 32.5 | 4 | 27-32 |
24 | اقل من ٣٨.٥ | 32.5 - 38.5 | 7 | 33-38 |
27 | اقل من ٤٤.٥ | 38.5 - 44.5 | 3 | 39-44 |
30 | اقل من ٥٠.٥ | 44.5 - 50.5 | 3 | 45-50 |
وهذا الجدول مهم جدا في وصف البيانات في حال كان عدد البيانات كبير جدا و المدى كبير.
تمارين
س: اكمل العبارة / التوزيع التكراري المتجمع الصاعد هو جدول يحتوي على … و …
س: علم الاحصاء الوصفي يهتم بدراسة
a> المجتمع b> العينه
س: قسم الاحصاء المسؤول اتخاذ القرار في اي دراسة هو
a. الوصفي b. الاستقرائي
السؤال 33 : من اكثر مقاييس النزعة المركزية استخداما في الدراسات ( موضوع مقاييس النزعة المركزية)
التباين a. | المنوال b. | الوسط الحسابي c. | المدى d. |
س: اذا كان الوسط الحسابي لعشرة قيم يساوي 12 فان مجموع القيم العشرة تساوي
200 a. | 300 b. | 350 c. | 120 d. |
س: نعين على المحور الافقي في المدرج التكراري ( الحل في الصفحة التالية)
مركز الفئة a. | طول الفئة b. | الحدود الفعلية c. | التكرار التراكمي d. |
مثال/ الجدول رقم (٢) صـ ٢١٢
توزيع تكراري للمستوى التعليمي لعينة الدراسة
النسبة | العدد | المستوى التعليمية |
١٪ ٢.١٪ ٥٪ ٦٣.١٪ ٢٨.٧٪ | ٢٥ ٥٥ ١٣٢ ١٦٥٧ ٧٥٦ | آمي ابتدائي متوسط ثانوي جامعي |
الجدول رقم ٢
المصدر: ظاهرة السحر و الشعوذة دراسة ميدانية على المجتمع السعودي. اصدار: مركز البحوث و الدراسات الاسلامية
المحاضرة السادسة : تمثيل جدول التوزيع التكراري
لدينا جدول التوزيع التكراري، حين يكون لدينا عامود فئات وعامود تكرارات يسمى توزيع تكراري
الفئات | التفريغ | التكرارت | مركز الفئة Xi | الفئات الفعلية | التكرارات النسبية | التكرار المئوي | الفئات الفعلية العليا | التكرار المتجمع |
0 | 8.5 - 14.5 | اقل من ١٤.٥ | 0 | |||||
15-20 | |||| || | 7 | 17.5 | 14.5 - 20.5 |
| 23.3% | اقل من ٢٠.٥ | 7 |
21-26 | |||| | | 6 | 23.5 | 20.5 - 26.5 |
| 20% | اقل من ٢٦.٥ | 13 |
27-32 | |||| | 4 | 29.5 | 26.5 - 32.5 |
| 13.3% | اقل من ٣٢.٥ | 17 |
33-38 | |||| || | 7 | 35.5 | 32.5 - 38.5 |
| 23.3% | اقل من ٣٨.٥ | 24 |
39-44 | ||| | 3 | 41.5 | 38.5 - 44.5 |
| 10% | اقل من ٤٤.٥ | 27 |
45-50 | ||| | 3 | 47.5 | 44.5 - 50.5 |
| 10% | اقل من ٥٠.٥ | 30 |
Σ | 30 | 1 | 100% |
الحد الادنى للفئة الاولى = هو اصغر بيانة
الحد الاعلى للفئة الاولى = الحد الادنى + طول الفئة - وحدة دقة
الحد الادنى للفئة التالية = الحد الادنى للفئة السابقة + طول الفئة
الحد الاعلى للفئة التالية = الحد الاعلى للفئة السابقة + طول الفئة
عدد الفئات يحدد في السؤال. العدد المناسب للفئات في التوزيع التكراري هو من ٥ الى ١٥
عامود التكرارات النسبية = (عند اضافة هذا العمود يصبح اسم الجدول التكرار النسبي)
التكرار النسبي= | تكرار الفئة |
مجموع التكرارات |
طرق تمثيل التوزيع التكراري
١) طريقة المدرج التكراري: يشبه الدرج.
نضع الفئات الفعلية على المحور الافقي، نضع التكرارت على المحور العامودي. ومن ثم نقيم المستطيلات بحيث تكون قاعدتها( عرض المستطيل ) تساوي طول الفئة △، وارتفاع هذه المستطيلات يساوي التكرار المقابل لهذه الفئة.
التكرارات على هذا المحور | |
الفئات الفعلية على هذا المحور | |
باستخدام موقع: http://www.shodor.org/interactivate/activities/Histogram/ |
٢) المضلع التكراري:
نضع على المحور الافقي مراكز الفئات ، وعلى المحور العامودي التكرارات. ثم نحدد تكرار مراكز الفئات. يجب ان يكون المحور مغلق.اي ننشئ مركز فئة تكراره صفر قبل الفئة الاولى، ومركز لاحق لاخر فئة تكراره صفر.
http://www.socscistatistics.com/descriptive/polygon/Default.aspx باستخدام موقع |
٣) المنحنى التكراري: وهو نفس المضلع التكراري في رسمه، و الفارق الوحيد بينهما هو في طريقة التوصيل بين النقاط المتتالية بحيث هنا يكون بشكل منحنى.
٤) المضلع التكراري المتجمع الصاعد:
المحور الافقي = الحدود الفعلية العليا
المحور العامودي = التكرار المتجمع
نضيف فئة طولها Δ قبل الفئة الاولى يكون تكرارها صفر ونحدد حدها الفعلي الاعلى.
التكرار المتجمع | الفئات الفعلية العليا | الفئات الفعلية | الفئات |
0 | اقل من ١٤.٥ | 8.5 - 14.5 | |
7 | اقل من ٢٠.٥ | 14.5 - 20.5 | 15-20 |
13 | اقل من ٢٦.٥ | 20.5 - 26.5 | 21-26 |
17 | اقل من ٣٢.٥ | 26.5 - 32.5 | 27-32 |
24 | اقل من ٣٨.٥ | 32.5 - 38.5 | 33-38 |
27 | اقل من ٤٤.٥ | 38.5 - 44.5 | 39-44 |
30 | اقل من ٥٠.٥ | 44.5 - 50.5 | 45-50 |
٥) المنحنى التكراري المتجمع: هو نفسه المضلع التكراري المتجمع في طريقة رسمه و الفرق الوحيد هو اننا نوصل بين النقاط بشكل منحنى. ( لا يوجد رسم )
تمرين / املئ الجدول
الطريقة | المحور الافقي | المحور العامودي |
المدرج التكراري | ||
المضلع التكراري | ||
المنحنى التكراري | ||
المضلع التكراري المتجمع | ||
المنحنى التكراري المتجمع |
المدرج التكراري يستخدم الفئات الفعلية مع التكرارات
المضلع التكراري يستخدم مراكز الفئات مع التكرارات
المنحنى التكراري يستخدم مراكز الفئات مع التكرارات
المضلع التكراري المتجمع يستخدم مراكز الفئات مع التكرارات المتجمعة
المنحنى التكراري المتجمع يستخدم مراكز الفئات مع التكرارات المتجمعة
مقاييس النزعة المركزية
الموضوع في المحاضرة السابعة
المحاضرة السابعة: الفصل الثاني: مقاييس النزعة المركزية
تعلمنا وصف البيانات من خلال الرسومات٬ والان نصف البيانات بالارقام بدقة اكبر. مثل/ الوسط الحسابي الذي يعطينا مركز البيانات٬ تتمحور حول اي قيمة؟ اما الوسيط هو القيمة التي تحجز تحتها ٥٠٪ من البيانات و ٥٠٪ اكبر منها.
سنتعلم حساب مقاييس النزعة المركزية للبيانات في شكلين:
أ - بيانات مفردة : اي غير مجمعة في توزيع تكراري.
ب- بيانات مجمعة: اي البيانات من توزيع تكراري.
أ - البيانات مفردة:
النوع الاول من مقاييس النزعة المركزية: الوسط الحسابي ( يتأثر سريعا بالقيم الشاذة outliers)
تعريف الوسط الحسابي للبيانات المفردة والتي عددها X1, …., xn
|
| = | X1+......., xn |
مثال/ احسب الوسط الحسابي للبيانات التالية/ ٧ - ٦ - ٠ - ١ - ٥ - ٢
|
| = | X1+......., xn | = | 2+5+1+0+6+7 | = | 3.5 |
6 |
اذا كانت القيمة الشاذة كبيرة فانها تؤثر في الوسط الحسابي
مثال/ احسب الوسط الحسابي للبيانات التالية/ ١٠ - ١٥ - ٣ -٧ - ٨ -١١ - ١٠٠
| = | 10+15+3+7+8+11+100 | = | 22 |
7 |
نلاحظ ان ٢٢ اكبر من غالبية البيانات٬ الان نحسب الوسط الحسابي بدون قيمة شاذة :
مثال/ احسب الوسط الحسابي للبيانات التالية/ ١٠ - ١٥ - ٣ -٧ - ٨ -١١
| = | 10+15+3+7+8+11 | = | 9 | |
6 | |||||
نضرب ١٠ في الطرفين فيكون ؟ يساوي الطرف الاخر | = | ? | = | تمرين/ 20 | |
10 |
النوع الثاني من مقاييس النزعة المركزية: الوسيط median و رمزه
تعريف/ الوسيط في البيانات المفردة المرتببة ترتيباً تصاعديا او تنازليا هو القيمة التي تحجز تحتها ٥٠٪ من البيانات و بعدها ٥٠٪ من البيانات. اي هو القيمة المتوسطة للبيانات التي عددها فردياً واما ان كان عدد البيانات زوجيا فانه يساوي الوسط الحسابي للقيمتين المتوسطتين للبيانات.
مثال/ اوجد الوسيط من بين البيانات التالية/ ١٠ - ١٥ - ٣ - ٧- ٨- ١١- ١٠٠
الحل: نرتب البيانات تصاعديا ٣ - ٧ - ٨ - ١٠ - ١١- ١٥ - ١٠٠
نشطب من الاطراف من اليسار ثم اليمين٬ حتى يتبقى قيمة واحدة. فتكون هي القيمة المتوسطة بعد ترتيب البيانات اذا كان عدد البيانات فردي. اذا الوسيط هو ١٠
مثال/ احسب الوسيط للبيانات التالية/ ١٠ - ١٥ - ٣ - ٧- ٨- ١١
الحل: نرتب البيانات تصاعديا: ٣ - ٧ - ٨ - ١٠ - ١١- ١٥
نشطب الأطراف من اليسار ثم اليمين حتى يتبقى قيمتان متوسطتان٫ ثم نوجد لهما الوسط الحسابي.
اذا الوسيط هو ٨ + ١٠ تقسيم ٢ اذا الوسيط هو ٩
ملاحظة: الوسيط لا يتأثر بالقيم الشاذة. - يسمى متين robust
مثال/ احسب الوسيط للبيانات التالية/ 20 - 17 - 10 - 25- 28 - 1000 - 2 - 8 -
الحل: نرتب البيانات: ٢ - ٨ - ١٠ - ١٧- ٢٠ - ٢٥ - ٢٨ - ١٠٠٠
البيانات التي في السؤال زوجية٬ لذا نحسب الوسط الحسابي للقيمتين المتوسطتين بعد الشطب من الاطراف. ١٧+٢٠= ٣٧ ثم تقسيم ٢ = ١٨.٥ نلاحظ انه يقع بين القيمتين المتوسطتين.
النوع الثالث من مقاييس النزعة المركزية: المنوال mode
تعريف: هو القيمة الأكثر تكرارا بما يجاورها من بيانات مرتبة ترتيباً تصاعديا او تنازليا.
مثال/ اوجد المنوال ( المنوالات) للبيانات التالية:
5,7,5,3,4,5,5,6,7,9,9,10,9,5,9,9,5,
الحل: نرتب البيانات ترتيباً تصاعديا
3,4,5,5,5,5,5,5,6,7,7,9,9,9,9,9,9,10
المنوالات هي ٥ ، ٩
ب- نوجد الان مقاييس النزعة المركزية للبيانات من توزيع تكراري:
النوع الاول: الوسط الحسابي/
تعريف : اذا كانت مراكز الفئات في توزيع تكراري هي X1,x2,....xh
واذا كانت التكرارات المقابلة لها هي F1,F2,.....,Fh فأن الوسط الحسابي لهذا التوزيع هو
|
| = | X1F1+X2F2+......+XhFh |
| F1+F2+.....+Fh |
نضرب مركز الفئة Xi في عدد التكرار Fi ثم نضيف اليه مركز الفئة في عدد التكرار حتى نصل الى h من المرات٬ h هو عدد الفئات . ثم نقسم على تكرار الفئة الاولى+تكرار الفئة الثانية + تكرار … حتى h من المرات وهو عدد الفئات.
مثال/ احسب الوسط الحسابي للتوزيع التكراري التالي:
فئات | التكرار Fi | مركز الفئة xi | xifi |
3-7 | 10 | 5 | 50 |
8-12 | 2 | 10 | 20 |
13-17 | 5 | 15 | 75 |
18-22 | 7 | 20 | 140 |
23-27 | 6 | 25 | 150 |
Σ | 30 | 435 |
|
| = | 435 | = | 14.5 |
| 30 |
يوجد شرح لايجاد الوسيط من توزيع تكراري و المئينات و الربيعات و العشيرات و المنوال من توزيع تكراري قبل محاضرة مقاييس النزعة التشتت.
محاضرة مباشرة - 1 https://youtu.be/a67QXrG9c3s
١- علم الاحصاء الوصفي يهتم بطرق:
أ- جمع المعلومات | ب) عرض المعلومات |
ج) تحليل البيانات | د) جميع ما ذكر answer |
2- اذا كان الحد الادني لفئة ما هو ١٥ وكان الحد الاعلى لنفس الفئة هو ١٩ فان طول الفئة هو:
أ) ٤ | ب) ٦ |
ج )٥ answer | د) ٣ |
الحل: الفترة هي ١٩ - ١٥ ٬ طول الفئة =
اذا اعطينا التوزيع التكراري التالي: اجب عن الاسئلة التالية:
التكرارات | حدود الفئات |
8 | 2-6 |
5 | 7-11 |
3 | 12-16 |
4 | 17-21 |
20 | total |
3- الحدان الفعلين للفئة الثالثة هما:
أ) 16.5-12.5 | ب) 17-11 |
ج )16.5 - 11.5 answer | د) 15.5 - 12.5 |
4- قيمة التكرار النسبي للفئة الثانية
أ) ٠.٥ | ب) ٠.٢٥ answer |
ج ) ٠.٢ |
الحل / التكرار النسبي = تكرار الفئة تقسيم مجموع التكرارات = ٠.٢٥
٥- التكرار المئوي للفئة الثانية يساوي:
أ)٥٠٪ | ب) ٢٥٪ answer |
ج) ١٥٪ | د) ٢٠٪ |
الحل / التكرار المئوي = التكرار النسبي ضرب ١٠٠٪
٦- مركز الفئة الرابعة هو:
أ) ١٧ | ب) ١٨ |
ج) ١٩ answer | د) ٢٠ |
الحل / مركز الفئة هو( الحد الاعلى للفئة + الحد الادنى للفئة) تقسيم ٢
٧- التكرار التراكمي للفئة الثالثة:
أ) ١٥ | ب) ١٦ answer |
ج) ١٧ | د) ١٨ |
الحل / التكرار التراكمي = تكرار الفئة الاولى+ الثانية + الثالثة ٣+٥+٨=١٦
٨- وحدة الدقة في التوزيع التكراري السابق هي:
أ) ٠.١ | ب) ١ answer |
ج) ٠.٠١ | د) ٠.٠٠١ |
الحل / يعرف بالمسافة بين الحد الاعلى لاي فئة و الحد الادني للفئة التالية
٩- اوجد الوسط الحسابي للبيانات٬ ١٠ -٦ - ٨ - ٧ - ٤
أ) 8 | ب) 5 |
ج) 7 answer | د) 9 |
الحل/ نجمع البيانات ثم نقسم على عددها
| ∑ | = | 10+16+8+7+4 | = | 35 | = 7 |
n | 5 | 5 |
١٠- قيمة الوسيط للبيانات: ١٠ - ٨٠ - ٩٠ - ٨٢- ٧٣ - ٦٤ يساوي:
أ) ٧٧.٥ | ب)٧٥ |
ج) ٧٦.٥ answer | د) ٧٤ |
الحل: نرتب البيانات ترتيبا تصاعديا
نبدأ باقل بيانة ١٠ - ٦٤ - ٧٣ - ٨٠ - ٨٢ - ٩٠ ثم نشطب الاطراف من اليمين بيانة ثم اليسار و نكرر الشطب حتى يتبقى خانة واحدة. لو بقي خانتان نجمعهما و نقسمهما على اثنين (اي ايجاد الوسط الحسابي لهما).في هذا المثال بقي خانتان ناتج جمعهما ١٥٣ ثم نقسمهما على ٢. الاجابة الصحيحة ج. نلاحظ ان الناتج يقع بين الخانتين الباقيتين.
١١- رتبة الوسيط في البيانات التالية: ٧ - ٨ -١٠ - ٣ - ٥ - ٢- ١١
أ) ٣.٥ | ب) 5 |
ج) ٣ | د) ٤ answer |
الحل: نرتب البيانات ٢ - ٣ - ٥ - ٧ - ٨ - ١٠ - ١١ . نوجد الوسيط ثم نحدد رتبته بين البيانات. ( ترتيبه)
١٢- قيمة المنوال او المنوالات للبيانات التالية هو :
3,8,2,5,10,7,5,2,5,8,5,6,7,8,5,8,5,8,
أ) 5 | ب) 8 |
ج) 5 , 8 answer | د) 10 |
الحل / نرتب البيانات ثم نحدد اكثر البيانات تكرارا بالنسبة لما هو جوارها من البيانات . الاجابة ج
2,2,5,5,5,5,5,5,5,6,7,7,8,8,8,8,8,10
الرسم للتوضيح |
١٣- ايجاد الوسط الحسابي من توزيع تكراري/
الوسط الحسابي للتوزيع التكراري التالي هو:
|
| الفئات | |
25 | 5 | 5 | 3-7 |
120 | 10 | 12 | 8-12 |
75 | 15 | 5 | 13-17 |
220 | n=20 | ∑ |
أ) ١٢ | ب) ١١ answer |
ج) ١٠.٥ | د) ١٣ |
الحل / قانون الوسط الحسابي من توزيع تكراري
| ∑ | = | 220 | = | 11 |
∑ | 20 |
المحاضرة الثامنة / تكملة مقاييس النزعة المركزية https://youtu.be/v8Mtdv3hLv0
ناخذ اليوم اربعة مقاييس/ الوسيط٬ المئينات٬ الربيعات٬ العشيرات ( جميعها تتضح بالامثلة وبنفس القانون)
الوسيط Median / ورمزه M هو القيمة التي تحجز تحتها ٥٠٪ من البيانات المرتبة و وبعدها ٥٠٪ من البيانات. المساحة تحت المنحنى =١ |
https://faculty.elgin.edu/dkernler/statistics/ch03/images/median.jpg
Percentiles(P) المئينات اي انا نقسم المنحنى الى ١٠٠ قسم متساوين في المساحة. فمساحة كل قسم١٪ وهذا يكون ٩٩ قاطع. و مجموع المساحات ١٠٠٪ المئين ٥٠ يساوي الوسيط M |
P99 : المئين ٩٩ يحجز تحته ٩٩٪ من البيانات و بعده ١٪ من البيانات و هكذا
تعريف PK : هو القيمة التي تحجز تحتها % K من البيانات المرتبة و بعدها K-100% من البيانات المرتبة. حيث تاخذ K القيم من ١ و حتى ٩٩
K= 1, 2, ... , 99
يتضح بالامثلة
http://www.psychometric-success.com/aptitude-tests/percentiles-and-norming.htm
ولحساب اي مئين PK من ١ الى ٩٩ نطبق القانون التالي:
∆ = | ) | - N1 | ×n | K | ( | PK = a + | ||
100 | ||||||||
| ||||||||
حيث ان:
= التكرار الاصلي للفئة المئينية وهي قيمة العمود الثاني ( التكرارات )
a : الحد الادني الفعلي للفئة المئينية | k: المئين وتاخذ القيم من ١ الى ٩٩ |
n: مجموع التكرارات اي n= | رتبة المئين = N1 : التكرار التراكمي الذي يسبق رتبة المئين. ∆ = طول الفئة في التوزيع التكراري |
الربيعات : Quartiles ورمزها (Q) : نقسم المنحنى الى اربعة اقسام متساوية لاحظ ان Q2 هو P50 و هو M Q1=P25 Q2=P50 =M Q3=P75 |
Q1: هي القيمة التي تحجز تحتها ٢٥٪ من البيانات المرتبة و بعدها ٧٥٪ من البيانات.
Q2: هي القيمة التي تحجز تحتها ٥٠٪ من البيانات المرتبة و بعدها ٥٠٪ من البيانات.
Q3: هي القيمة التي تحجز تحتها ٧٥٪ من البيانات المرتبة و بعدها ٢٥٪ من البيانات.
لذا من قانون المئينات نستطيع حساب الربيعات Q و الوسيط M
العشيرات Deciles ورمزها (D) اي ان المنحنى ينقسم الى ١٠ اقسام٬ وذلك بتسعة فواصل. كل جزء يمثل ١٠٪ من البيانات D5= M = P50 |
D1: هي القيمة التي تحجز تحتها ١٠٪ من البيانات المرتبة و فوقها ٩٠٪ من البيانات.
D2: هي القيمة التي تحجز تحتها ٢٠٪ من البيانات المرتبة و فوقها ٨٠٪ من البيانات.
...
D9: هي القيمة التي تحجز تحتها ٩٠٪ من البيانات المرتبة و فوقها ١٠٪ من البيانات.
D3=P30 | D2=P20 | D1=P10 |
D6=P60 | D5 = P50 = Q2 = M | D4=P40 |
D9=P90 | D8=P80 | D7=P70 |
Q3=P75 | Q2=P50 | Q1=P25 |
لدينا ٩ عشيرات و لدينا ٣ ربيعات واما المئينات ٩٩ مئين
اذا قسمنا البيانات الى نصفين حصلنا على الوسيط M فاصل واحد
اذا قسمنا البيانات الى ٤ اقسام حصلنا على الربيعات Q - عدد الفواصل ٣
اذا قسمنا البيانات الى ١٠ اقسام حصلنا على العشيرات D - عدد الفواصل ٩
اذا قسمنا البيانات الى ١٠٠ قسم حصلنا على المئينات PK -عدد الفواصل ٩٩
يمكن ايجاد الربيعات و العشيرات و المئينات و الوسيط للبيانات المجمعة باستخدام قانون المئينات.
مثال / في التوزيع التكراري التالي اوجد ما يلي: ( الحل خطوة بخطوة - يوجد اكثر من مثال )
المئين ٦٠ (P60) - الربيع الاول (Q1) - العشير الخامس (D5) - الوسيط (M)
الفئات | | الفئات الفعلية | التكرار التراكمي | رتبة المئين ----- 7.5 ---- 18 | ---- 15 عندما نحدد رتبة المئين فانها تدلنا على الفئة المئينية |
3-7 | 5 | 2.5-7.5 | 5 N1 | ||
8-12 | 7 | 7.5-12.5 | 12 N1 | ||
13-17 | 10 | 12.5-17.5 | 22 | ||
18-22 | 4 | 17.5-22.5 | 26 | ||
23-27 | 4 | 22.5-27.5 | 30 | ||
∑ | 30 n |
الحل / ١) لايجاد المئين ٦٠ نوجد اولاً رتبة المئين ٦٠ باستخدام القانون =
= | K | ×n = | 60 | ×30 = 18 |
100 | 100 |
نوجد الفئة المئينية: هي الفئة الفعلية التي تقابل التكرار التراكمي الذي مقداره - ٢٢ - وهو الذي ياتي بعد رتبة المئين - ١٨ - اذا الفئة المئينية هي 17.5 - 12.5 و الحد الادنى الفعلي للفئة المئينية يكون هو a و تكرارها
∆ | ) | ×n - N1 | K | ( | PK = a + |
100 | |||||
| |||||
N1 هو التكرار التراكمي الذي يسبق رتبة المئين
ملاحظة لحساب ∆: باستخدام الفئة ٣ الى ٧ . اوجد ∆ ٧ - ٣ + ١ = ٥
حيث ان الواحد هو فئة الدقة.
في الفئات العادية نلاحظ فرق بمقدار وحدة دقة بين الحد الاعلى لاي فئة و الحد الادنى للفئة التالية.
× 5 = 15.5 | ) | 18 - 12 | ( | P60 =12.5 + | |
10 | |||||
المئين ٦٠ هو ١٥.٥ والتي تحجز تحتها ٦٠٪ من البيانات وبعدها ٤٠٪ من البيانات.
٢) ايجاد الربيع الاول Q1 وهو المئين ٢٥ P25
لايجاد الربيع الاول و الذي هو المئين ٢٥ نوجد اولاً رتبة المئين ٢٥ باستخدام القانون
= | K | ×n = | 25 | ×30 = 7.5 | |
100 | 100 |
الفئة المئينية تقع بعد رتبة المئين والذي قيمته 7.5وتكرارها التراكمي١٢ وهي 12.5 - 7.5 وحدها الفعلي الادني هو a
Q1=P25=
∆ = | ) | ×n - N1 | K | ( | Q1=P25= a + |
100 | |||||
| |||||
× 5 = 9.286 | ) | 7.5 - 5 | ( | P25 =7.5+ | |
7 | |||||
معنى ذلك ان القيمة Q1=9.286 تحجز تحتها ٢٥٪ من البيانات و بعدها ٧٥٪ من البيانات.
٣) العشير الخامس D5 الذي هو P50 :
لايجاد المئين ٥٠ نوجد اولاً رتبة المئين ٥٠ باستخدام العلاقة التالية
= | K | ×n = | 50 | ×30 = 15 | |
100 | 100 |
اذا الفئة المئينية هي 17.5 - 12.5 نعوض حدها الفعلي الادني بقيمة a
D5=P50=
× 5 = 14 | ) | 15 - 12 | ( | P50 =12.5+ | |
10 | |||||
10 في المقام هي التكرار و نحصل عليها من عمود التكرارات
١٤ تحجز تحتها ٥٠٪ من البيانات و بعدها ٥٠٪ من البيانات.
4) الوسيط M M=D5=P50=14 تم ايجاده اذ انه يساوي المئين ٥٠ و العشير الخامس
المحاضرة التاسعة لفصل سابق - https://youtu.be/C1Md2VoSqhI
لو اعطيت بيانات مجمعة كما في الجدول التالي٬ اوجد الوسيط ٬ D2 ٬ Q3 ٬ P90
الفئات | التكرار | الفئات الفعلية | التكرار المتجمع |
5-9 | 3 | 4.5-9.5 | 3 |
10-14 | 7 | 9.5-14.5 | 10 |
15-19 | 10 | 14.5-19.5 | 20 |
20-24 | 5 | 19.5-24.5 | 25 |
25-29 | 15 | 24.5-29.5 | 40 |
∑ | 40 |
اولاً نضيف عامود الفئات الفعلية٫ و عامود التكرار المتجمع.
ايجاد الوسيط : الوسيط هو المئين ٥٠ ولايجاد المئين ٥٠ نوجد اولاً رتبة المئين ٥٠ باستخدام القانون
= | K | ×n = | 50 | × 40 = 20 | |
100 | 100 |
الفئة المئينية هي ١٤.٥ - ١٩.٥ وهي التي تقع مقابل التكرار المتجمع التالي بعد رتبة المئين
وجدنا رتبة المئين تساوي احد التكرارات المتجمعة لاحد الفئات٬ فيكون المئين ٥٠ هو الحد الفعلي الاعلى للفئة المئينية= ١٩.٥ فيكون الوسيط هو =i 19.5وهو كذلك المئين ٥٠
الان نوجد المطلوب التالي/ D2=P20 =
لايجاد المئين ٢٠ نوجد اولاً رتبة المئين ٢٠ باستخدام القانون وهي تساوي ٨
ننظر الى التكرار المتجمع الاعلى من ٨ و هو ١٠ تكون الفئة المقابلة له هي الفئة المئينية وهي ٩.٥ - ١٤.٥
a= 9.5 Δ=5 N1=3 = 7
P20= 13.07 تحجز هذه القيمة تحتها ٢٠٪ من البيانات و بعدها ٨٠٪ من البيانات
لو وجدنا رتبة المئين قبل ٣ في هذا المثال فما هو التكرار المتجمع الذي يسبق هذه الرتبة؟ التكرار المتجمع الذي يسبقها هو صفر
نوجد المطلوب التالي/ Q3 = P75
لايجاد المئين ٧٥ نوجد اولا رتبة المئين ٧٥ وهي تساوي ٣٠
ننظر الى التكرار المتجمع الاعلى من رتبة المئين ٣٠ و هو ٤٠ و المقابل للفئة الفعلية ٢٤.٥ - ٢٩.٥ وتكون هي الفئة المئينية. ومنها نحدد قيمة a
a=24.5 Δ=5 N1=25 = 15
يتم ايجاد الناتج باستخدام الالة الحاسبة.
المطلوب التالي/ P90
لايجاد المئين ٩٠ نوجد اولاً رتبة المئين ٩٠ باستخدام القانون والتي وجد انها تساوي ٣٦
ننظر الى التكرار المتجمع الاعلى من ٣٦ و هو ٤٠ تكون الفئة المقابلة له هي الفئة المئينية وهي ٢٤.٥ - ٢٩.٥
a=24.5 Δ=5 N1=25 = 15
يتم ايجاد الناتج باستخدام الالة الحاسبة.
تابع مقاييس النزعة المركزية
الوسط المرجح / تعريفه : اذا كان لدينا مجموعتين أ و ب وكان الوسط الحسابي للمجموعة أ هو 1 و عدد افراد المجموعة أ هو n1 ٬ كذلك الوسط الحسابي للمجموعة ب هو 2
و عدد افراد المجموعة ب هو n2 ٬ فان الوسط الحسابي للمجموعتين اثر دمجهما هو
| n1 | |
n1+ n2 |
مثال/ لدينا فصلين شعبة ١ و شعبة ٢ و اعطينا الاوساط الحسابية و عدد الطلاب كما في الجدول. واجد الوسط المرجح
شعبة ٢ | الوسط المرجح | شعبة ١ |
| ? = |
|
n2=40 | n1=30 | |
| (30)(15) + (40)(10) | = 12.143 |
(30) + (40) |
في الوسط المرجح يكون لدينا عدة مجموعات .المعطيات تكون الوسط الحسابي للمجموعات و عدد افراد كل مجموعة و يكون السؤال عن الوسط الحسابي ( المرجح ) ولا يشترط ذكر المرجح في السؤال اذ لدينا مجموعتين تم دمجهما.
المنوال التقريبي من توزيع تكراري/ هو مركز الفئة الاكثر تكرارا بما يجاورها من تكرارات.
هنالك منوال اكيد و حقيقي ولكنا هنا نعطي المنوال تقريبي للاختصار. لان له قانون اخر.
نحسب المنوال التقريبي لاي مركز من مراكز التوزيع التكراري.
مثال/ احسب المنوال او المنوالات من التوزيع التكراري التالي:
اما ان نوجد مركز الفئة للفئات الاكثر تكرارا و نوجد الناتج مباشرة
الفئات | التكرار | مراكز الفئات | يتضح ان التكرار ١٥ هو اكثر تكرارا لما حوله و كذلك ٢٠ المنوالان هما مراكز الفئات ١٧ و ٢٧ |
5-9 | 2 | 7 | |
10-14 | 3 | 12 | |
15-19 | 15 | 17 | |
20-24 | 7 | 22 | |
25-29 | 20 | 27 | |
∑ | 40 n |
مقاييس النزعة المركزية تستخدم لوصف البيانات.
تمرين /من الجدول التكراري في نهاية المحاضرة الرابعة لدينا علامات ٥٠ طالب. ما العلامة التي تحدد اعلى ١٠٪ من الطلبة؟ ما العلامة التي تحدد الوسيط لدرجات الطلاب؟ ماهي العلامة التي تحدد اقل ١٠٪ من الطلاب؟
تدريب للمحاضرة القادمة/
قيمة المدى للتوزيع التالي هي / الاجابة: المدى = الحد الفعلي الاعلى للفئة الاخيرة - الحد الفعلي الادني للفئة الاولى
حدود الفئات | 4 - 8 | 9 - 13 | 14 – 18 | المجموع |
التكرارات | 5 | 8 | 3 | 16 |
A. 12 | B. 15 | C. 20 | D. 8 |
وهنالك طرق اخرى لحساب المدى.
المحاضرة التاسعة / مقاييس التشتت https://youtu.be/bvem3pUxypw
١) المدى Range
للبيانات المفردة: المدى للبيانات المفردة هو اكبر مشاهدة - ناقص اصغر مشاهدة
للبيانات المجمعة : كما يحسب من توزيع تكراري باكثر من طريقة
المدى = الحد الفعلي الاعلى للفئة الاخيرة - الحد الفعلي الادنى للفئة الاولى
المدى = مركز الفئة الاخيرة - مركز الفئة الاولى
المدى = الحد الاعلى للفئة الاخيرة - الحد الادنى للفئة الاولى
مثال على حساب المدى: احسب المدى للتوزيع التكراري التالي:
الفئات |
| الحدود الفعلية | مركز الفئة |
4-9 | 4 | 3.5-9.5 | 6.5 |
10-15 | 10 | 9.5-15.5 | 12.5 |
16-21 | 5 | 15.5-21.5 | 18.5 |
22-27 | 6 | 21.5-27.5 | 24.5 |
28-33 | 5 | 27.5-33.5 | 30.5 |
∑ | 30 | ||
=33.5-3.5=30 | الحل: المدى = الحد الفعلي الاعلى للفئة الاخيرة - الحد الفعلي الادنى للفئة الاولى | ||
=30.5-6.5=24 | او المدى = مركز الفئة الاخيرة - مركز الفئة الاولى | ||
في حالة وجود قيم شاذة بين البيانات فإن حساب المدى لا يعطي معنى حقيقي و وصف دقيق للبيانات لذلك نلجأ لحساب المدى المئيني و المدى الربيعي كما يلي:
=P90-P10
=Q3-Q1
الان مقياس تشتت اخر.
حتى يكون الوصف للبيانات ادق نحسب بعدها عن الوسط الحسابي فكل ما كان البعد اكبر كان التشتت اكبر و العكس ان كان البعد اقل كان التشتت اقل.
٢) التباين variance و رمزه S2 وهو اهم مقاييس الاحصاء / تعريف التباين للبيانات المفردة x1x2,.....xn هو
S2 = |
| |
n-1 | ||
وجه اخر S2 = | ( | نستخدم هذا القانون لانه اسهل في استخدام الالة الحاسبة |
n-1 |
كما و يُحسب من توزيع تكراري /
S2 = |
| |
n-1 | ||
S2 = | ( | نستخدم هذا القانون |
(n-1) |
حيث : xi : تمثل مراكز الفئات في التوزيع التكراري
: الوسط الحسابي لتوزيع تكراري
n : هو مجموع اف اي مجموع التكرارات اي
n= |
حيث h: عدد الفئات
Fi : تمثل التكرارات المقابلة لكل مركز فئة
من المعروف في الاحصاء المعلومة التالية/ اذا اردنا ان نجد مجموع بُعد البيانات عن الوسط الحسابي فهذا يساوي صفر لان الوسط الحسابي يوجد في المركز وبعده ١ عن جميع البيانات. فاذا اخذنا الفارق بين كل بيانة و الوسط الحسابي و جمعناهم فهذا يساوي صفر
|
الان المطلوب حساب بعد البيانات عن الوسط الحسابي/ بهذه القاعدة يكون الجواب صفر
قال العلماء/ لو اخذنا التربيع لن نحصل على صفر.
هنالك بيانات موجبة و سالبة٬ نفس القيمة لكن مختلفين في الاشارة٬ اذا اخذت التربيع ابعدت اشارة السالب و استطيع ان احسب معدل تباعد هذه البيانات عن الوسط الحسابي وهذا اوجد لنا التباين - قانون التباين -
٣) الانحراف المعياري standard deviation / تعريف: الانحراف المعياري هو الجذر التربيعي الموجب للتباين.
مثال/ احسب التباين و الانحراف المعياري للمشاهدات ٢ - ٥ - ٣ - ٧ - ٤
الحل : من القانون: يجب ان نجد الوسط الحسابي و مجموع تربيع كل بيانة
| 2+5+3+7+4 | = | 21 | = 4.2 |
5 | 5 |
xi2 = (2)2+(5)2+(3)2+(7)2+(4)2 = 103 مجموع مربع البيانات
∴ S2 = | ( | = | 103-(5)(4.2)2 | = 3.7 |
n-1 | 5-1 |
ثم نحسب الانحراف المعياري: الجذر التربيعي الموجب للتباين
مثال على حساب التباين للبيانات المجمعة: احسب التباين و الانحراف المعياري للتوزيع التكراري التالي/
الفئات |
| xi | x2 | xi | | تستخدم في المثال التالي | | xi - | | xi - |
3-7 | 10 | 5 | 50 | 250 | 8.67 | 86.7 | ||
8-12 | 5 | 10 | 50 | 500 | 3.67 | 18.35 | ||
13-17 | 3 | 15 | 45 | 675 | 1.33 | 3.99 | ||
18-22 | 7 | 20 | 140 | 2800 | 6.33 | 44.31 | ||
23-27 | 5 | 25 | 125 | 3125 | 11.33 | 56.65 | ||
∑ | 30 | 410 | 7350 | 210 |
الحل: نستخدم القانون لايجاد S2: يجب اولاً ان نوجد الوسط الحسابي لنعوضه في القانون/
|
| = | 410 | = 13.67 |
| 30 |
ملاحظة h لا يساوي n ٫لأن h هو عدد الفئات
S2 = | ( | = | (7350-(30)(13.67)2) | = | 60.136 |
(n-1) | 30-1 |
الانحراف المعياري هو الجذر التربيعي الموجب للتباين
حتى الان اخذنا ٣ مقاييس من مقاييس التشتت المدي - التباين - الانحراف المعياري - التي تعتبر من اهم المقاييس
٤) الانحراف المتوسط/ M.D Mean Deviation و يمكن حسابه من بيانات مفردة او من توزيع تكراري
تعريف/ الانحراف المتوسط للبيانات المفردة x1,....,xn هو
M.D= |
|
n |
ويحسب الانحراف المتوسط من توزيع تكراري كما يلي:
M.D= |
|
n |
حيث ان
يمثل مراكز الفئات xi | n مجموع التكرارات | h عدد الفئات |
| i |
مثال/ اوجد الانحراف المتوسط للبيانات التالية ٤ - ٧ - ٥ - ٣ - صفر
الحل/ نوجد الوسط الحسابي للبيانات المفردة وهو ٣.٨ ثم نعوض في القانون ( انظر الجدول التالي)
M.D= |
| = | 9.2 | = 1.84 |
n | 5 | |||
xi | | xi - | |||
4 | | 4-3.8 |=0.2 | |||
7 | | 7-3.8 |=3.2 | |||
5 | | 5-3.8 |=1.2 | |||
3 | | 3-3.8 |= 0.8 | |||
0 | | 0-3.8 |= 3.8 | |||
∑ | 9.2 |
المحاضرة العاشرة / تتمة مقاييس التشتت https://youtu.be/MuzkgMCzp1A
بعد ايجاد الانحراف المتوسط من بيانات مفردة اوجد الانحراف المتوسط من التوزيع التكراري السابق:
M.D= |
| = | 210 | = 7 |
n | 30 |
٥) معامل التغير coefficient of variation CV : يعتبر افضل مقياس يمكن ان للباحث ان يستخدمه٬ يعتمد على مقياسين داخل هذا المقياس٬ احدها مقياس النزعة المركزية وهو الوسط الحسابي و مقياس من مقاييس التشتت وهو الانحراف المعياري وهما مقياسان هامّان لذى يعطينا افضل قيمة من مقاييس الاحصاء. الوسط الحسابي يعطينا مركز البيانات و مقياس الانحراف المعياري يعطينا التشتت في البيانات عن وسطها الحسابي. كلما زادت قيمة الاس زادت قيمة معامل التغير و كلما زاد الاكس بار قلت قيمة معامل التغيير.
تعريف/ معامل التغيير لاي بيانات - مفردة او من توزيع تكراري - هو
C.V= | S | ×100% | 9.2 |
5 |
حيث ان S الانحراف المعياري و الوسط الحسابي
مثال/ لو كان لدينا الاحصائيات التالية التي تمثل مجموعتين هي مايلي: اي من المجموعتين اكبر تغيراً ؟
|
|
C.V2=8/10X100%=80% | C.V1= 4/10X100%=40% |
المجموعة الثانية اكثر تغير | |
حل لبعض مسائل النزعة المركزية و مقاييس التشتت
مثال اخر / احسب التباين ٬ الانحراف المعياري ٫ الانحراف المتوسط للتوزيع التالي:
الفئات |
| x | xf | x2 | x2f | | xi - | | xi - |
10-14 | 12 | 12 | 144 | 1728 | 10.4 | 124.8 | |
15-19 | 9 | 17 | 153 | 2601 | 5.4 | 48.6 | |
20-24 | 8 | 22 | 176 | 3872 | 0.4 | 3.2 | |
25-29 | 5 | 27 | 135 | 3645 | 4.6 | 23 | |
30-34 | 16 | 32 | 512 | 16384 | 9.6 | 153.6 | |
∑ | 50 | 1120 | 28230 | 353.2 |
التباين S2 / بعد ايجاد الوسط الحسابي من التوزيع التكراري نعوض في القانون
S2 = | ( | = | (28230-(50)(22.4)2) | = | 64.122 |
(n-1) | 50-1 |
الانحراف المعياري/ هو الجذر التربيعي الموجب للتباين ( جذر اس سكوير )
الانحراف المتوسط /
M.D= |
| = | 353.2 | = 7.064 |
n | 50 |
معامل التغير/ C.V
C.V= | S | ×100% = | 8.008 | x100% =35.75% | |
22.4 |
المحاضرة المباشرة الثانية ١٤٣٨ https://youtu.be/-iBOavQOJSc
اعمدة التوزيع التكراري
حدود الفئات | التكرارات | مراكز الفئة | الحدود الفعلية | التكرار التراكمي | التكرار النسبي | التكرار المئوي |
2-6 | 8 | 4 | 1.5-6.5 | 8 | 8/20=0.40 | 0.40x100%=40% |
7-11 | 5 | 9 | 6.5-11.5 | 13 | 5/20=0.25 | 25% |
12-16 | 3 | 14 | 11.5-16.5 | 16 | 0.15 | 15% |
17-21 | 4 | 19 | 16.5-21.5 | 20 | .20 | 20% |
total | 20 | 1 | 100% |
التكرار التراكمي هو كم بيانة اقل من الحد الفعلي الاعلى و نحتاجه لسحاب المئينات و الربيعات و العشيرات
التكرار النسبي نقسم كل تكرار فئة على مجموع التكرارات و مجموع التكرارات هو ١ صحيح دائما
مثال/ اذا اعطيت البيانات المفردة - وهي البيانات الخام غير المجمعة - ١٠ - ٦ - ٨ - ٧ - ٤
احسب الوسط الحسابي
=
الوسط الحسابي هو احد مقاييس النزعة المركزية
اوجد الوسيط و رتبة الوسيط للبيانات المفردة التالية ٦٤ - ٧٣ - ٨٠ - ٩٠ - ٨٠ - ١٠
الحل/ نرتب البيانات ثم نشطب من اليسار و اليمين حتى يتبقى بيانة تكون هي الوسيط او بيانتين و الوسيط يكون الوسط الحسابي لهما
. 10 , 64 , 73 , 80 , 80 , 90 M= = 76.5
رتبة الوسيط هي
=
لو كان عدد البيانات ٧ لكانت رتبة الوسيط هي ٣،٥ اي ٤
اوجد رتبة الوسيط للبيانات التالي ١١- ٢ - ٥ - ٣ - ١٠ - ٨ - ٧
نرتب البيانات ونشطب من اليمين و اليسار
2 , 3 , 5 , 7 , 8 , 10 , 11 M=7 رتبة الوسيط هي ٤
مثال/ اعطينا التوزيع التكراري التالي احسب الوسيط و الربيع الاول Q1
الفئات | التكرارات | الفئات الفعلية | التكرار التراكمي |
5-9 | 10 | 4.5-9.5 | 10 |
10-14 | 6 | 9.5-14.5 | 16 |
15-19 | 4 | 14.5-19.5 | 20 |
Σ | 20 |
الوسيط هو المئين ٥٠ و و لايجاده نوجد اولا رتبة المئين ٥٠ وهي ١٠
وجدنا رتبة المئين ٥٠ احدى التكرارات التراكمية و تكون قيمة المئين ٥٠ الحد الفعلي الاعلى للفئة وهو ٩.٥
الربيع الاول هو المئين ٢٥ و رتبة المئين ٢٥ هي ٥ وتكون الفئة المئينية هي الفئة التي تقابل التكرار التراكمي الذي يلي ٥ وهي 4.5-9.5 حدها الفعلي الادني هو a نعوض في القانون و الاجابة هي ٧
a=4.5 Δ=5 N1=0 = 10
مثال على مقاييس التشتت لبيانات مفردة / اذا اعطينا البيانات ١٠ - ٧ - صفر - ٢ - ٤ - ١ - ٦ - ١٠
اوجد التباين و الانحراف المعياري و معامل التغير .
١- الوسط الحسابي = ٥
٢- التباين S2 = 15.143
٣- الانحراف المعياري S = 3.89
٤- معامل التغير C.V = 77.8%
معامل التغير / نسبة تغير البيانات بنسبة ( سرعة ) ٧٧.٨٪
مثال/ احسب الانحراف المتوسط للتوزيع التالي - القانون في المحاضرة التاسعة
الفئات | التكرارات | الفئات الفعلية | التكرار التراكمي | x | x2 | x.f | | xi - | | xi - | x2 |
3-7 | 14 | 4.5-9.5 | 10 | 5 | 70 | 2 | 28 | 350 | |
8-12 | 4 | 9.5-14.5 | 16 | 10 | 40 | 3 | 12 | 400 | |
13-17 | 2 | 14.5-19.5 | 20 | 15 | 30 | 8 | 16 | 450 | |
Σ | 20 | 140 | 56 | 1200 |
يجب اولاً ايجاد الوسط الحسابي وهو ٧ و الانحراف المتوسط لهذا التوزيع هو ٢.٨
مثال/ احسب التباين S2 من الجدول التكراري السابق: الاجابة ١١.٥٧٩
الانحراف المعياري S هو الجذر التربيعي الموجب للتباين
المحاضرة الحادية عشرة https://youtu.be/ER0g58087rw
الارتباط و الانحدار
الارتباط :هو معنى في حالة وجود متغيرين او بعدين و الذين نرمز لهما بالرموز x,y . حيث x تشير الى متغير معين٬ و y تشير الى متغير اخر. هل هنالك قوة ارتباط ام لا. هل اكس تؤثر علي واي.
امثلة:
١) دراسة هل هنالك تاثير في علامة الطالب في الثانوية العامة على علامته في الجامعة.
x : متغير يشير الى علامة الطالب في الثانوية. | y : متغير يشير الى علامة الطالب في الجامعة. |
مثال: مدى تاثير الطول على الوزن وهل هنالك علاقة بينهما؟
x : متغير يمثل الطول ( المتغير المستقل) | y : متغير يمثل الوزن ( متغير تابع) |
تكون البيانات على شكل ازواج مرتبة اي (x1,y1),(x2,y2),........,(xn,yn) حيث n هي عدد الاشخاص في العينة.
لوحة الانتشار: هي عبارة عن خطين متعامدين محور x و محور y .
اول اداة هي لوح الانتشار وهي مؤشر اولي و بسيط لمعرفة اذا كان هنالك علاقة.
بزيادة إكس تزيد واي - طردي -
يقل إكس عندما تزيد واي- عكسي-
(nb. the nearer the value is to zero, the weaker the relationship). https://www.mathsisfun.com
مثال/ رسم لوح الانتشار للبيانات
x | 8 | 1 | 6 | 4 | 7 | 7 | 2 |
y | 6 | 4 | 3 | 4 | 5 | 4 | 2 |
http://www.alcula.com/calculators/statistics/scatter-plot/ | هذذه العلاقة يمكن ان تكون اي مثال مثل طول الشجرة و وزنها. و يمكن معرفة ان كانت العلاقة خطية ام لا وهل هي قوية او ضعيفة. ناخذ مستقيم بحيث يقسم البيانات. نلاحظ ان العلاقة موجبة و هذا يدفعنا الى اكمال الدراسة لوجود العلاقة. لو كانت العلاقة علي شكل مربع او دائرة فلا داعي للاستمرار في العلاقة. مثال على ارتباط خطي سالب : زيادة عدد ساعات الدراسة و نقص الدرجات. | ||||||
ارتباط خطي كامل سالب | البينات اكثر تقارب و تصنع خط مستقيم: اقوى | البيانات اقل تقارب و هذا ارتباط اضعف | لا علاقة | ارتباط خطي ضعيف b | ارتباط قوي موجب a | ارتباط موجب كامل |
اقول ان الارتباط في a اقوى من الارتباط b .
لمعرفة قوة الارتباط الخطي بين المتغير المستقل x و المتغير التابع y ٬ نستخدم احدى المعاملان التاليين:
١- معامل ارتباط بيرسون ( يتاثر بالقيم الشاذة بشكل سريع)
٢-معامل ارتباط سبيرمان للرتب ( متين لا يتاثر بالقيم الشاذة ) لانه يعتمد الرتب لا البيانات. و هذا يجعله الاقوى.
البيانات الشاذة هي التي لا تشابه مجمل البيانات.
١- معامل ارتباط بيرسون
تعريف: معامل ارتباط بيرسون للبيانات (x1,y1),(x2,y2),........,(xn,yn) هو:
r = |
|
|
حيث ان | حيث ان |
n : عدد الازواج المرتبة
مثال اوجد معامل الارتباط بيرسون بين المتغيرين x,y حيث تكون القيم كما في الجدول التالي:
x المستقل | 8 | 1 | 6 | 4 | 7 | 7 | 2 |
y التابع | 6 | 4 | 3 | 4 | 5 | 4 | 2 |
الحل/ نوجد المطلوب للتعويض في القانون
x | y | xy | x2 | y2 |
8 | 6 | 48 | 46 | 36 |
1 | 4 | 4 | 1 | 16 |
6 | 3 | 18 | 36 | 9 |
4 | 4 | 16 | 16 | 16 |
7 | 5 | 35 | 49 | 25 |
7 | 4 | 28 | 49 | 16 |
2 | 2 | 4 | 4 | 4 |
Σx = 35 | Σy = 28 | Σxy 153 | Σx2 = 219 | Σy2 = 122 |
= 5
= 4
=
= 0.62
وصف هذا الارتباط بين x,y هو ارتباط خطي موجب
تمرين من خارج الكتاب/ اوجد معامل ارتباط بيرسون للازواج المرتبة التالية : الاجابة 0.349-
(10,7),(18,8),(22,2),(3,9),(6,6),(5,3) Σxy=2782 ,Σx2=41161 , Σy2= 243 , n=6
http://www.alcula.com/calculators/statistics/correlation-coefficient/ ادخل الارقام هنا للتحقق - او استخدم اكسل
٢- معامل ارتباط سبيرمان للرتب
تعريف: معامل ارتباط سبيرمان للرتب للبيانات (x1,y1),(x2,y2),........,(xn,yn) هو
rs= 1-
حيث: n : عدد الازواج المرتبة di : الفرق بين رتب x و رتب y ب
d = رتب x - رتب y
ملاحظة : يستخدم هذا المعامل عادة في حالة ان n بين ٢٥ و ٣٠ لصعوبة الترتيب.
مثال/احسب معامل ارتباط سبيرمان للرتب بين المعدلات التالية لعشرة طلاب في الشهادةالثانوية والفصل الجامعي الاول:
معدل الطلاب في الثانوية x | 77 | 85 | 79 | 88 | 93 | 86 | 94 | 90 | 87 | 89 |
معدل الطلاب في الفصل الاول y | 61 | 72 | 65 | 71 | 80 | 74 | 82 | 81 | 76 | 78 |
الحل/ المحاضرة الثانية عشرة/ تابع الارتباط و الانحدار https://youtu.be/vV4ItgMMCDo
نعطي رتبة لكل قيمة من قيم x و y بحيث نرتب قيم x فيما بينها و قيم y فيما بينها٬ بحيث نعطي القيم الاكبر رقم ١ كرتبة و القيمة التي تليها نعطيها ترتيب ٢ و هكذا …
١٠ | ٨ | ٩ | ٥ | ٢ | ٧ | ١ | ٣ | ٦ | ٤ | |
معدل الطلاب في الثانوية x | 77 | 85 | 79 | 88 | 93 | 86 | 94 | 90 | 87 | 89 |
معدل الطلاب في الفصل الاول y | 61 | 72 | 65 | 71 | 80 | 74 | 82 | 81 | 76 | 78 |
١٠ | ٧ | ٩ | ٨ | ٣ | ٦ | ١ | ٢ | ٥ | ٤ |
x رتبة | ١٠ | ٨ | ٩ | ٥ | ٢ | ٧ | ١ | ٣ | ٦ | ٤ | |
y رتبة | ١٠ | ٧ | ٩ | ٨ | ٣ | ٦ | ١ | ٢ | ٥ | ٤ | |
d= رتبة x - رتبة y | 0 | 1 | 0 | -3 | -1 | 1 | 0 | 1 | 1 | 0 | |
di2 | 0 | 1 | 0 | 9 | 1 | 1 | 0 | 1 | 1 | 0 | Σ di214 |
rs= 1- = 1-
= 1-
= 1- 0.085 = 0.915 قوي جدا موجب
ملاحظة: في بعض البيانات تكون متساوية بحيث انه عند ترتيبها يجب ان ناخذ بعين الاعتبار ذلك.
ملاحظة: اذا كان هنالك بيانات متساوية بين قيم x او قيم y فانها تاخذ نفس الرتبة.
في حال وجود بيانات متساوية فيكون تعيين الرتب لهذه البيانات كما يلي:
١. نرتب البيانات كما لو ان ليس فيها بيانات متساوية.
٢. ناخذ الوسط الحسابي لرتب كل مجموعة من البيانات المتساوية و نعتبر هذا الوسط الحسابي رتبة كل بيان في هذه المجموعة.
مثال عين الرتب للبيانات التالية/ لاحظ انه يوجد بعض قيم البيانات المكررة
٦ | ٢.٥ | ١ | ٦ | ٢.٥ | ٦ | ٨.٥ | ١٠ | ٨.٥ | ١١ | ٤ | الرتب ٢ |
٧ | ٢ | ١ | ٦ | ٣ | ٥ | ٨ | ١٠ | ٩ | ١١ | ٤ | الرتب ١ |
63 | 70 | 79 | 63 | 70 | 63 | 57 | 53 | 57 | 45 | 65 | البيانات |
رتبة 70
رتبة 63
رتبة 57
خصائص معامل الارتباط r
١) اذا كانت قيمة معامل الارتباط r=1 فإننا نصف الارتباط بين x,y بانه ارتباط خطي موجب كامل.
٢) اذا كانت r=-1 كان الارتباط ارتباط خطي سالب كامل.
معنى موجب اي كلما زادت قيمة x زادت قيمة y . ( طردي )
معنى سالب اي كلما زادت قيمة x نقصت قيمة y . اي العلاقة عكسية.
نصف قوة الارتباط عندما كما يلي:
r | الوصف |
قوي جدا موجب قوي جدا سالب | |
قوي موجب قوي سالب | |
ضعيف موجب ضعيف سالب | |
لا يوجد ارتباط |
امثلة: صف قوة الارتباط بناءاً على قيم r التالية:
r | الوصف |
r = 0.45 | ضعيف موجب او ضعيف طردي |
r = -0.82 | ارتباط قوي سالب (عكسي) |
r = -0.20 | ضعيف سالب |
r = -0.923 | قوي جدا سالب |
r = 0.002 | ضعيف جدا موجب |
r = -0.71 | قوي سالب |
r = 0.55 | قوي موجب |
مثال / ارجع الى مثال رسم لوح الانتشار للبيانات ثم اوجد معامل ارتباط بيرسون و معامل سبيرمان للرتب.
الحل / بيرسون = 0.5757 سبيرمان = 0.651407
تمرين/ يعطي الجدول التالي علامات ١٢ طالباً في الامتحان الاول x و الامتحان الثاني y
x | 18 | 14 | 10 | 15 | 7 | 12 | 15 | 8 | 15 | 17 | 8 | 8 |
y | 20 | 11 | 14 | 16 | 10 | 10 | 17 | 14 | 12 | 11 | 10 | 11 |
احسب معامل ارتباط بيرسون ومعامل ارتباط سبيرمان للرتب للجدول السابق. ثم صف قوة الارتباط بين x,y بناء على قيمة r .
المحاضرة الثالثة عشرة https://youtu.be/SJ--dB7VBuA
تابع: الارتباط و الانحدار
بدأنا بالتعامل مع البيانات ذات البعدين٬ x ، y ، في بداية هذه الوحدة. نجد قوة الارتباط بينها٬ ( -١ ٫ ٠ ٫ ١ ) مثل تاثير الطول على الوزن. او علامة الطالب في الثانوية و علاقتها بعلامته في الجامعة. علاقة علامة الطالب في مادة الرياضيات بعلامته في مادة الاحصاء. في الارتباط نتحدث دائما عن بعدين و مهمتنا ان نجد قوة الارتباط بين هاتين الصفتين او ما بين البعدين. اخذنا طريقتين و الاولى هي لوح الانتشار حيث نرسم البيانات على المحاور الديكارتية و ننشر النقاط ونلاحظ كيفية انتشار هذه البيانات هل تنتشر بشكل خطي ام لا. هل تنتشر بشكل خطي باتجاه اليمين او اليسار. و هذا الارتباط نصفه بالخطية. قلنا لا تكفي لوحة الانتشار فلابد من استخدام معاملات لتقيس قوة الارتباط و اخذنا امثلة ( معامل سبيرمان - معامل بيرسون). قلنا ان هنالك ارتباط خطي ما بين x , y . و تاثير x على y حيث x مستقل و الاخر y تابع. هذه العلاقة خطية. سنحل المثال السابق بالاضافة لما اخذناه اليوم.
معادلة خط الانحدار
من خلال لوحة الانتشار نلاحظ ان هنالك انتشار خطي للنقاط٬ لذلك اذا فرضنا ان هنالك علاقة خطية بين المتغيرين x و y ٫ دائما اكس مستقل و واي تابع ٬ فاننا نعبر عن هذه العلاقة بالدالة التالية
حيث e الخطأ التقديري | y=A+Bx+e |
المطلوب منا ان نقدر هذه الدالة اذا عطينا البيانات x و y . المطلوب هو تقدير A , B لذلك سوف نقدر A بـ a و نقدر B بـ b فتكون معادلة خط الانحدار y على x هي ŷ= a +bx
يكون بين ايدينا بيانات من عينة معينة٫ نستطيع ان نقدر هذه المعادلة من عينة. ثم نستخدم هذه العلاقة لنعممها على مستوى المجتمع مع توقع الخطأ. حيث ان a , b كالتالي :
b= وهو ميل المستقيم
a= هو حيث يقطع المستقيم المحور الصادي
حيث ان هي الوسط الحسابي لبيانات المتغير x وحيث ان
هو الوسط الحسابي لبيانات المتغير y
b : ميل المستقيم . مع محور السينات a : النقطة التي يقطع فيها المستقيم محور الصادات.
الناتج معادلة خطية فيها a,b مقادير ثابتة . اما y , x فتبقى متغيرات.
هذه الاشارة ^ ( الهات ) التي فوق y تعني في الاحصاء التقدير. نستخدم هذه المعادلة للتقدير في المستقبل. و نشير بعلامة الهات الى ذلك. مثال / طالب انهى الثانوية العامة ( و كان لدينا مسبقا بيانات علامات ١٠٠ طالب انهوا الثانوية و الجامعة ) فمن خلال علامات الطالب في الثانوية x و علامات الطالب في الجامعة y . نستطيع بناء هذه المعادلة. كونها خطية اي اتجاهها واضح. يمكن التنبؤ بها. فيمكن التنبؤ بعلامات الطالب الجديد الذي انهى الثانوية٬ يمكن - تقدير علامته في الجامعة - بسبب ان قيم ŷ تقديرية لذلك لابد من وجود الخطأ e فنحسب(مقدار الخطأ) كما يلي:
e = y - ŷ
نضع العلامة y ( من جدول المشاهدات السابقة ) مكان y و ينتج لنا ( الخطأ التقديري) .
مثال/ اوجد معادلة خط الانحدار y على x للبيانات في الجدول التالي. ثم قدر قيمة y عندما تكون x=9 ثم اوجد قيمة الخطأ في التقدير عندما x=9 . الحل / نستخدم قيم x ، y في بناء معادلة خط الانحدار التقديرية.
x | y | xy | x2 | |
4 | 2 | 8 | 16 | |
10 | 6 | 60 | 100 | |
9 | 8 | 72 | 81 | |
12 | 11 | 132 | 144 | |
8 | 5 | 40 | 64 | |
5 | 4 | 20 | 25 | |
48 | 36 | 332 | 430 |
المطلوب ايجاد معادلة خط الانحدار ŷ= a +bx ( نقدرها )
نجد b ثم a
b= a=
نوجد الوسط الحسابي لـ x = ٨ ٬ نوجد الوسط الحسابي لـ y = ٦
نوجد xy و نوجد x2
b= = 0.96 a = 6 - 0.96 (8)= -1.68
معادلة خط الانحدار y على x هي ŷ= a +bx بالتعويض
ŷ = -1.68 +.96 x
لتقدير قيمة y عندما x=9 نعوض عوضاً عن x بـ ٩
ŷ = -1.68 +.96 ( 9 ) = 6.96
لإيجاد الخطأ التقديري عندما x=9
e = y - ŷ e = y - 6.96
اين قيمة y ؟ الإجابة من الجدول هي القيمة المقابلة للاكس تساوي ٩ وهي ثمانية.
e = ( 8 ) - 6.96 = 1.04
تم تقدير قيمة y بـ ٦.٩٦ و القيمة المقابلة من الجدول = ٨ و الخطأ التقديري = ١.٠٤
الدالة الخطية تمثل الخط المستقيم.
----- انتهت معادلة الانحدار -------
في هذه الوحدة / اولا معاملات الارتباط و حساب قوة الارتباط. ثانياً معادلة خط الانحدار و هي المعادلة التي نتوقعها من الانتشار الخطي ان هذه البيانات تحاول الانتشار انتشار خطي ٫ فتوقعنا ان المعادلة خطية فقدرنا المعادلة الخطية و تعلمنا ايجاد اي و بي و نعوضهم في المعادلة ٬ فنحصل على المعادلة التقديرية او معادلة خط انحدار y على اكس اي التابع على المستقل. و تعلمنا استخدامها للتنبؤ بقيم اكس او قيم واي. تعلمنا ان نجد الخطأ في التقدير.
نحل السؤال السابق.
d2= 113.5 r=0.603 وصف الارتباط: ارتباط قوي موجب (طردي) موجب
علاقات موجبة www.udacity.com : Intro. to Stat. | علاقات سالبة |
موقع حساب معادلة خط الانحدار/ http://www.graphpad.com/quickcalcs/linear1
حساب معامل بيرسون http://www.alcula.com/calculators/statistics/correlation-coefficient/
حساب معامل سبيرمان للرتب http://www.socscistatistics.com/tests/spearman/Default.aspx
لاحظ الشكل/ الميل الموجب = نصف٬ و الميل السالب = سالب واحد
٥ حيث يقطع المستقيم المحور الصادي ٬ ٢ كذلك
من المحاضرة السابقة /
ŷ= a +bx
معادلة خط الانحدار y على x . او تسمى y المقدرة. مثل التنبؤ بعلامة الطالب في الجامعة y بمعرفة علامته في الثانوية x. الفرق بين العلامة y المقدرة و قيمة y هو الخطأ e=y-ŷ
ناخذ من الجدول قيمة y المقابلة لـ x . و نحسب مقدار الخطأ في التقدير .
المحاضرة الرابعة عشرة https://youtu.be/LY_c5lThOvA
الارقام القياسية index number
- مهمة لتخصصات المالية و المحاسبة -
الرقم القياسي هو عبارة عن عدد او نسبة تعطينا مقدار التغير في سعر او كمية سلعة ما بين زمنين. الاول منهم زمن الاساس و الثاني زمن المقارنة. الزمن: السنة.
يجب ان تكون بين عام و اخرى. سوف نركز في هذه الوحدة على السعر٫ ولن نركز على الكميات. يجب ان نحدد عام اساس و عام مقارنة. لناخذ مثال بسيط.
كان سعر كيلو السكر عام ١٩٩٩ ٢ ريال و اصبح عام ٢٠١٢ ٤ ريال. اوجد مقدار التغير في سعر السكر اذا علمت ان ١٩٩٩ هي عام الاساس.
نجد الرقم القياسي لسعر السكر= | سعر كيلو السكر في عام المقارنة | = | ٤ | = ٢ * ١٠٠٪ = ٢٠٠٪ |
سعر كيلو السكر عام الاساس | ٢ |
نضرب الرقم في ١٠٠٪ ونرى ان التغير تضاعفت لسعر ٤ اي مائة بالمائة.
مثال من خارج الكتاب/ انظر الجدول ثم اجب عن السؤال z0sbbd4-gmU
Year | price | index | ||
Year1 (base) | 20% زيادة | 10 | 25% زيادة | 100 |
Year2 | 12 | 120 | ||
Year3 | 15 | 150 |
ما مقدار الرقم القياسي للتغير بين العام الثاني و العام الثالث؟ باعتبار ان العام الثاني عام الاساس
نسبة الزيادة/النقص | 15 - 12 | = 25% | ||
12 | ||||
الرقم القياسي | 15 | X 100 = 125 | ||
12 |
لدينا طريقتين لحساب الرقم القياسي وهي الطريقة البسيطة الرقم القياسي البسيط و الطريقة الثانية الرقم القياسي المرجح.
انواع الارقام القياسية/ | |
١ الارقام القياسية البسيطة | ٢/ الارقام القياسية المرجحة |
اولاً البسيطة / وهي نوعان /
١ الرقم القياسي التجميعي البسيط ونرمز له Ip(a)2 | I تشير الى index | a تشير الى aggregate | p تشير الى price |
٢ الرقم القياسي النسبي البسيط Ip(r)2 | I تشير الى index | r تشير الى relative | p تشير الى price |
Ip(a)= | ∑ Pn | X | 100% | حيث Pn سعر السلعة في عام المقارنة |
∑ Pо | Pо سعر السلعة في عام الاساس | |||
Ip(r)= | 1 | ∑ | Pn | X 100% m= عدد السلع |
m | Pо |
السلعة | السعر في سنة الاساس Pо | السعر في سنة المقارنة Pn |
أ | Pо 1 | Pn 1 |
ب | Pо 2 | Pn 2 |
m | Pо m | Pn m |
مثال / كانت الاسعار( بالفلس/ كم) لبعض المواد االاستهلاكية كما في الجدول التالي/
السلعة | السعر في عام ١٩٩٢ Pо | السعر في عام ١٩٩٩ Pn |
السكر | ٢٠٠ | ٣٠٠ |
الارز | ٢٤٠ | ٤٠٠ |
الشاي | ١٥٠٠ | ١٨٠٠ |
القهوة | ٢٢٠٠ | ٤٥٠٠ |
Σ | 4140 | 7000 |
احسب/ ١ - الرقم القياسي التجميعي البسيط للاسعار باعتبار عام ١٩٩٢ عام الاساس ٫ احسب/ ٢ - الرقم القياسي النسبي للاسعار باعتبار عام ١٩٩٢ عام الاساس. الحل : الرقم القياسي التجميعي البسيط
Ip(a)= | ∑ Pn | X 100% = | 7000 | X 100% = 169.1% |
∑ Pо | 4140 |
الحل : الرقم القياسي النسبي للاسعار
Ip(r)= | 1 | ( | 300 | + | 400 | + | 1800 | + | 4500 | ) x 100% = 160.3% | ||
4 | 200 | 240 | 1500 | 2200 | ||||||||
اذا الرقم القياسي البسيط نوعان/ تجميعي و نسبي.
ثانياً / الارقام المرجحة القياسية للاسعار / سوف ننظر الى الاستهلاك. في البسيط ساوينا السلع مثل السيارات و التلفزيون مع التموينات. السعر يجب ان ياخذ بعين الاعتبار الكمية المستهلكة. هنالك ٣ اشخاص تحدثوا عن اعتبار الاستهلاك. الاول/ لاسبير. الثاني/باش. الثالث/ فيشر. كلاً منهم له وجهة نظر و كلاً له رقمين قياسين ( تجميعي و بسيط)
و هنا ناخذ بعين الاعتبار الكمية المستهلكة٬ و هنالك ثلاث طرق لحساب الرقم القياسي المرجح وهي :
١) رقم لاسبير القياسي
أ) رقم لاسبير القياسي التجميعي للاسعار/ كل رقم قياسي نضربه في ١٠٠٪
Ip(aL)= | ∑ Pn Qо | X 100% = | ||
∑ Pо Qо |
لاسبير اعتمد الكمية المستهلكة في سنة الاساس Qо ( الكمية في سنة صفر)
ب) رقم لاسبير القياسي النسبي للاسعار rL / - قياسي - تجميعي - كل رقم قياسي نضربه في ١٠٠٪
Ip(rL)= ∑ | Pn | Wо X 100% | Wо= | PоQо | حيث | |
Pо | ∑ Pо Qо |
مثال/ يبين الجدول التالي اسعار عدد من السلع (فلس/كغ) و كميات الاستهلاك بالكيلوغرام للعائلة الواحدة شهريا:
السلعة | السعر عام ١٩٩٣ Pо | كمية الاستهلاك ١٩٩٣ Qо | السعر عام ١٩٩٩ Pn | كمية الاستهلاك ١٩٩٩ Qn |
السكر | 220 | 7 | 350 | 8 |
الارز | 280 | 10 | 430 | 12 |
الشاي | 1700 | 1.5 | 3000 | 1.5 |
اللحم | 2800 | 5.5 | 4000 | 6.5 |
١- احسب رقم لاسبير القياسي التجميعي لاسعار ١٩٩٩ باعتبار ١٩٩٣ عام الاساس. ٢- احسب رقم لاسبير القياسي النسبي لاسعار ١٩٩٩ باعتبار ١٩٩٣ عام الاساس.
المحاضرة الخامسة عشرة
سوف يكون تركيزنا على الاعمدة الثلاثة الاولى ( نضيف اعمدة لحساب المطلوب حسب القانون)
Wо | PоQо | PnQо | السلعة |
0.069=1540/22290 | 1540 | 245 | السكر |
0.126=2800/22290 | 2800 | 4300 | الارز |
0.1144=2550/22290 | 2550 | 4500 | الشاي |
0.691=14500/22290 | 15400 | 22000 | اللحم |
22290 | 33250 | ∑ |
المطلوب الاول/ بقسمة PnQо على PоQо يكون الناتج ١.٤٩ نضرب في ١٠٠٪ و يكون الحل ١٤٩٪ وهذا يعني ان اسعار السلع زادت ٤٩٪
المطلوب الثاني/
Ip(rL)= ∑ | Pn | Wо X 100% | Wо= | PоQо | حيث | |
Pо | ∑ Pо Qо |
=(350/220)*0.069+(430/280)*0.126+(3000/1700)*0.1144+(4000/2800)*0.961=
1.492x100% = 149.2%
هنالك فرق بين لاسبير و باش فباش اعتمد الكمية المستهلكة في عام المقارنة.
٢) رقم باش القياسي
أ) رقم باش القياسي التجميعي للاسعار هو
Ip(aB)= | ∑ Pn Qn | X 100% = | حيث ان Qn الكمية المستهلكة في عام المقارنة | |
∑ Pо Qn |
ملاحظة: باش اعتمد الكميات المستهلكة في عام المقارنة. Qn
ب) رقم باش القياسي النسبي للاسعار هو
Ip(rB)= | Pni | Wni) X 100% | Wn= | PnQn | حيث | |
Pоi | ∑ Pn Qn |
ناخذ الجدول في المثال السابق/ من الجدول السابق احسب مايلي/ رقم باش التجميعي القياسي على اعتبار ان عام ١٩٩٣ هي عام الاساس. احسب رقم باش النسبي باعتبار ان ١٩٩٣ عام الاساس.
Ip(aB)= | ∑ Pn Qn | X 100% = | 38460 | X100% = 148.67% |
∑ Pо Qn | 25870 |
الاختلاف البسيط في النتائج لا بد منه.
Ip(rB)= | Pni | Wni X 100% | Wn= | PnQn | حيث | |
Pоi | ∑ Pn Qn |
=(350/220)(0.073) + (430/280)(0.143) + (3000/1700)(0.177) + (4000/2800)(0.676) = 1.4941 X 100% = 149.41%
Wn | PnQn | |
2800/38640=0.073 | 2800 | |
5160/38640=0.134 | 5160 | |
4500/38640=0.117 | 4500 | |
26000/38640=0.676 | 26000 | |
38460 |
٣) رقم فيشر القياسي
أ- رقم فيشر القياسي التجميعي الامثل للاسعار هو ( جمع بين فيشر و لاسبير فسمي الامثل )
Ip(aF)=X100%
ب- رقم فيشر القياسي النسبي الامثل هو
Ip(rF)=X100%
مثال/ من المثالين السابقين اوجد ١- رقم فيشر التجميعي القياسي الامثل لاسعار ١٩٩٩ على اعتبار ان ١٩٩٣ عام الاساس. ٢- رقم فيشر النسبي القياسي الامثل على اعتبار ان ١٩٩٣ عام الاساس.
Ip(aF)=X100% Ip(aF)=
X100% = 148.8%
Ip(rF)=X100% Ip(rF)=
X100% = 149.3%
انتهى.
الرقم القياسي البسيط / تجميعي و نسبي
الرقم القياسي المرجح / لاسبير (تجميعي - نسبي ) باش (تجميعي - نسبي ) فيشر ( الامثل ) (تجميعي - نسبي )
المحاضرة السادسة عشرة https://youtu.be/kb-7kbJdja4
السلاسل الزمنية
هنالك مادة اسمها (السلاسل الزمنية) ولكن هنا سنتعرف على السلاسل الزمنية في مبادئ الاحصاء
التعريف/ عبارة عن بيانات او مشاهدات مرتبطة بزمن ما قد يكون سنوات او اشهر او ساعات الخ من انواع الزمن.
في ازواج مرتبة / الزوج الاول يشير دائما الي الزمن و الزوج الثاني هو المشاهدة . ما يهمنا هو الزوج الثاني.
امثلة/
كمية الامطار التي سقطت على بلد ما في عشر سنوات | درجة حرارة مريض خلال ٢٤ ساعة |
1990 200 ml 2000 250ml 2001 2002 2003 | 1 40 2 41 3 39 4 39.5 5 38 6 37.5 . . . . . . 24 37 |
عدد البواخر التي ترسوا في الميناء لمدة ٢٠ عام . كل مشاهدة مرتبطة بزمن |
السلاسل الزمنية تتاثر بمؤثرات كثيرة تؤثر في قيمتها. و تسمى هذه المؤثرات بالمركبات لهذه السلسلة.
هنالك عدة نماذج تمثل السلاسل الزمنية. بحيث تظهر فيها هذه المركبات. ومن النماذج/
Y= T x S x C x I y= تمثل المشاهدات
وهذه المركبات هي:
١) مركبة الاتجاه و رمزها T ٢) المركبة الفصلية S ٣) مركبة الدورات C ٤) المركبة غير المنتظمة I |
فكل سلسلة زمنية نستطيع ان نستخلص منها هذه المركبات الاربع٬ وكل مركبة من هذه المركبات لها طريقتها الخاصة في الاستخراج.
بعض الاحصائيين عبر عن السلاسل الزمنية بالنموذج التالي:
Y= T + S + C + I
يمكن ان نستقرأ من خلال هذه السلاسل المستقبل.
سوف نأخذ مثال واحد عن هذه المركبات وهي مركبة الاتجاه و لقد مرت علينا سابقا ولكننا لم نسمها.
مركبة الاتجاه: ( الزمن و المشاهدات)
عبارة عن الاتجاه التي تنحو نحوه السلسلة الزمنية .
اولاِ الرسم: مثال / لدينا البيانات التالية - العام و الانتاج (هذه مشاهدات ولكنها مرتبطة بزمن)
3- | 2- | 1- | 0 | 1 | 2 | 3 | |
0 | 1 | 2 | 3 | 4 | 5 | 6 | |
العام | ١٩٨٨ | ١٩٨٩ | ١٩٩٠ | ١٩٩١ | ١٩٩٢ | ١٩٩٣ | ١٩٩٤ |
الانتاج | ٢٠ | ٣٠ | ٣٢ | ٢٣ | ٣٤ | ٣٩ | ٣٢ |
نعطي الزمن ارقام و نضع له مركز اما يكون اول زمن و نعطيه الرقم صفر٫ او اذا اكانت المشاهدة عام ١٩٩١ ( الزمن المتوسط ) هي المركز٫ تاخذ القيم علي يمينها ارقام سالبة و التي علي يسارها ارقام موجبة. ولا تاثير لترقيم المركز ففي النهاية يعطينا نفس الاتجاه. الاتجاه يعطينا الميل ( ميل المستقيم مع المحور السيني الموجب) . في كلا الحالين لا تاثير للمركز على الاتجاه.
معلومة مهمة: في اي سلسلة زمنية اذا اردنا ان نحلل و نقدر مركبة الاتجاه من هذه السلسلة الزمنية علينا ان نحدد مركز هذه السلسلة واما يكون اول زمن او الزمن المتوسط. الرسم بخط مضلع.
يمكن وضع شرطتين على المحور للتعبير عن ان البعد غير حقيقي
المحاضرة السابعة عشرة https://youtu.be/3vS65oa0nds نقدر الان مركبة الاتجاه للتنبؤ بالانتاج لسنوات تالية و قد نتنبأ بسنوات سابقة. تقدير مركبة الاتجاه باستخدام طريقة المربعات الصغرى. مركبة الاتجاه هي نفسها معادلة خط الانحدار. x=t=time مركبة الاتجاه هي T= ŷ= a +bx حيث ان ميل المستقيم مع محور السينات الموجب b= حيث اكس تمثل الزمن ( العام ) a= كون اننا نتعامل مع سلسلة زمنية والتي رمزنا لها بالمشاهدات y وهي تقابل زمن رمزنا له بالرمز x . لذلك لابد لتقدير مركبة الاتجاه ان يكون هنالك نقطة اصل او بداية تسمى مركز السلسة الزمنية وهذا المركز ياخذ القيمة كما يلي x=0 . و بعدها نبدا باضافة ١ الي يسار x او ١- اذا اتجهنا الي اليمين من الصفر كما يلي يقل الزمن <--- الزمن ---> يزداد الزمن
مثال: لدينا البيانات التالية: العام | ٨٨ | ٨٩ | ٩٠ | ٩١ | ٩٢ | ٩٣ | ٩٤ الانتاج | ٢٠ | ٣٠ | ٣٢ | ٢٣ | ٣٤ | ٣٩ | ٣٢ قدّر مركبة الاتجاه لهذه البيانات ( السلسلة)٫ كم تقدّر انتاج ١٩٩٥ ٬ ١٩٩٨ . الحل: اكس يمثل متغير الزمن | الانتاج y=xt | T time | العام x | |||||
٢٠ | 0 | ٨٨ المركز | ||||||
٣٠ | 1 | ٨٩ | ||||||
٣٢ | 2 | ٩٠ | ||||||
٢٣ | 3 | ٩١ | ||||||
٣٤ | 4 | ٩٢ | ||||||
٣٩ | 5 | ٩٣ | ||||||
٣٢ | 6 | ٩٤ | ||||||
b = [686-7(3)(30)] / 91-7(3)2= 2 a =30-2(3)= 24 | ||||||||
تقدير مركبة الاتجاه T= ŷ= 24 + 2x
تقدير انتاج عام ١٩٩٥ x=7 ( حسب الجدول السابق) نعوض في معادلة واي هات و الناتج يساوي ٣٨
ŷ= 24 +2(7)
T= ŷ= 24 + 2(7)
تقدير انتاج عام ١٩٩٨ x=10
نعوض في معادلة واي هات و الناتج يساوي ٤٤
T= ŷ= 24 + 2(10)
من السلسلة الزمنية استخرجنا مركبة اتجاه للتنبؤ بالمستقبل.
نستطيع ان نمثل مركبة الاتجاه - ناخذ اي قيمتين لاكس و نجد ما يقابلهما قيمة لواي
المطلوب/ مثل مركبة الاتجاه (T)
x=2 ⇒ T= ŷ= 24 + 2(2) = 28
x=5 ⇒ T= ŷ= 24 + 2(5) = 34
النقطتان اللاتي حصلنا عليهما (2,28) و (5,34) بعد توصيلهما بخط مستقيم مثلنا مركبة الاتجاه
تقدير عام ١٩٨٦ اي اكس تساوي سالب اثنين هو عشرون طن.
من مركبة الاتجاه الرقم ٢٤ يمثل تقاطع الخط المستقيم مع محور السينات٫ و ٢ يمثل ميل المستقيم
مركبة الاتجاه دائما تتعامل مع السنوات و تكون قليلة ( هنالك الدورية و الفصلية و فيها تفاصل اكثر )
المحاضرة الثامنة عشرة https://youtu.be/I78JWcBYbVg
مركبة التذبذب : تعطينا البعد ما بين السلسلة الزمنية الاصلية و سلسلة المعدلات المتحركة
مركبة التذبذب = السلسلة الزمنية - المعدلات المتحركة المقابلة للسلسلة الزمنية ( وليس العكس)
المعدلات المتحركة لسلسة ما: هنالك طريقتان لحساب مركبة التذبذب و ذلك يعتمد على طول المعدلات المتحركة حيث تكون اطوالها كما يلي :
١- فرديا ٢- زوجيا
المعدلات المتحركة تفيدنا بتقليل خشونة السلسلة الزمنية . بحيث نستطيع ان نستخدمها بدلا من السلسلة الاصلية. تستخدم المعدلات المتحركة بتقدير مركبة التذبذب
١) حساب المعدلات المتحركة بطول فردي
مثال/ اوجد سلسلة المعدلات المتحركة للسلسلة الزمنية التالية اذا كان طول المعدلات التالية المتحركة ٣ .
السلسلة هي
2 5 3 4 8 6
المعدلات المتحركة بطول ٣ نحسبها كما يلي
(2+5+3)/3 = 10/3 = 3.33
(5+3+4)/3 = 12/3 = 4
(3+4+8)/3 = 15/3 = 5
(4+8+6)/3 = 18/3 = 6
اذا سلسلة المعدلات المتحركة بطول ٣ هي
3.33 , 4, 5 ,6
اوجد مركبة التذبذب عندما يكون طول المعدلات المتحركة ٣ . الوسط الحسابي لكل ٣ بيانات
2 5 3 4 8 6
3.33 4 5 6 سلسلة المعدلات المتحركة
بالطرح
1.67 -1 -1 2 مركبة التذبذب
مركبة التذبذب تعطينا التذبذب بين السلسلة الزمنية الاصلية و سلسلة المعدلات المتحركة وهذا خفف تذبذب السلسلة الزمنية. يجب تحديد طول المعدلات المتحركة قبل حساب التذبذب. في مثالنا كل بيانات. ناخذ ٣ بيانات ثم ننتقل خطوة. يمكن استخدام مركبة التذبذب عوضا عن السلسلة الاصلية لتحليل السلسلة الزمنية.
مركبة التذبذب: نستخدم المعدلات المتحركة لتقدير مركبة التذبذب.
مثال / اذا كانت السلسلة الزمنية كما يلي/
العام x | ٨٨ | ٨٩ | ٩٠ | ٩١ | ٩٢ | ٩٣ | ٩٤ | ||||
المشاهدة y | ١٥ | ١٢ | ٩ | ١٨ | ١٥ | ٢٤ | ٢٧ | ||||
اوجد ما يلي / مركبة التذبذب عندما يكون طول المعدلات المتحركة فرديا و عندما يكون زوجيا.
- عندما يكون طول المعدلات المتحركة ٣
27 24 15 18 9 12 15 السلسلة الزمنية
- 22 19 14 13 12 - المعدلات المتحركة بطول ٣
- 2 -4 4 -4 0 - مركبة التذبذب = السلسلة الزمنية - المعدلات المتحركة
ناخذ كل ٣ بيانات و نحسب الوسط الحسابي لهم لايجاد المعدلات المتحركة بطول ٣ مثال
(27+24+15)/3 = 22
- عندما يكون طول المعدلات المتحركة ٤ ( كل اربعة بيانات لها معدل متحرك و نكتبه في الوسط اسفل منها)
27 24 15 18 9 12 15
21 16.5 13.5 13.5 المعدلات المتحركة 18.75 15 13.5 المعدلات المتحركة المركزية
-3.75 3 -4.5 مركبة التذبذب
ناخد كل ٤ بيانات و نحسب الوسط الحسابي لهم لحساب المعدلات المتحركة
من قانون مركبة التذبذب نطرح السلسلة الزمنية من المعدلات المتحركة ولكنها لا توجد هنا لكل بيانة من السلسلة ٬ لذا نوجد معدل متحرك للمعدلات المتحركة ويعطينا المعدلات المتحركة المركزية وتكون دائما بطول ٢.
لحساب المعدلات المتحركة المركزية مثال
(21+16.5)/2= 18.75
نطرح السلسلة الزمنية من المعدلات المتحركة ( المركزية) لنحصل على مركبة التذبذب.
المباشرة الثالثة https://youtu.be/8m78_10JvG0
مراجعة
س/ اوجد معامل ارتباط بيرسون:
x | 10 | 5 | 9 | 10 | 5 | 7 | 5 |
y | 15 | 14 | 11 | 13 | 9 | 16 | 20 |
Σxy= 706 x2=405 y2=1448 r= -0.16 قوة الارتباط ضعيف ضعيف عكسي او سالب
قلنا سابقا عكسي يعني عندما يزيد اكس يقل واي. يمكن استخدام لوح الانتشار لمعرفة اذا كانت العلاقة خطية.
س/ اوجد معامل سبيرمان للرتب:
x | 10 | 5 | 9 | 10 | 5 | 7 | 5 |
y | 15 | 14 | 11 | 13 | 9 | 16 | 20 |
d2=57.5 n=7 r =-0.03 ارتباط ضعيف عكسي
معامل مهم مثل سبيرمان لايمكن ان يرتب ١٠ و ١٠ بترتيب مختلف فناخذ الوسط الحسابي للرتب الاولية
اذا لم يكن هنالك قيم شاذة عادة تكون قيمة معامل بيرسون و معامل سبيرمان متقاربة.
س/ اذا اعطينا السلسلة الزمنية التالية احسب مركبة التذبذب بطول ٣
7 | 9 | 5 | 2 | 1 | 3 |
تذكير بالقانون /مركبة التذبذب= السلسة الزمنية - المعدلات المتحركة الجواب: 1- 0.067- 0.33 2
انتهت المحاضرة المباشرة الثالثة و الاخيرة.
تمارين
سؤال من خارج الكتاب/ اوجد المجهول
المساحة | 1400 ft2 | 1500 ft2 | 1600 ft2 | 1700 ft2 | 1800 ft2 |
السعر | $112000 | $X | $128000 | $126000 | $144000 |
udacity.com | Q1 | Q2 | Q3 |
س: في الاحصاء الاستقرائي ( الاستدلالي ) عملية اتخاذ القرار تكون على شكل
- تنبؤ - تقدير - رفض او قبول الفرضية - جميع ما ذكر
س: اذا اردنا ان نقوم بدراسة عنوانها " مدى جودة الطعام الذي يقدمه مطعم الجامعة " فان العينة المناسبة لهذه الدراسة هي: - العشوائية البسيطة - المنتظمة - العنقودية - المعيارية
س: قيمة الانحراف المعياري في التوزيع التكراري
حدود الفئات | 3-7 | 8-12 | 13-17 | المجموع | |
التكرار | 5 | 8 | 7 | 20 | |
a.2.94 | b.3.94 | c.5.573 | d.2.5432 |
س: اذا كان الحد الادني لفئة ما يساوي ٢٠ و الحد الاعلى لنفس الفئة يساوي ٢٥ فان طول الفئة هو
a.4 | b.5 | c.6 | d.7 |
الاختبار النصفي ١٤٣٨
السؤال 1/ التكرار التراكمي للفئة الثالثة في التوزيع التالي هو
الفئات | 5-9 | 10-14 | 15-19 | 20-24 | المجموع |
التكرار | 2 | 5 | 8 | 10 | 25 |
a.17 | b.15 | c.8 | d.19 |
السؤال 2/ احد المقاييس الاحصائية التالية من مقاييس النزعة المركزية وهو
A.معامل التغير | b.الوسط المرجح | c.المدى | d.الانحراف المتوسط |
السؤال 3/ المقياس الذي يحسب من اخذ الجذر التربيعي الموجب للتباين هو
A.الانحراف المعياري | b.الوسط الحسابي | c.المنوال | d.الانحراف المتوسط |
السؤال 4/ قيمة الربيع الثالث ( Q3 ) لهذا التوزيع هي
الفئات | 5-9 | 10-14 | 15-19 | المجموع | |
التكرار | 7 | 3 | 10 | 20 | |
a.7.5 | b.17 | c.13.5 | d.17.5 |
السؤال 5/ اذا كان لدينا مجموعتين من العلامات لشعبتين في مباديء الاحصاء فاذا كان الوسط الحسابي للمجموعة الاولى هو 15 وعددها 30 وكان الوسط الحسابي للمجموعة الثانية هو 10 وعددها 20.فاذا دمجنا المجموعتين معا فان قيمة الوسط الحسابي بعد الدمج ( الوسط المرجح) يساوي
A.10 | b.15 | c.14 | d.13 |
السؤال 6/ الوسط الحسابي للبيانات التالية 67 , 40، 2 ، 50 ، 13 ،8 ، 30
A.25 | b.35 | c.30 | d.20 |
السؤال 7/ من طرق عرض البيانات المفردة
A.المدرج التكراري | B.المضلع التكراري | C.الخط المنحني | D.المنحنى التكراري |
السؤال 8/ الوسط الحسابي لهذا التوزيع يساوي تقريبا
مركز الفئة | 5 | 11 | 17 | 23 | المجموع |
التكرار | 10 | 4 | 8 | 8 | 30 |
a.12.67 | b.6.3 | c.13.8 | d.11.8 |
السؤال 9/ اذا كان الوسط الحسابي لدرجات عدد من الطلاب هو 100 وتباينها 64 فان معامل التغير CV يساوي
A.20% | b.8% | c.10% | d.30% |
السؤال 10/ حسب البيانات التالية يكون مدى البيانات يساوي( 70، 40،6 ، 50 ، 13 ،8 ، 30)
A.6 | b.64 | c.67 | d.56 |
الحل / المدى = أكبر مشاهدة – أصغر مشاهدة 70 - 6 = 64
السؤال 11 / مجموعة جزئية من مجتمع الدراسة يتم اختيارها بحيث تكون ممثلة للمجتمع تمثيل صحيح هي
A.المجتمع | b.العينة | C.تحليل النتائج و اتخاذ القرار المناسب | D.الاحصاء الوصفي |
السؤال 12/ قسم الاحصاء المسؤول اتخاذ القرار في اي دراسة هو
A. الوصفي B. الاستقرائي
السؤال 13/ اذا كان التكرار النسبي لاحدى الفئات في توزيع تكراري هو*0.2*وكان مجموع التكرارات الكلي في التوزيع يساوي*40*فان تكرار هذه الفئة يساوي*
A.9 | b.10 | c.8 |
السؤال 14/ معامل التغير يعتمد في حسابة على مقياسين هما
A.الوسط الحسابي و المدى | B.الانحراف المعياري و الوسط الحسابي | C. الوسط الحسابي و التباين | D. الانحراف المتوسط و الوسيط |
السؤال 15/ نعين على المحور الافقي في المدرج التكراري
A.المدى | B.عدد الفئات | C.الحدود الفعلية العليا | D.الفئات الفعلية |
السؤال 16/ قيمة التباين*للبيانات يساوي 5,7,2,8,8
A.5 | b.6.5 | c.3 | d.0 |
السؤال 17 / العدد المناسب للفئات في التوزيع التكراري هي
A.5 | B.بين ١٠ و ٢٠ فئة | C.بين ٥ و ١٥ فئة |
السؤال 18/ مقياس النزعة المركزية الذي لا يتأثر بالقيم الشاذه هو
A.الوسط الحسابي | B.الانحراف المعياري | c.الوسيط | D.الوسط الحسابي المرجح |
السؤال 19/ عند تمثيل المدرج التكراري نعيين على المحور العمودي
A. الفئات الفعلية | B.مراكز الفئات | C.الحدود الفعلية العليا | D. التكرارات |
السؤال 19/ قيمة المنوال للمشاهدات التالية 7,2,7,4,2,2,7 , 7، 3،3
A.3 | b.2 | c.4 | d.7 |
السؤال 20/ طول الفئة في التوزيع التكراري تمثل في المدرج التكراري
A.التكرارات | B.عرض المستطيل | C.طول المستطيل | d.المدى |
السؤال 21 / في دراسة لمعرفة نسبة نجاح عملية جراحية ما في مستشفى ما ، فان نوع العينة المستخدمة في هذه الدراسة
A.العشوائية البسيطة | b.المعيارية | c.المنتظمة | d.العنقودية |
السؤال 22/ لمجموعة من القيم , اذا مثلت احدى القيم بطريقة الدائرة وكانت زاوية القطاع ٣٠ درجة وكان تكرار تلك القيمة يساوي ٦ فان مجموع التكرارت لجميع القيم يساوي
A.5 | b.72 | c.0.2 | d.90 |
السؤال 23/ في المضلع التكراري المتراكم نعين على المحور الافقي
A.مراكز الفئات | b.التكرارت | C.الحدود الفعلية العيا | D.التراكم المتكرر |
السؤال 24/ اذا كانت اكبر مشاهدة هي ٦٠ ومدى التوزيع يساوي ٢٠ فان اصغر مشاهدة هي
A.50 | b.40 | c.70 | d.60 |
السؤال 25/ مقياس التشتت الذي يعتمد على اخذ مجموع الفرق الموجب بين القيم ووسطها الحسابي مقسوم على عدد البيانات
A.الانحراف المعياري | b.المدى | C.الانحراف المتوسط | D.معامل التغير |
السؤال 26/ اذا كان الوسط الحسابي لعشر قيم يساوي ١٢ فان مجموع القيم العشرة يساوي
A.200 | b.120 | c.300 | d.350 |
السؤال 27/ اذا كان لدينا الفئة ٢٠-١٣ هي احدى فئات توزيع تكراري فان طول الفئة لهذا التوزيع هي
A.6 | b.7 | c.8 | d.9 |
السؤال 28/ في دراسة كان حجم المجمتع N=3000 , فاذا اردنا سحب عينه حجمها n=30 , بطريقة العينة الطبقية فاذا قسمنا المجتمع الى عدة مجتمعات اصغر وعلمنا انه كان حجم احد المجتمعات المقسمة ٤٠٠ فان حجم العينة المسحوبة من هذا المجتمع تساوي
A.3 | b.4 | c.6 | d.9 |
السؤال 29 / نعين على المحور الافقي عند رسم المضلع التكراري
A.التكرارات | B.مراكز الفئات | C.الحدود الفعلية العليا | D.الفئات الفعلية |
السؤال 30/ التكرار المئوي للفئة الثانية في التوزيع هو
مركز الفئة | 5 | 10 | 15 | 20 | المجموع |
التكرار | 15 | 6 | 5 | 4 | 30 |
a.20% | b.30% | c.10% | d.70% |
السؤال 31 / من خصائص مجتمع الدراسه التي يجب ان يتصف بها عند استخدام العينه العشوائيه البسيطه هي ؟
A.متجانس وغير معروف حجمه | b.غير متجانس وغير معروف حجمه | c.متجانس ومعروف حجمه | d.غير متجانس ومعروف حجمه |
السؤال 32/ قيمة مركز الفئة الاولى في التوزيع التكراري
حدود الفئات | 3-7 | 8-12 | 13-17 | المجموع | |
التكرار | 5 | 8 | 3 | 16 | |
a.4.5 | b.4 | c.5 | d.7 |
السؤال 33/ العشير السابع يساوي ؟
A.الربيع الثالث | b.الوسط الحسابي | c.المئين 70 | d.الوسيط |
السؤال 34/ علم الاحصاء الوصفي يهتم بدراسة
a. المجتمع b.العينه
السؤال 35/ هو القيمة التي تقسم البيانات المرتبة ترتيبا تصاعديا او تنازليا الى قسمين بحيث يسبقها 20% من البيانات ويليها 80% من البيانات المرتبة
a.المئين 80 (p80) b.الوسيط c.المئين 20 (p20) d.العشير الثامن
السؤال 36/ الانحراف المتوسط والتباين يعتمدان اعتماد كلي في حسابتهما على
A.الوسيط B.الوسط الحسابي C.المنوال D.الانحراف المعياري
السؤال 37 /
قيمة الانحراف المتوسط للبيانات 8 , 7 ,9, 7 , 4 يساوي
A. 1.5 | b. 7 | c. 1 | D. 1.2 |
السؤال 38/ في حالة كانت البيانات المفرغة في توزيع تكراري من الاعداد ذات المنزلتين العشريتين فان وحدة الدقة لهذا التوزيع تكون
A. 1 | b. 0.1 | c. 0.01 | D. 0.001 |
السؤال 39 / المئين 75 هو نفسه
A: العشير السابع B: الربيع الاول C: الربيع الثالث D: المئين الخامس والعشرين
السؤال 40/ طول الفئة في التوزيع يساوي
مركز الفئة | 10 | 20 | 30 | 40 | المجموع |
التكرار | 5 | 16 | 5 | 4 | 30 |
a.20 | b.30 | c.10 | d.40 |
السؤال 41/ مقياس النزعة المركزية الذي يعتمد على نسبة عدد البيانات التي اصغر منه ونسبة البيانات التي قيمتها اكبر منه هو
A.المئين ٨٠ | B.الربيع الثالث | C.العشير الخامس | D.جميع ما ذكر سابقا |
السؤال 42 /اذا كانت قيم معامل التغير لمجموعتين من البيانات هما كما يلي 40%= c.v2 = 60% , c.v1 فأي من بيانات المجموعتين اكثر تغيرا؟
a.المجموعة الاولى أكثر تغيرا | b.المجموعة الثانية أكثرتغيرا | c.التغير متساوي في المجموعتين | d.لا يوجد تغير في المجموعتين |
السؤال 43/ المدى المئيني لبيانات ما هو
a.Q3-Q1 | b.D9-D2 | c.P90 - P20 | d.P90 - P10 |
السؤال 44/ . الحدان الفعليان للفئة الثالثة في هذا التوزيع هي
حدود الفئات | 4-8 | 9-13 | 14-18 | المجموع | |
التكرارت | 9 | 7 | 4 | 20 | |
a.13.5-17.5 | b.12.5-18.5 | c.18.5 -13.5 | d.13.5-18 |
السؤال 45/ من اكثر مقاييس النزعة المركزية استخداما في الدراسات
a.التباين | b.المنوال | c. الوسط الحسابي | d. المدى |
السؤال 46/ عند بناء التوزيع التكراري لبيانات ذات أعداد صحيحة تحتاج ايجاد طول الفئة فإذا كان عدد الفئات 5 وكان المدى للبيانات هو 36 فإن طول الفئة يكون:
a.7 | b.8 | c. 6 | d. 7.5 |
السؤال 47/ تعرف على انها الفئة التي تحتوي المئين 60
A.الفئة المئينية | b.المنوال | c. الوسط الحسابي | d. الفئة الوسيطية |
السؤال 48 / من طرق عرض البيانات في التوزيع التكراري :
A.الخط المنكسر | b.الدائرة | c. المضلع التكراري | d. الخط المنحني |
السؤال 49/ حسب البيانات التاليه رتبه الوسيط هي ( 45,42,23,13,505,231,40)
A.3 | b.4 | c.30 | d.27 |
السؤال 50/ احد المقاييس الاحصائية التالية من مقاييس النزعة المركزية وهو
A. معامل التغير | B. الوسيط | c. المدى | d. الانحرف المتوسط |
السؤال 51/ قيمة الانحراف المعياري للبيانات 4,4,4,4,4
A.4 | b.6 | c.0 | d.5 |
السؤال 52/ علم الاحصاء الوصفي يهتم :
A. جمع البيانات | b. عرض البيانات | C.اتخاذ القرار بناء على التحليل | D. A+B |
السؤال 53/ قيمة المدي للتوزيع التالي هي
حدود الفئات | 4-8 | 9-13 | 14-18 | المجموع | |
التكرارت | 5 | 8 | 3 | 16 | |
a.12 | b.15 | c.20 | d.8 |
السؤال 54/ في توزيع تكراري اذاكان طول الفئة يساوي 6 وعدد الفئات يساوي 5 فأن المدى لهذا التوزيع
a.30 | b.25 | c.35 | d.20 |
السؤال 55/ الاحصاء الاستقرائي يهتم باتخاذ القرار على مستوى
a. العينة b. المجتمع
السؤال 56/تم ازالة السؤال قيمة الوسيط لهذا التوزيع تساوي:
حدود الفئات | 4-8 | 9-13 | 14-18 | المجموع | |
التكرارت | 4 | 10 | 4 | 20 | |
| B. 13.5 | C. 11.5 | D. 12.5 |
السؤال 57/ المنوال التقريبي لهذا التوزيع هو:
مركز الفئة | 5 | 10 | 15 | 20 | المجموع |
التكرار | 15 | 6 | 5 | 4 | 30 |
a.20 | b.15 | c.10 | d.5 |
السؤال 58/ مقياس احصائي اثناء حسابة لا بد من ترتيب البيانات ترتيبا تصاعديا او تنازليا
a. الوسط الحسابي | B.الانحراف المعياري | c.الوسيط | D.الانحراف المتوسط |
السؤال 59/ قيمة التكرار النسبي للفئة الأولى لهذا التوزيع تساوي
الفئات | 5-9 | 10-14 | 15-19 | المجموع | |
التكرار | 10 | 4 | 6 | 20 | |
a.0.3 | b.0.1 | c.0.5 | d.0.2 |
السؤال 60/ المقياس الاحصائي الذي يتأثر سريع بالقيم الشاذة هو:
a.المنوال | b.الوسيط | C.الوسط الحسابي | D.الربيع الثالث |
الواجب الاول/ ١٤٣٨ الرابط https://vb.ckfu.org/t789549.html
السؤال 1/ من طرق عرض البيانات المفردة :
A.المدرج التكراري | b.المنحنى التكراري | c.الدائرة او القطاعات الدائرية | d.المضلع التكراري |
السؤال 2 / من طرق سحب العينات طريقة العينة العشوائية العنقودية خصائص المجتمع لهذه الطريقة هي
a. متجانس و غير معلوم حجمه | b. غير متجانس وغير معلوم حجمه |
c. متجانس ومعلوم حجم المجتمع | d. غير متجانس ومعلوم حجم المجتمع |
السؤال 3 / توزيع تكراري ذو فئات متساوية حيث أن: مركز الفئة الثانية في التوزيع السابق هو
الفئات | 5-9 | 10-14 | 15-19 | 20-24 | المجموع |
التكرار | 2 | 5 | 8 | 10 | 25 |
a. 12 | b. 7 | c. 17 | d. 22 |
السؤال 4/ توزيع تكراري ذو فئات متساوية حيث أن: الحد الادنى الفعلي للفئة الاولى في التوزيع هو
الفئات | 5-9 | 10-14 | 15-19 | 20-24 | المجموع |
التكرار | 2 | 5 | 8 | 10 | 25 |
a. 4.5 | b. 5.5 | c. 5 | d. 4 |
السؤال 5 /في نهاية المحاضرة الرابعة
السؤال 6 / توزيع تكراري ذو فئات متساوية حيث أن: الفئة الفعلية للفئة الثالثة هي
الفئات | 5-9 | 10-14 | 15-19 | 20-24 | المجموع |
التكرار | 2 | 5 | 8 | 10 | 25 |
a.19.5 – 14.5 | b.18.5 – 14.5 | c.19.5 – 13.5 | d.19 – 14 |
الواجب الثاني/ ١٤٣٨ الرابط https://vb.ckfu.org/t791213.html
السؤال 1/ قيمة المئين 25 لهذا التوزيع هي
حدود الفئات | 10-17 | 18-25 | 26-33 | المجموع |
التكرارات | 5 | 8 | 7 | 20 |
A. 17.5 | B. 16.5 | C. 18.5 | D. 9.534 |
السؤال 2 / المنوال التقريبي لهذا التوزيع هو
مركز الفئة | 5 | 10 | 15 | 20 | المجموع |
التكرار | 15 | 6 | 5 | 4 | 30 |
A. 20 | B. 15 | C. 10 | D. 5 |
السؤال 3/ إذا كان الوسط الحسابي لعشر قيم يساوي 20؛ فإن مجموع القيم العشرة يساوي
A. 400 | B. 200 | C. 300 | D. 350 |
السؤال 4 / قيمة الوسيط لهذا التوزيع تساوي
حدود الفئات | 2.5-7.5 | 7.5-12.5 | 12.5-17.5 | المجموع |
التكرارات | 4 | 5 | 11 | 20 |
A. 12.273 | B. 13.375 | C. 12.955 | D. 12.625 |
السؤال 5 / تعرف على انها الفئة التي تحتوي المئين 60
A.الوسط الحسابي | B.الفئة المئينية | C.الفئة الوسيطية | D.المنوال |
السؤال 6 / حسب البيانات التالية رتبة الوسيط هي :( 54 ، 21،27 ، 90 ، 1000 ،800 ، 300)
A. 3.5 | B. 4 | C. 90 | D. 27 |
السؤال 7 / هو القيمة التي تقسم البيانات المرتبة ترتيبا تصاعديا او تنازليا الى قسمين بحيث يسبقها 20 % من البيانات ويليها 80% من البيانات.
A. الربيع الاول | B. الوسيط | C. المئين 20 | D. المئين 80 |
السؤال 8 / الوسط الحسابي لهذا التوزيع يساوي تقريبا
مركز الفئة | 7 | 14 | 21 | 28 | المجموع |
التكرار | 8 | 4 | 5 | 3 | 20 |
A. 12.67 | B. 9.67 | C. 15.05 | D. 11.67 |
الواجب الثالث ١٤٣٨ :
السؤال ١ / إذا اعطيت البيانات التالية اوجد ميل معادلة خط الانحدار (b ) معامل x في المعادلة
7 | 10 | 5 | x |
6 | 3 | 4 | y |
A :0.25 B:-7.5 C:-0.25 D:7.5
السؤال ٢/ أذا اعطيت الجدول التالي الذي يبين اسعار وكميات بعض السلع فان رقم باش التجميعي للاسعار هو
السلع | السعر سنةالاساس | الكمية سنة الاساس | السعر سنة المقارنة | الكمية سنة المقارنة |
A | 4 | 5 | 8 | 6 |
B | 10 | 2 | 15 | 3 |
المجموع |
|
|
|
|
A:139.6% B:172% C:130% D:141.6%
السؤال ٣/ عندما تكون قيمة الرقم القياسي 70% فهذا يعني ان نسبة التغير المئوية في سعر هذه السلع هي
زادت ٧٠٪ | زادت ٣٠٪ | نقصت ٧٠٪ | نقصت ٣٠٪ |
السؤال ٤/ الرقم القياسي المرجح الذي اعتمد على الكمية المستهلكه في سنة الاساس فقط هو
رقم لاسبير | جميع ما ذكر | رقم باش | رقم فيشر |
السؤال ٥/ الرقم القياسي الامثل بين انواع الارقام القياسية هو
رقم فيشر القياسي | رقم لاسبير القياسي | رقم باش القياسي | جميع ما ذكر |
السؤال ٦/ اذا كان سعر سلعة ما سنة 1988 يساوي 2 ريال واصبح سعرها سنة 2010 هو 8 ريال فاذا كانت سنة 1988 هي سنة الاساس فأن نسبة التغير في سعر هذه السلعة في سنة 2010 يساوي
A:135% B:700% C:400% D:40%
السؤال ٧/ معامل الارتباط الذي يعتمد على البيانات الاصلية هو
بيرسون | سبيرمان | جميع ما ذكر | التغير |
السؤال ٨ / إذا كان معامل ارتباط بيرسون r = - 0.25 يعني ذلك ان قوة الارتباط
ضعيف سالب ( عكسي) | قوي جدا عكسي | ضعيف طردي | قوي عكسي |
س: مقياس التشتت الذي يعتمد على القيمة المطلقة هو : الانحراف المتوسط
س: المقياس الذي يصف لنا تشتت البيانات و بعدها عن الوسط الحسابي هو
- التباين - الانحراف المعياري - الانحراف المتوسط - جميع ما ذكر سابقا
الحل / جميع مقاييس التشتت تصف تشتت البيانات و بعدها عن الوسط الحسابي
س: توصف قوة الارتباط بين المتغير المستقل و المتغير التابع بانها ارباط خطي تام عكسي عندما تكون قيمة r تساوي
-1 - 0 - 1-
س: اذا كانت قيمة الارتباط سالبة فهذا يعني ان الارتباط الخطي
- طردي -عكسي - لايوجد ارتباط - الارتباط ضعيف
س: اذا كانت معادلة خط الانحدار لقيم x على y
Ŷ= 0.6 + 0.8 X
وكان الوسط الحسابي لقيم اكس يساوي ٩ فان الوسط الحسابي لقيم واي يساوي
8.7 | 4.6 | 7.8 | 8.4 |
a= الحل/ نعوض في المعادلة
حيث ان ŷ= a +bx
س / معامل الارتباط الذي يعتمد على رتب البيانات هو
بيرسون | سبيرمان | جميع ما ذكر | التغير |
س: المقياس الحسابي الذي يؤخذ من معدل القيم المطلقة للفرق مابين القيم و وسطها الحسابي
الانحراف المتوسط | الوسط الحسابي | التباين | الانحراف المعياري |
س: لدراسة اثر علامة الرياضيات على علامة الاحصاء فان المتغير المستقل
- الرياضيات - الاحصاء
س: اذا كان لدينا اكثر من مجموعة بيانات فان افضل مقياس للتشتت يستخدم للمقارنة بين تغير البيانات في المجموعات المختلفة هو - معامل التغير - الانحراف المتوسط - المدى - الانحراف المعياري
س: كلما زادت قيمة الانحراف المعياري كل ما قل التشتت بين البيانات
- صحيح - خطا
س: الانحراف المتوسط و التباين يعتمدان اعتماد كلي في حسابتهما على
- الوسيط - الوسط الحسابي -المنوال -الانحراف المعياري
س: تزداد قوة الارتباط بين المتغير المستقل و التابع كلما اقتربت قيمة معامل الارتباط من ١
- صحيح - خطا - كل ماذكر سابقا - جميع ما ذكر
مثال على طول الفئة - لنفرض ان لدينا فئات طولها ٦
١ | ٢ | ٣ | ٤ | ٥ | ٦ |
الحد الادني | الحد الاعلي | ||||
٢٤ | ٢٥ | ٢٦ | ٢٧ | ٢٨ | ٢٩ |
٣٠ | ٣١ | ٣٢ | ٣٣ | ٣٤ | ٣٥ |
٣٦ | ٣٧ | ٣٨ | ٣٩ | ٤٠ | ٤١ |
طول الفئة = الحد الاعلي للفئة - الحد الادني للفئة + وحدة دقة ٢٩ - ٢٤ = ٦
طول الفئة = الحد الادني للفئة الثانية - الحد الادني للفئة الاولي ٣٠ - ٢٤ = ٦
الفرق بين الحد الاعلي لاي فئة و الحد الادني للفئة التالية هو وحدة الدقة ( انظر السؤال الثامن - المحاضرة المباشرة الاولى)
طول الفئة يمكن ايجاده بمعرفة الفرق بين مركز فئة و الفئة التي تليها