مقالات

1.6.6.1: ما هو الاختبار الإحصائي؟ - الرياضيات


افترض أننا قارنا مجموعتين من الأرقام ، القياسات التي جاءت من عينتين. من المقارنة ، وجدنا أنها مختلفة. ولكن كيف تعرف أن هذا الاختلاف لم ينشأ عن طريق الصدفة؟ بمعنى آخر ، كيف نقرر أن عينتينا مختلفتين حقًا ، أي لم تأتوا من مجموعة واحدة؟

يمكن أن تكون هذه العينات ، على سبيل المثال ، قياسات ضغط الدم الانقباضي. إذا درسنا العقار الذي يحتمل أن يخفض ضغط الدم ، فمن المنطقي مزجه عشوائياً مع دواء وهمي ، ثم نطلب من أعضاء المجموعة الإبلاغ عن ضغط الدم في اليوم الأول من التجربة ، والقول ، في اليوم العاشر. بعد ذلك ، سيسمح الفرق بين قياسين بتحديد ما إذا كان هناك أي تأثير:

الرمز ( PageIndex {1} ) (R):

الآن ، هناك تأثير واعد ، فرق كاف بين فروق ضغط الدم مع الدواء والعلاج الوهمي. هذا واضح أيضًا مع boxplots (التحقق من بنفسك). كيف تختبرها؟ نحن نعلم بالفعل كيفية استخدام القيمة p ، لكنها نهاية السلسلة المنطقية. دعونا نبدأ من البداية.

الفرضيات الإحصائية

افترض الفلاسفة أن العلم لا يمكنه أبدًا إثبات نظرية ، ولكن فقط دحض هو - هي. إذا جمعنا 1000 حقيقة تدعم نظرية ما ، فهذا لا يعني أننا أثبتناها - فمن المحتمل أن الدليل 1001 سوف يدحضها. هذا هو السبب في أننا نستخدم عادة فرضيتين في الاختبار الإحصائي. الذي نحاول إثباته يسمى الفرضية البديلة ( (H_1 )). الآخر ، الافتراضي ، يسمى فرضية العدم ( (H_0 )). الفرضية الصفرية هي اقتراح بغياب شيء ما (على سبيل المثال ، الاختلاف بين عينتين أو العلاقة بين متغيرين). لا يمكننا إثبات الفرضية البديلة ، لكن يمكننا رفض الفرضية الصفرية وبالتالي التحول إلى البديل. إذا لم نتمكن من رفض الفرضية الصفرية ، فيجب أن نبقى معها.

أخطاء إحصائية

مع فرضيتين ، هناك أربع نتائج محتملة (Table ( PageIndex {1} )).

النتائج الأولى (أ) والأخيرة (د) هي حالتان مثاليتان: إما أن نقبل الفرضية الصفرية الصحيحة للمجتمع المدروس ، أو نرفض (H_0 ) عندما تكون خاطئة.

إذا قبلنا الفرضية البديلة ، فعندما تكون غير صحيحة ، نكون قد التزمنا بـ اكتب أنا خطأ إحصائي—لقد وجدنا نمطًا غير موجود. يُطلق على هذا الموقف غالبًا "إيجابية كاذبة" أو "إنذار كاذب". يرتبط احتمال ارتكاب خطأ من النوع الأول بقيمة p والتي يتم الإبلاغ عنها دائمًا كإحدى نتائج الاختبار الإحصائي. حقيقة، قيمة p هي احتمال أن يكون لها نفس التأثير أو تأثير أكبر إذا كانت الفرضية الصفرية صحيحة.

تخيل ضابط أمن في الخدمة الليلية يسمع شيئًا غريبًا. هناك خياران: القفز وتحقق مما إذا كانت هذه الضوضاء تشير إلى شيء مهم ، أو استمر في الاسترخاء. إذا كانت الضوضاء بالخارج غير مهمة أو حتى غير حقيقية ولكن الضابط قفز ، فهذا هو الخطأ من النوع الأول. احتمالية سماع الضوضاء المشبوهة عندما لا يحدث شيء في الواقع بقيمة p.

عينة السكانNull هو الصحيحالبديل صحيح
قبول لاغية
تقبل البديل

جدول ( PageIndex {1} ) الفرضيات الإحصائية ، بما في ذلك الرسوم التوضيحية (ب) النوع الأول و (ج) النوع الثاني من الأخطاء. النقاط الأكبر عبارة عن عينات ، وكل النقاط عبارة عن مجموعة (مجموعات).

بالنسبة لضابط الأمن ، من الأفضل ارتكاب خطأ من النوع الأول بدلاً من تخطي شيء مهم. ومع ذلك ، في العلم ، يكون الوضع معاكسًا: نبقى دائمًا مع (H_0 ) عندما يكون احتمال ارتكاب خطأ من النوع الأول هو مرتفع جدا. من الناحية الفلسفية ، هذا هو البديل من الحلاقة أوكام: يفضل العلماء دائمًا عدم إدخال أي شيء (أي التبديل إلى البديل) دون ضرورة.

الرجل الذي أنقذ العالم بمفرده من حرب نووية

يمكن العثور على هذا النهج أيضًا في مجالات أخرى من حياتنا. اقرأ مقالة ويكيبيديا حول ستانيسلاف بيتروف (https://en.Wikipedia.org/wiki/Stanislav_Petrov) ؛ هذا مثال آخر عندما يكون الإنذار الخاطئ مكلفًا للغاية.

السؤال الواضح هو ما هو الاحتمال "مرتفع جدا"؟ تضع الإجابة التقليدية هذه العتبة عند 0.05 — يتم قبول الفرضية البديلة إذا كانت القيمة الاحتمالية أقل من 5٪ (أكثر من 95٪ مستوى ثقة). في الطب ، مع اعتبار الأرواح البشرية هي الرهان ، يتم تحديد العتبات بشكل أكثر صرامة ، عند 1٪ أو حتى 0.1٪. على النقيض من ذلك ، في العلوم الاجتماعية ، من الشائع قبول 10 ٪ كعتبة. كل ما تم اختياره كعتبة ، يجب تعيينه بداهة، قبل أي اختبار. لا يجوز تعديل العتبة لإيجاد عذر للقرار الإحصائي.

الشكل ( PageIndex {1} ) مخطط القرار الإحصائي (للاختبار أحادي الطرف). ( alpha ) هو احتمال حدوث خطأ من النوع الأول ، ( beta ) - لخطأ من النوع الثاني. قبل الاختبار ، يجب علينا ضبط ( alpha ) ، عادةً على 0.05. ثم نستخدم البيانات الأصلية لحساب الإحصاء (تخمين موقع الخط العمودي الأسود). بعد ذلك ، نستخدم الإحصاء لحساب القيمة الاحتمالية. أخيرًا ، إذا كانت قيمة p أقل من ( alpha ) ، فإننا نرفض فرضية العدم.

اقبل الفرضية الصفرية عندما يكون البديل في الحقيقة هو أ النوع الثاني خطأ إحصائي—الفشل في اكتشاف نمط موجود بالفعل. وهذا ما يسمى "السلبية الزائفة" ، "الإهمال". إذا لم يقفز ضابط الأمن المهمل عندما تكون الضوضاء بالخارج مهمة حقًا ، فهذا مهم خطأ من النوع الثاني. يتم التعبير عن احتمال ارتكاب خطأ من النوع الثاني كـ قوة من الاختبار الإحصائي (الشكل ( PageIndex {1} )). كلما كان هذا الاحتمال أصغر ، كلما كان الاختبار أقوى.


المدرسة الثانوية: الإحصاء والاحتمالية & raquo مقدمة

غالبًا ما تستند القرارات أو التنبؤات إلى البيانات و mdashnumbers في السياق. ستكون هذه القرارات أو التنبؤات سهلة إذا كانت البيانات ترسل دائمًا رسالة واضحة ، ولكن غالبًا ما يتم حجب الرسالة بسبب التباين. توفر الإحصائيات أدوات لوصف التباين في البيانات ولاتخاذ قرارات مستنيرة تأخذها في الاعتبار.

يتم جمع البيانات وعرضها وتلخيصها وفحصها وتفسيرها لاكتشاف الأنماط والانحرافات عن الأنماط. يمكن وصف البيانات الكمية من حيث الخصائص الرئيسية: قياسات الشكل والمركز والانتشار. يمكن وصف شكل توزيع البيانات بأنه متماثل ، أو منحرف ، أو مسطح ، أو على شكل جرس ، ويمكن تلخيصه بواسطة مركز قياس إحصائي (مثل المتوسط ​​أو الوسيط) ونطاق قياس إحصائي (مثل الانحراف المعياري أو النطاق الرباعي) ). يمكن مقارنة التوزيعات المختلفة عدديًا باستخدام هذه الإحصائيات أو مقارنتها بصريًا باستخدام المؤامرات. معرفة المركز والانتشار لا يكفي لوصف التوزيع. تعتمد الإحصائيات المراد مقارنتها ، والمخططات التي يجب استخدامها ، وما قد تعنيه نتائج المقارنة ، على السؤال الذي سيتم التحقيق فيه والإجراءات الواقعية التي يتعين اتخاذها.

العشوائية لها استخدامان مهمان في استخلاص النتائج الإحصائية. أولاً ، جمع البيانات من عينة عشوائية من السكان يجعل من الممكن استخلاص استنتاجات صحيحة حول السكان ككل ، مع مراعاة التباين. ثانيًا ، يتيح التخصيص العشوائي للأفراد للعلاجات المختلفة مقارنة عادلة لفعالية تلك العلاجات. النتيجة ذات الدلالة الإحصائية هي نتيجة من غير المحتمل أن تكون ناجمة عن الصدفة وحدها ، ولا يمكن تقييم ذلك إلا في ظل حالة العشوائية. تعتبر الظروف التي يتم بموجبها جمع البيانات مهمة في استخلاص النتائج من البيانات في المراجعة النقدية لاستخدامات الإحصائيات في وسائل الإعلام العامة والتقارير الأخرى ، ومن المهم النظر في تصميم الدراسة ، وكيفية جمع البيانات ، والتحليلات المستخدمة وكذلك ملخصات البيانات والاستنتاجات المستخلصة.

يمكن وصف العمليات العشوائية رياضيًا باستخدام نموذج احتمالية: قائمة أو وصف للنتائج المحتملة (مساحة العينة) ، يتم تعيين احتمالية لكل منها. في حالات مثل قلب عملة معدنية ، أو دحرجة مكعب رقمي ، أو رسم بطاقة ، قد يكون من المعقول افتراض احتمال حدوث نتائج مختلفة بشكل متساوٍ. في نموذج الاحتمالية ، تمثل نقاط العينة النتائج ويمكن حساب احتمالات الأحداث من خلال تطبيق قواعد الجمع والضرب. يعتمد تفسير هذه الاحتمالات على فهم الاستقلالية والاحتمال الشرطي ، والتي يمكن تناولها من خلال تحليل الجداول ذات الاتجاهين.

تلعب التكنولوجيا دورًا مهمًا في الإحصاء والاحتمالات من خلال إتاحة إمكانية إنشاء المؤامرات ووظائف الانحدار ومعاملات الارتباط ومحاكاة العديد من النتائج المحتملة في فترة زمنية قصيرة.

وصلات للوظائف والنمذجة

يمكن استخدام الوظائف لوصف البيانات إذا كانت البيانات تشير إلى وجود علاقة خطية ، يمكن نمذجة العلاقة بخط الانحدار ، ويمكن التعبير عن قوتها واتجاهها من خلال معامل الارتباط.


رسائل رومانية

  • ب = ذ اعتراض خط. مُعرَّف هنا في الفصل 4. (تستخدم بعض كتب الإحصاء ب0.)
  • BD أو BPD = توزيع احتمالي ذي حدين. معرف هنا في الفصل 6.
  • CI = فاصل الثقة. مُعرَّف هنا في الفصل 9.
  • CLT = نظرية الحدود المركزية. معرف هنا في الفصل 8.
  • د = الفرق بين البيانات المزدوجة. معرف هنا في الفصل 11.
  • مدافع أو ν nu = درجات الحرية في توزيع الطالب أو & # 967 . مُعرَّف هنا في الفصل 9. مُعرَّف هنا في الفصل 12.
  • DPD = توزيع احتمالي منفصل. معرف هنا في الفصل 6.
  • ه = هامش الخطأ ، أ / ك / أقصى خطأ في التقدير. معرف هنا في الفصل 9.
  • F = التردد. معرف هنا في الفصل 2.
  • F/ن = التردد النسبي. معرف هنا في الفصل 2.
  • HT = اختبار الفرضية. مُعرَّف هنا في الفصل 10.
  • حا = فرضية فارغة. مُعرَّف هنا في الفصل 10.
  • ح1 أو حأ = فرضية بديلة. مُعرَّف هنا في الفصل 10.
  • IQR = المدى الربيعي ، Q3& # x2212Q1. معرف هنا في الفصل 3.
  • م = ميل الخط. مُعرَّف هنا في الفصل 4. (يستخدم TI-83 a وبعض كتب الإحصاء المستخدمة ب1.)
  • م أو Med = متوسط ​​العينة. معرف هنا في الفصل 3.
  • ن = حجم العينة ، عدد نقاط البيانات. مُعرَّف هنا في الفصل 2. أيضًا ، عدد التجارب في تجربة احتمالية بنموذج ذي حدين. معرف هنا في الفصل 6.
  • ن = حجم السكان.
  • ND = التوزيع الطبيعي ، والذي يكون الرسم البياني الخاص به عبارة عن منحنى على شكل جرس أيضًا "موزع بشكل طبيعي". مُعرَّف هنا في الفصل 7.
  • ص = قيمة الاحتمال. المعنى المحدد يعتمد على السياق.

في التوزيعات الاحتمالية الهندسية وذات الحدين ، ص هو احتمال "النجاح" (المحدد هنا في الفصل 6) في أي تجربة واحدة و ف = (1 & # x2212ص) هو احتمال "الفشل" (الاحتمال الآخر الوحيد) في أي تجربة واحدة.

في اختبار الفرضيات ، ص هي القيمة p المحسوبة (المعرفة هنا في الفصل 10) ، واحتمال أن يكون رفض الفرضية الصفرية قرارًا خاطئًا.

في اختبارات نسب السكان ، ص لتقف على نسبة السكان و ص & # 770 لنسبة العينة (انظر الجدول أعلاه).

حذر! ترتيب أ و ب قد يبدو متخلفًا بالنسبة لك في البداية.


استراتيجيات لكيفية حل مشاكل الإحصاء

لنأخذ مشكلة إحصائية ونفهم استراتيجيات حلها. تستند الاستراتيجيات التالية إلى مشكلة العينة العشوائية وحلها بالتتابع.

هذه المشكلة الإحصائية النموذجية هي: 11,11, 6, 9, 14, -3, 0, 7, 22, -5 , -4, 13, 13, 9, 4 , 6, 11

# 1: استرخ وتحقق من مشكلة الإحصاء المحددة

عندما يقوم الطلاب بتعيين مشاكل الإحصاء ، فقد لاحظت أنهم أصيبوا بالذعر. بسبب الذعر ، هناك فرص أكبر لارتكاب أخطاء أثناء حل توزيعات الإحصائيات.

قد يكون هذا لأن الطلاب يعتقدون أنه يمكنهم حل هذه الاستفسارات ، مما يؤدي إلى انخفاض الثقة. لهذا السبب يصبح من الضروري تهدئة نفسك قبل البدء في حل أي مشكلة إحصائية.

هذا مثال يساعدك على فهم مشكلة الإحصائيات بسهولة.

تم تشخيص ما يقرب من 17 صبيا بمرض معين يؤدي إلى تغيير الوزن.

هنا كانت البيانات بعد العلاج الأسري كما يلي:

11,11, 6, 9, 14, -3, 0, 7, 22, -5 , -4, 13, 13, 9, 4 , 6, 11

# 2: حلل مشكلة الإحصاء

بمجرد تعيين مشكلة الإحصاء ، قم الآن بتحليل الاستعلام لحلها بدقة.

تحقق مما يطلب منك القيام به في المشكلة؟ من المفيد أن يحصل المرء على حد الثقة الأعلى الذي يمكنه استخدام المتوسط: درجات الحرية وقيمة t.

إليكم السؤال: ما معنى درجات الحرية في اختبار T؟

خذ عينة من السؤال: اذا كان هناك ن عدد الملاحظات. سيكون من المفيد إذا قدرت القيمة المتوسطة. سيؤدي ذلك إلى ترك درجة n-1 من الحرية التي يتم استخدامها لتقدير التباين.

بالنسبة للمشكلة المذكورة أعلاه ، يمكننا تقدير المتوسط ​​مع قيمة العينة 17-1 التي تساوي 16.

للتعرف على الصعوبة ، ادرس الأرقام التي يمكن للمرء أن يمتلكها.

  • يجب أن يكون لدى المرء حد ثقة أقل.
  • احصل على جميع النتائج المحددة.
  • تحتاج إلى فهم عدد الدرجات (17).

ضع في اعتبارك الأشياء المتعلقة بما يمكن للمرء أن يتذكره (أو قد يشاهده داخل كتاب مدرسي).

  • متوسط ​​الدرجة للرقم هو إضافة الدرجات مقسومة على إجمالي عدد النقاط.
  • للحصول على حد أدنى للثقة ، يحتاج المرء إلى إجراء ناقص (t * خطأ معياري).
  • حد الثقة UPPER هو المتوسط ​​الذي تم جمعه + (t * خطأ قياسي).

# 3: اختر الإستراتيجية الخاصة بكيفية حل مشاكل الإحصاء

هناك عدة طرق للحصول على حد الثقة الأعلى إلى جانب ذلك ، كل هذا يشمل القيمة الحسابية (t * خطأ معياري) للحصول على المتوسط. هناك أسهل نهج هو

  • حدد ما الذي يعنيه.
  • تحقق من الاختلاف في المتوسط ​​والحد الأدنى للثقة.
  • اجمع الرقم إلى المتوسط.

هذه خطوات يشعر بها معظم الناس بالحيرة. قد يكون هذا بسبب الأسباب الثلاثة الرئيسية.

  • الأول هو أن الطلاب يتعرضون للتوتر بسبب الانغماس في دراسات أكاديمية مختلفة.
  • ثانيًا ، ليس لدى المتعلمين الوقت الكافي للتحقق من المشكلات الإحصائية ومعرفة ما يجب فعله أولاً.
  • ثالثًا ، لا يستريحون دقيقة واحدة ويدرسون النهج الصحيح.

نعتقد أن العديد من الطلاب لا يدفعون الوقت الكافي في المستويات الثلاثة الأولى قبل الانتقال إلى الرقم الرابع.

# 4: قم بتنفيذها الآن

هذا هو الجواب الصحيح.

# 5: تحقق من لمعرفة كيفية حل مشاكل الإحصاء

قم بالتحقق من اليقين. يجب أن يكون المتوسط ​​7.29. إذا لم تندرج في فئة حدود الثقة الدنيا والعليا ، فسيكون هناك خطأ ما.

تحقق مرة أخرى غدًا للحصول على التحقق من الرقم. سيتم تنفيذ هذه الخطوات على جميع مشاكل الإحصاء (وقد يكون استعلام الرياضيات لغزًا في الحياة).

دعونا نفهم الخطوات المذكورة أعلاه من خلال حل مشكلة إحصائية !!

مشكلة: في الولاية ، يوجد 52٪ من الناخبين الديمقراطيين ، وحوالي 48٪ جمهوريون. في ولاية أخرى ، 47٪ من الناخبين هم من الديمقراطيين ، و 53٪ من الجمهوريين. إذا أخذت العينة 100 ناخب ، فما هو الاحتمال الذي يمثل النسبة المئوية القصوى للديمقراطيين في دولة أخرى.

P1 = نسبة الناخبين الجمهوريين في الولاية الأولى ،

P2 = نسبة الناخبين الجمهوريين في ولاية أخرى ،

p1 = نسبة الناخبين الجمهوريين عينة في الولاية الأولى ،

p2 = عينة من نسبة الناخبين الجمهوريين في ولاية أخرى ،

n1 = عدد الناخبين في الولاية الأولى ،

n2 = عدد الناخبين في ولاية أخرى ،

الآن ، دع & # 8217s نحلها في أربع خطوات:

  • تذكر أن حجم العينة يجب أن يكون أكبر لنمذجة الاختلاف للسكان العاديين. لذلك، P1 * n1 = 0.52*100 =52, (1-P1) * ن 1 = 0.48 *100 = 48.

من ناحية أخرى، P2 * n2 = 0.47*100 =47, (1-P2) * ن 2 = 0.53 * 100 = 53 ، وهو أكبر من 10. لذلك يمكننا القول أن حجم العينة أكبر بكثير.

  • احسب متوسط ​​فرق نسب العينة: E (p1 & # 8211 p2) = & gt P1 & # 8211 P2= 0.52 & # 8211 0.47 = & GT 0.05.
  • احسب فرق الانحراف المعياري.

σd = الجذر التربيعي (0.002491 + 0.002496) = الجذر التربيعي (0.004987) = 0.0706

  • احسب الاحتمال. تحتاج المشكلة المعطاة إلى حساب الاحتمال ، وهو p1 & lt p2.

هذا مشابه لتحديد الاحتمال ، وهو (p1 & # 8211 p2) & lt 0. لحساب الاحتمال ، يجب عليك تحويل المتغير (p1 & # 8211 p2) في z-Score. سيكون التحول:

ض (القاعدة (p1 & # 8211 p2)) = (x & # 8211 μ (القاعدة (p1 & # 8211 p2)) / σd = (0 & # 8211 0.05) /0.0706 = & GT -0.7082

  • بمساعدة حاسبة التوزيع الطبيعي لـ Stat Trek & # 8217s ، يمكنك حساب أن احتمالية Z-scores التي تكون -0.7082 هي 0.24.

هذا هو السبب في أن الاحتمال يظهر نسبة مئوية أكبر من الناخبين الجمهوريين داخل ولاية أخرى / ثانية مقارنة بالولاية الأولى ، وهي 0.24.


1.6.6.1: ما هو الاختبار الإحصائي؟ - الرياضيات

بالإضافة إلى الأسئلة التالية حول PISA ، يتوفر المزيد من الأسئلة الشائعة حول التقييمات الدولية على: http://nces.ed.gov/surveys/international/faqs.asp

1. ما هي المجالات التي يتم تقييمها في برنامج التقييم الدولي للطلاب (PISA)؟

يقيس PISA أداء الطلاب في القراءة والرياضيات ومحو الأمية العلمية. تُجرى كل دورة من دورات بيانات PISA كل 3 سنوات ، وتقوم بتقييم أحد مجالات الموضوعات الأساسية الثلاثة بعمق (يعتبر الموضوع الرئيسي أو الموضوع المحوري) ، على الرغم من أنه يتم تقييم جميع الموضوعات الأساسية الثلاثة في كل دورة (يعتبر الموضوعان الآخران مجالات ثانوية لهذا التقييم عام). يسمح تقييم جميع الموضوعات الثلاثة كل 3 سنوات للبلدان بالحصول على مصدر ثابت لبيانات الإنجاز في كل موضوع من الموضوعات الثلاثة مع التناوب على مجال واحد باعتباره التركيز الأساسي على مر السنين. بالإضافة إلى التقييمات الأساسية ، قد تشارك أنظمة التعليم في تقييمات اختيارية مثل محو الأمية المالية وحل المشكلات. يمكن العثور على مزيد من المعلومات حول أطر عمل التقييم PISA على: www.oecd.org/pisa/pisaproducts.

في عام 2018 ، كانت القراءة والكتابة هي الموضوع الرئيسي ، كما كان في عامي 2009 و 2000. بالإضافة إلى التقييم الأساسي في العلوم والقراءة ومحو الأمية الرياضية ، تضمنت دورة 2018 تقييمًا اختياريًا لمحو الأمية المالية. شاركت الولايات المتحدة في هذا التقييم الاختياري.

دورة إدارة برنامج التقييم الدولي للطلاب (PISA)

سنة التقييم 2000 2003 2006 2009 2012 2015 2018
الموضوعات التي تم تقييمها قراءة
الرياضيات
علم
قراءة
الرياضيات
علم
حل المشاكل
قراءة
الرياضيات
علم
قراءة
الرياضيات
علم
قراءة
الرياضيات
علم
حل المشاكل
الأمور المالية
قراءة
الرياضيات
علم
التعاونيه
حل المشاكل
محو الأمية المالية
قراءة
الرياضيات
علم
محو الأمية المالية

ملاحظة: يتم تقييم القراءة والرياضيات ومحو الأمية العلمية في كل دورة تقييم لبرنامج التقييم الدولي (PISA). تم إجراء تقييم منفصل لحل المشكلات في عامي 2003 و 2012 ، ومحو الأمية المالية في 2012 و 2015 و 2018. والموضوع المكتوب بحروف كبيرة بخط غامق هو الموضوع الرئيسي أو المحوري لتلك الدورة. اعتبارًا من دورة عام 2015 ، يتم إدارة PISA بالكامل على الكمبيوتر.

2. ما هي مكونات برنامج التقييم الدولي للطلاب (PISA)؟

التقييمات
تألفت PISA 2018 من تقييم قائم على الكمبيوتر لمحو أمية العلوم والقراءة والرياضيات لدى الطلاب. يمكن للبلدان أيضًا أن تختار المشاركة في تقييم الثقافة المالية. في كل مدرسة مشاركة ، جلس الطلاب الذين تم أخذ عينات منهم في تقييم قائم على الكمبيوتر لمدة ساعتين تضمن مجموعة من عناصر العلوم والقراءة والرياضيات. طُلب من عينة فرعية من الطلاب الذين شاركوا في التقييم الرئيسي العودة لحضور جلسة ثانية حيث أكملوا تقييمًا قائمًا على الكمبيوتر لمحو الأمية المالية.

استبيانات
في عام 2018 ، قدمت PISA الاستبيانات التالية:

  • أكمل الطلاب استبيانًا للطلاب مدته 45 دقيقة يوفر معلومات حول خلفيتهم ومواقفهم تجاه استراتيجيات وخبرات القراءة والتعلم.
  • طُلب من الطلاب الذين تم أخذ عينات منهم لإجراء تقييم محو الأمية المالية إكمال استبيان منفصل حول خلفيتهم وخبراتهم المالية.
  • أكمل مدير كل مدرسة مشاركة استبيانًا مدرسيًا مدته 30 دقيقة يوفر معلومات عن التركيبة السكانية للمدرسة وبيئة التعلم ، من بين موضوعات أخرى.
  • تم اختيار عينة من المعلمين داخل كل مدرسة لاستكمال استبيان المعلم المصمم لتوفير معلومات عن خلفيات المعلمين والتعليم والتطوير المهني وممارسات التدريس. تم أخذ عينات من عشرة مدرسين لفنون اللغة و 15 مدرسًا غير متخصصين في فنون اللغة مؤهلين لتدريس الصف النموذجي الذي يلتحق فيه الأطفال البالغون من العمر 15 عامًا (الصف العاشر في الولايات المتحدة) في كل مدرسة. كان استبيان المعلم اختياريًا للبلدان. نفذت الولايات المتحدة هذا الاستبيان في عام 2018.
  • يتضمن PISA أيضًا استبيانًا لأولياء أمور الطلاب أو أولياء أمورهم ، على الرغم من أن الولايات المتحدة لم تقم بإدارة هذا الاستبيان.

استبيانات برنامج تقييم الطلاب الدولي (PISA) المستخدمة في الولايات المتحدة متاحة على: http://nces.ed.gov/surveys/pisa/questionnaire.asp.

3. كم عدد المدارس والطلاب الأمريكيين المشاركين في PISA؟

سنة التقييم عدد الطلاب المشاركين عدد المدارس المشاركة معدل استجابة المدرسة (نسبة مئوية) معدل استجابة الطلاب الإجمالي (نسبة مئوية)
المدارس الأصلية مع مدارس بديلة
2000 3,700 145 56 70 85
2003 5,456 262 65 68 83
2006 5,611 166 69 79 91
2009 5,233 165 68 78 87
2012 6,111 161 67 77 89
2015 5,712 177 67 83 90
2018 4,811 162 65 76 85

4. كيف تختار PISA عينة تمثيلية من الطلاب؟

لتقديم تقديرات صحيحة لإنجازات الطلاب وخصائصهم ، يختار برنامج تقييم الطلاب الدولي (PISA) عينة من الطلاب تمثل إجمالي عدد الطلاب البالغين من العمر 15 عامًا في كل دولة مشاركة أو نظام تعليمي. يتم تعريف هؤلاء السكان دوليًا على أنهم في سن 15 عامًا (15 عامًا و 3 أشهر إلى 16 عامًا وشهرين في بداية فترة الاختبار) يلتحقون بالمدارس العامة والخاصة في الصفوف من 7 إلى 12. يقدم كل بلد أو نظام تعليمي إطار أخذ العينات إلى الاتحاد الدولي للمنظمات المسؤولة عن تنفيذ PISA. يقوم مقاول أخذ العينات الدولي التابع لمنظمة التعاون الاقتصادي والتنمية بالتحقق من صحة إطار أخذ العينات لكل بلد أو نظام تعليمي.

بمجرد التحقق من صحة إطار العينة ، يسحب المقاول الدولي عينة علمية عشوائية لا تقل عن 150 مدرسة من كل إطار مع مدرستين بديلتين لكل مدرسة أصلية ، ما لم يكن هناك أقل من 150 مدرسة ، وفي هذه الحالة يتم أخذ عينات من جميع المدارس. تم أخذ عينات من 50 مدرسة على الأقل للمشاركين دون الوطنيين. يتم تسليم قائمة المدارس المختارة ، الأصلية والبديلة ، إلى المركز الوطني PISA لكل نظام تعليمي. لا ترسم البلدان وأنظمة التعليم عيناتها الخاصة.

كل بلد / نظام تعليمي مسؤول عن تجنيد مدارس العينة. يبدأون بالعينة الأصلية ويستخدمون المدارس البديلة فقط إذا رفضت المدرسة الأصلية المشاركة. وفقًا لإرشادات برنامج تقييم الطلاب الدولي (PISA) ، يتم تحديد المدارس البديلة من خلال تعيين المدرستين المجاورتين للمدرسة التي تم أخذ عينات منها في إطار أخذ العينات كبدائل لاستخدامها في الحالات التي ترفض فيها المدرسة الأصلية التي تم أخذ عينات منها المشاركة. يجب أن تكون المدارس البديلة في نفس الطبقة الضمنية (أي لها خصائص ديموغرافية مماثلة) مثل المدرسة التي تم أخذ عينات منها. كان هدف معدل استجابة المدارس الدولية 85 بالمائة لجميع أنظمة التعليم. مطلوب ما لا يقل عن 65 في المائة من المدارس من العينة الأصلية للمدارس للمشاركة حتى يتم تضمين بيانات نظام التعليم في قاعدة البيانات الدولية. تم السماح لأنظمة التعليم باستخدام مدارس بديلة (تم اختيارها أثناء عملية أخذ العينات) لزيادة معدل الاستجابة بمجرد الوصول إلى معيار 65 بالمائة.

بعد أخذ عينات من المدارس والموافقة على المشاركة ، يتم أخذ عينات من الطلاب. كان مطلوباً ما لا يقل عن 6،300 طالب في كل بلد أو نظام تعليمي يخطط لإدارة تقييم PISA الأساسي واختبار محو الأمية المالية الاختياري. (كان الحد الأدنى لحجم عينة الطالب لأنظمة التعليم دون الوطنية ، مثل الولايات الأمريكية ، 1500 طالب.) يقدم كل بلد / نظام تعليمي نماذج قوائم الطلاب التي تحتوي على جميع الطلاب المؤهلين للعمر لكل مدرسة من مدارسهم إلى المقاول الدولي لمنظمة التعاون الاقتصادي والتنمية لأخذ عينات على مستوى الطلاب .

يراجع المقاول الدولي لمنظمة التعاون والتنمية في الميدان الاقتصادي قوائم الطلاب بعناية ويستخدم برنامجًا متطورًا لإجراء فحوصات صحة البيانات لمقارنة كل قائمة بما هو معروف عن المدارس (على سبيل المثال ، التسجيل المتوقع والتوزيع بين الجنسين) ومتطلبات الأهلية لـ PISA (على سبيل المثال ، نطاقات الصف وعيد الميلاد) . ثم يتم إرسال عينات الطلاب المختارة إلى كل مركز وطني. على عكس أخذ العينات من المدرسة ، لا يُسمح باستبدال الطلاب الذين تم أخذ عينات منهم.

تخبر المدارس الطلاب باختيارهم للمشاركة. يجب أن تكون مشاركة الطلاب 80 بالمائة على الأقل حتى يتم الإبلاغ عن بيانات نظام التعليم / الدولة من قبل منظمة التعاون الاقتصادي والتنمية.

5. هل تقدم PISA أماكن إقامة للطلاب الذين يحتاجون إليها؟

من أجل الحفاظ على PISA شاملة قدر الإمكان وللحفاظ على انخفاض معدل استبعاد الطلاب ، استخدمت الولايات المتحدة UH ("Une Heure" أو "ساعة واحدة" بالفرنسية) مصممة للطلاب ذوي الاحتياجات التعليمية الخاصة. تم توفير أداة UH للطلاب ذوي الاحتياجات التعليمية الخاصة داخل المدارس العادية وتحتوي على حوالي نصف عدد العناصر التي تحتوي عليها أداة الاختبار العادية. تم اعتبار عناصر الاختبار هذه أكثر ملاءمة للطلاب ذوي الاحتياجات التعليمية الخاصة. تم أيضًا إجراء استبيان طالب UH ، والذي احتوى فقط على عناصر الاتجاه من استبيان الطالب العادي. سمح هيكل كل من أداة اختبار UH واستبيان الطلاب UH بمزيد من الوقت لكل سؤال مقارنة بالأدوات العادية وعقدت جلسات UH بشكل عام في مجموعات صغيرة.

6. كيف يعمل اختبار PISA التكيفي متعدد المراحل للقراءة؟

من أجل زيادة دقة قياس قدرة الطلاب ، تم تقديم PISA 2018 الاختبار التكيفي في تقييم القراءة. بدلاً من استخدام كتيبات اختبار ثابتة ومحددة مسبقًا كما تم خلال PISA 2015 ، تم تحديد تقييم القراءة المقدم لكل طالب ديناميكيًا ، بناءً على أداء الطالب في المراحل السابقة. أصبح الاختبار التكيفي متعدد المراحل في القراءة أسهل لأن اختبار PISA قد انتقل إلى نظام أساسي للتقييم قائم على الكمبيوتر ، مما يوفر مزيدًا من المرونة في توجيه العناصر والكتل أو وحدات العناصر.

كانت هناك ثلاث مراحل لتقييم القراءة في PISA 2018: المرحلة الأساسية والمرحلة 1 والمرحلة 2. شهد الطلاب أولاً مرحلة أساسية قصيرة تتكون من 7 إلى 10 عناصر. تم تسجيل الغالبية العظمى من هذه العناصر (80 بالمائة على الأقل ودائماً 7 عناصر على الأقل) تلقائيًا. تم تصنيف أداء الطلاب في هذه المرحلة مؤقتًا على أنه منخفض أو متوسط ​​أو مرتفع ، اعتمادًا على عدد الإجابات الصحيحة على هذه العناصر التي تم تسجيلها تلقائيًا.

لم تختلف الكتل الأساسية المختلفة للمواد التي تم تسليمها للطلاب بأي طريقة ذات معنى في الصعوبة التي يواجهونها. ومع ذلك ، كانت المرحلة الأولى والثانية موجودة في شكلين مختلفين: سهل نسبيًا وصعبًا نسبيًا. الطلاب الذين أظهروا أداءً متوسطًا في المرحلة الأساسية كان من المرجح أن يتم تخصيص مرحلة سهلة أو صعبة. الطلاب الذين أظهروا أداءً منخفضًا في المرحلة الأساسية كانت لديهم فرصة بنسبة 90٪ في أن يتم تعيينهم في المرحلة الأولى السهلة وفرصة بنسبة 10٪ أن يتم تكليفهم بمرحلة صعبة 1. كان لدى الطلاب الذين أظهروا أداءً عاليًا في المرحلة الأساسية فرصة بنسبة 90٪ في أن يتم تعيينهم في مرحلة 1 صعبة وفرصة تعيينهم إلى مرحلة 1 سهلة بنسبة 10٪.

تم تعيين الطلاب في مجموعات المواد السهلة والصعبة للمرحلة الثانية بنفس الطريقة إلى حد كبير. من أجل تصنيف أداء الطلاب بأكبر قدر ممكن من الدقة ، تم استخدام الاستجابات للعناصر المسجلة تلقائيًا من كل من المرحلة الأساسية والمرحلة 1.

لمزيد من المعلومات حول اختبار PISA التكيفي ، راجع تقرير PISA 2018 الفني (منظمة التعاون الاقتصادي والتنمية قريبا).

7. ما هي الدول المشاركة في PISA؟

تشارك الدول في PISA ، وتشارك أنظمة التعليم داخل البلدان أيضًا في الدراسة. على سبيل المثال ، شاركت مدن ومناطق دولية في PISA في عام 2018 ، وشاركت الولايات الأمريكية في دورات PISA السابقة.

قائمة البلدان وأنظمة التعليم التي شاركت في كل دورة PISA متاحة على: http://nces.ed.gov/surveys/pisa/countries.asp.

8. كيف يقارن تقييم PISA مع TIMSS و NAEP؟

الهدف من PISA هو تمثيل نتائج التعلم وليس نتائج التعليم. من خلال التركيز على العمر ، تعتزم PISA إظهار ما تعلمه الأطفال في سن 15 عامًا داخل وخارج الفصل الدراسي طوال حياتهم ، وليس فقط في فصل دراسي معين. يوفر التركيز على سن 15 فرصة لقياس نتائج التعلم الواسعة بينما لا يزال يتعين على الطلاب عبر العديد من الدول المشاركة أن يكونوا في المدرسة. أخيرًا ، نظرًا لأن سنوات التعليم تختلف باختلاف البلدان وأنظمة التعليم ، فإن اختيار عينة قائمة على العمر يجعل المقارنات بين البلدان وأنظمة التعليم أسهل إلى حد ما.

تم تصميم PISA لقياس "معرفة القراءة والكتابة" على نطاق واسع ، في حين أن الاتجاهات في دراسة الرياضيات والعلوم الدولية (TIMSS) والتقييم الوطني للتقدم التعليمي (NAEP) لهما روابط أقوى بأطر المناهج الدراسية ويسعى إلى قياس إتقان الطلاب لمعارف ومهارات محددة والمفاهيم. يتم استخلاص محتوى PISA من مجالات محتوى واسعة ، مثل الأنظمة الحية والأنظمة الفيزيائية للعلوم ، على عكس المحتوى القائم على المناهج الدراسية الأكثر تحديدًا مثل البيولوجيا أو الفيزياء.

لمعرفة المزيد حول الاختلافات في المناهج ذات الصلة لتقييم الرياضيات والعلوم والقراءة بين PISA و TIMSS و NAEP ، انظر الأوراق التالية (ورقة تقارن NAEP و PISA 2015):

9. متى يتم جمع بيانات PISA في الولايات المتحدة؟

باستثناء دورة جمع البيانات الأولى في عام 2000 ، تجمع الولايات المتحدة بيانات PISA في خريف العام المحدد لجمع البيانات. تمت إدارة جمع بيانات PISA 2018 بين أكتوبر ونوفمبر 2018 في الولايات المتحدة.

10. متى يتم تحديد موعد تقديم برنامج التقييم الدولي للطلاب (PISA) بعد ذلك؟

وستكون الإدارة التالية لبرنامج التقييم الدولي للطلاب (PISA) في خريف عام 2021. وسيتم الإعلان عن النتائج في نهاية عام 2022.

11. هل تم الإبلاغ عن درجات PISA للطلاب الأفراد أم متاحة للتحليل؟


اختبار حلول الإعداد واختبار أمبير

تأكد من أن طريق الطلاب إلى النجاح مفتوح على مصراعيه. تتوافق أدوات الاختبار وأدلة الدراسة الخاصة بنا مع معايير الولاية والمعايير الوطنية ، وتساعدك على إعداد المتعلمين لمستقبل مشرق مليء بالفرص.

TestGen

قم بتنزيل بنك الاختبار الذي يتوافق مع كتاب Pearson المدرسي الخاص بك لإنشاء اختبارات واختبارات بسهولة تفي باحتياجات الدورة التدريبية الخاصة بك.

Limmer Creative Test Prep

تعرف على تطبيقات المراجعة المستندة إلى الويب هذه ، والتي تعد الطلاب للنجاح في اختبارات شهادة EMT و AEMT والمسعفين.

EMSTesting.com

يساعدك الاختبار التكيفي مع الكمبيوتر والامتحانات النهائية التي تم التحقق من صحتها ومولد الاختبار عبر الإنترنت والمزيد في إنشاء الاختبارات وإدارتها لطلاب خدمات الطوارئ الطبية (EMS).

الإعداد لاختبار ترخيص المعلم

استكشف أدلة الدراسة الإعدادية لاختبار ترخيص المعلم. تساعد الاختبارات التشخيصية وأدوات التقييم والمزيد المتعلمين في الاستعداد للامتحانات بثقة.

اختباري

يمكنك إنشاء الاختبارات والاختبارات وطباعتها بسهولة من خلال برنامج إنشاء الاختبارات الخاص بنا. أو قم بتأليف الأسئلة والاختبارات عبر الإنترنت لإدارة التقييمات بكفاءة في أي وقت وفي أي مكان.


ملاحظات إحصائية: اختبارات ذات وجه واحد أو وجهين للدلالة

في بعض المقارنات - على سبيل المثال ، بين وسيلتين أو نسبتين - هناك اختيار بين الاختبارين من جانب واحد أو من جانب واحد ذي الأهمية (جميع المقارنات بين ثلاث مجموعات أو أكثر ذات وجهين).

* هذه هي الثامنة في سلسلة من الملاحظات العرضية حول الإحصاءات الطبية.

عندما نستخدم اختبارًا ذا أهمية لمقارنة مجموعتين ، فإننا نبدأ عادةً بالفرضية الصفرية القائلة بأنه لا يوجد فرق بين المجموعات السكانية التي تأتي منها البيانات. إذا لم تكن هذه الفرضية صحيحة ، فيجب أن تكون الفرضية البديلة صحيحة - أي أن هناك فرقًا. نظرًا لأن الفرضية الصفرية لا تحدد اتجاهًا للاختلاف ولا الفرضية البديلة ، لذلك لدينا اختبار ذو وجهين. In a one sided test the alternative hypothesis does specify a direction - for example, that an active treatment is better than a placebo. This is sometimes justified by saying that we are not interested in the possibility that the active treatment is worse than no treatment. This possibility is still part of the test it is part of the null hypothesis, which now states that the difference in the population is zero or in favour of the placebo.

A one sided test is sometimes appropriate. Luthra et al investigated the effects of laparoscopy and hydrotubation on the fertility of women presenting at an infertility clinic.1 After some months laparoscopy was carried out on those who had still not conceived. These women were then observed for several further months and some of these women also conceived. The conception rate in the period before laparoscopy was compared with that afterwards. The less fertile a woman is the longer it is likely to take her to conceive. Hence, the women who had the laparoscopy should have a lower conception rate (by an unknown amount) than the larger group who entered the study, because the more fertile women had conceived before their turn for laparoscopy came. To see whether laparoscopy increased fertility, Luthra et al tested the null hypothesis that the conception rate after laparoscopy was less than or equal to that before. The alternative hypothesis was that the conception rate after laparoscopy was higher than that before. A two sided test was inappropriate because if the laparoscopy had no effect on fertility the conception rate after laparoscopy was expected to be lower.

One sided tests are not often used, and sometimes they are not justified. Consider the following example. Twenty five patients with breast cancer were given radiotherapy treatment of 50 Gy in fractions of 2 Gy over 5 weeks.2 Lung function was measured initially, at one week, at three months, and at one year. The aim of the study was to see whether lung function was lowered following radiotherapy. Some of the results are shown in the table, the forced vital capacity being compared between the initial and each subsequent visit using one sided tests. The direction of the one sided tests was not specified, but it may appear reasonable to test the alternative hypothesis that forced vital capacity decreases after radiotherapy, as there is no reason to suppose that damage to the lungs would increase it. The null hypothesis is that forced vital capacity does not change or increases. If the forced vital capacity increases, this is consistent with the null hypothesis, and the more it increases the more consistent the data are with the null hypothesis. Because the differences are not all in the same direction, at least one P value should be greater than 0.5. What has been done here is to test the null hypothesis that forced vital capacity does not change or decreases from visit 1 to visit 2 (nine week), and to test the null hypothesis that it does not change or increases from visit 1 to visit 3 (three months) or visit 4 (one year). These authors seem to have carried out one sided tests in both directions for each visit and then taken the smaller probability. If there is no difference in the population the probability of getting a significant difference by this approach is 10%, not 5% as it should be. The chance of a spurious significant difference is doubled. Two sided tests should be used, which would give probabilities of 0.26, 0.064, and 0.38, and no significant differences.

In general a one sided test is appropriate when a large difference in one direction would lead to the same action as no difference at all. Expectation of a difference in a particular direction is not adequate justification. In medicine, things do not always work out as expected, and researchers may be surprised by their results. For example, Galloe et al found that oral magnesium significantly increased the risk of cardiac events, rather than decreasing it as they had hoped.3 If a new treatment kills a lot of patients we should not simply abandon it we should ask why this happened.

Two sided tests should be used unless there is a very good reason for doing otherwise. If one sided tests are to be used the direction of the test must be specified in advance. One sided tests should never be used simply as a device to make a conventionally non-significant difference significant.


What are Mathematical and Statistical Models

These types of models are obviously related, but there are also real differences between them.

Mathematical Models: grow out of equations that determine how a system changes from one state to the next (differential equations) and/or how one variable depends on the value or state of other variables (state equations) These can also be divided into either numerical models or analytical models.

As a way to clarify the above ideas, here is an example of the development of a simple mathematical model.


Statistical Questions (Grade 6)

These lessons help Grade 6 students learn how to recognize a statistical question as one that anticipates variability in the data related to the question and accounts for it in the answers.

Common Core: 6.SP.1

Suggested Learning Targets

  • I can recognize that data has variability.
  • I can recognize a statistical question (examples versus non-examples).

6.SP.1 Statistical Vs. Non-Statistical Questions < The following table gives some examples of statistical questions and non-statistical questions. Scroll down the page for more examples and solutions.

A statistical question is a question that should have different answers.

How to recognize a statistical question?

  • A question is not a statistical question if it has an exact answer. For example &ldquoHow old are you?&rdquo
  • A question is a statistical question if the answer is a percent, range, or an average. For example &ldquoHow old are the students in this room&rdquo

Identify which questions are statistical and which questions are not statistical.
• What is the favorite menu item for customers in the local restaurant?
• What time do most people eat their lunches?
• What did my dad eat for lunch today?
• What do 7th graders prefer to eat for lunch?

In a survey about practice time per week for high school athletes, 22% practice 1 hour, 40% practice 2 hours, 25% practice 3 hours, 10% practice 4 hours and 3% practice more than 4 hours.
Which one question is the most likely to have produced these results?
• What is the average practice time per week required by your sport?
• How much time do you spend doing homework during the week?
• Is practice time longer on Mondays than Tuesdays?
• Which sport practices the most?

Jessica conducted a survey using a representative sample of 50 customers from three local landscaping businesses in town. She found that 30% purchased maple trees, 24% purchased dogwoods, 20% purchased oaks, 16% purchased pines and 10% chose other types of trees.
Which statements about the survey that Jessica conducted are most likely to be true? Select all that apply.
• Jessica surveyed only the customers who purchased a tree.
• Jessica asked customers what type of tree they purchased.
• Jessica asked customers what type of plants they have in their yards.
• The sample consists of 50 customers from three local landscaping businesses in town.
• The population Jessica wants to know about consists of any customer of any landscaping business.

What Is A Statistical Question?

Definition: A statistical question has answers that will probably vary. Usually a statistical question will ask about a population of multiple people, events or things.

Examples Of Statistical Questions

  • What time did the students in this class get up this morning?
  • How many votes did the winning candidate for the Presidents of the Student Body receive in each of the past 20 years?
  • What were the high temperatures in all of the Latin American capitals today?

Examples Of Non-Statistical Questions

  • What time did I get up this morning?
  • How many votes did the winning candidate for the Student Body receive this year?
  • What was the high temperature in Mexico City today?

Statistical And Non-Statistical Questions

أمثلة:
Which of the following are statistical questions?

  • How old are the people who have watched this video in 2013?
  • Do dogs run faster than cats?
  • Do wolves weigh more than dogs?
  • Does your dog weigh more than that wolf?
  • Does it rain more in Seattle than Singapore?
  • What was the difference in rainfall between Singapore and Seattle in 2013?
  • In general, will I use less gas driving at 55 mph than 70 mph?
  • Do English professors get paid less than math professors?
  • Does the most highly paid English professor at Harvard get paid more that the most highly paid math professor in MIT?

Statistical Questions - Common Core Standard

Students must know variability refers to the spread of data.

Try the free Mathway calculator and problem solver below to practice various math topics. Try the given examples, or type in your own problem and check your answer with the step-by-step explanations.

We welcome your feedback, comments and questions about this site or page. Please submit your feedback or enquiries via our Feedback page.


Note: The functions do not require the data given to them to be sorted. However, for reading convenience, most of the examples show sorted sequences.

Return the sample arithmetic mean of البيانات which can be a sequence or iterable.

The arithmetic mean is the sum of the data divided by the number of data points. It is commonly called “the average”, although it is only one of many different mathematical averages. It is a measure of the central location of the data.

إذا البيانات is empty, StatisticsError will be raised.

The mean is strongly affected by outliers and is not a robust estimator for central location: the mean is not necessarily a typical example of the data points. For more robust measures of central location, see median() and mode() .

The sample mean gives an unbiased estimate of the true population mean, so that when taken on average over all the possible samples, mean(sample) converges on the true mean of the entire population. إذا البيانات represents the entire population rather than a sample, then mean(data) is equivalent to calculating the true population mean μ.

Convert البيانات to floats and compute the arithmetic mean.

This runs faster than the mean() function and it always returns a float . ال البيانات may be a sequence or iterable. If the input dataset is empty, raises a StatisticsError .

Convert البيانات to floats and compute the geometric mean.

The geometric mean indicates the central tendency or typical value of the البيانات using the product of the values (as opposed to the arithmetic mean which uses their sum).

Raises a StatisticsError if the input dataset is empty, if it contains a zero, or if it contains a negative value. ال البيانات may be a sequence or iterable.

No special efforts are made to achieve exact results. (However, this may change in the future.)

Return the harmonic mean of البيانات, a sequence or iterable of real-valued numbers.

The harmonic mean, sometimes called the subcontrary mean, is the reciprocal of the arithmetic mean() of the reciprocals of the data. For example, the harmonic mean of three values أ, ب و ج will be equivalent to 3/(1/a + 1/b + 1/c) . If one of the values is zero, the result will be zero.

The harmonic mean is a type of average, a measure of the central location of the data. It is often appropriate when averaging rates or ratios, for example speeds.

Suppose a car travels 10 km at 40 km/hr, then another 10 km at 60 km/hr. What is the average speed?

Suppose an investor purchases an equal value of shares in each of three companies, with P/E (price/earning) ratios of 2.5, 3 and 10. What is the average P/E ratio for the investor’s portfolio?

StatisticsError is raised if البيانات is empty, or any element is less than zero.

The current algorithm has an early-out when it encounters a zero in the input. This means that the subsequent inputs are not tested for validity. (This behavior may change in the future.)

Return the median (middle value) of numeric data, using the common “mean of middle two” method. إذا البيانات is empty, StatisticsError is raised. البيانات can be a sequence or iterable.

The median is a robust measure of central location and is less affected by the presence of outliers. When the number of data points is odd, the middle data point is returned:

When the number of data points is even, the median is interpolated by taking the average of the two middle values:

This is suited for when your data is discrete, and you don’t mind that the median may not be an actual data point.

If the data is ordinal (supports order operations) but not numeric (doesn’t support addition), consider using median_low() or median_high() instead.

statistics. median_low ( البيانات ) ¶

Return the low median of numeric data. إذا البيانات is empty, StatisticsError is raised. البيانات can be a sequence or iterable.

The low median is always a member of the data set. When the number of data points is odd, the middle value is returned. When it is even, the smaller of the two middle values is returned.

Use the low median when your data are discrete and you prefer the median to be an actual data point rather than interpolated.

statistics. median_high ( البيانات ) ¶

Return the high median of data. إذا البيانات is empty, StatisticsError is raised. البيانات can be a sequence or iterable.

The high median is always a member of the data set. When the number of data points is odd, the middle value is returned. When it is even, the larger of the two middle values is returned.

Use the high median when your data are discrete and you prefer the median to be an actual data point rather than interpolated.

statistics. median_grouped ( البيانات, interval=1 ) ¶

Return the median of grouped continuous data, calculated as the 50th percentile, using interpolation. إذا البيانات is empty, StatisticsError is raised. البيانات can be a sequence or iterable.

In the following example, the data are rounded, so that each value represents the midpoint of data classes, e.g. 1 is the midpoint of the class 0.5–1.5, 2 is the midpoint of 1.5–2.5, 3 is the midpoint of 2.5–3.5, etc. With the data given, the middle value falls somewhere in the class 3.5–4.5, and interpolation is used to estimate it:

Optional argument interval represents the class interval, and defaults to 1. Changing the class interval naturally will change the interpolation:

This function does not check whether the data points are at least interval apart.

CPython implementation detail: Under some circumstances, median_grouped() may coerce data points to floats. This behaviour is likely to change in the future.

“Statistics for the Behavioral Sciences”, Frederick J Gravetter and Larry B Wallnau (8th Edition).

The SSMEDIAN function in the Gnome Gnumeric spreadsheet, including this discussion.

Return the single most common data point from discrete or nominal البيانات. The mode (when it exists) is the most typical value and serves as a measure of central location.

If there are multiple modes with the same frequency, returns the first one encountered in the البيانات. If the smallest or largest of those is desired instead, use min(multimode(data)) or max(multimode(data)) . If the input البيانات is empty, StatisticsError is raised.

mode assumes discrete data and returns a single value. This is the standard treatment of the mode as commonly taught in schools:

The mode is unique in that it is the only statistic in this package that also applies to nominal (non-numeric) data:

Changed in version 3.8: Now handles multimodal datasets by returning the first mode encountered. Formerly, it raised StatisticsError when more than one mode was found.

Return a list of the most frequently occurring values in the order they were first encountered in the البيانات. Will return more than one result if there are multiple modes or an empty list if the البيانات is empty:

Return the population standard deviation (the square root of the population variance). See pvariance() for arguments and other details.

Return the population variance of البيانات, a non-empty sequence or iterable of real-valued numbers. Variance, or second moment about the mean, is a measure of the variability (spread or dispersion) of data. A large variance indicates that the data is spread out a small variance indicates it is clustered closely around the mean.

If the optional second argument mu is given, it is typically the mean of the البيانات. It can also be used to compute the second moment around a point that is not the mean. If it is missing or None (the default), the arithmetic mean is automatically calculated.

Use this function to calculate the variance from the entire population. To estimate the variance from a sample, the variance() function is usually a better choice.

If you have already calculated the mean of your data, you can pass it as the optional second argument mu to avoid recalculation:

Decimals and Fractions are supported:

When called with the entire population, this gives the population variance σ². When called on a sample instead, this is the biased sample variance s², also known as variance with N degrees of freedom.

If you somehow know the true population mean μ, you may use this function to calculate the variance of a sample, giving the known population mean as the second argument. Provided the data points are a random sample of the population, the result will be an unbiased estimate of the population variance.

Return the sample standard deviation (the square root of the sample variance). See variance() for arguments and other details.

Return the sample variance of البيانات, an iterable of at least two real-valued numbers. Variance, or second moment about the mean, is a measure of the variability (spread or dispersion) of data. A large variance indicates that the data is spread out a small variance indicates it is clustered closely around the mean.

If the optional second argument xbar is given, it should be the mean of البيانات. If it is missing or None (the default), the mean is automatically calculated.

Use this function when your data is a sample from a population. To calculate the variance from the entire population, see pvariance() .

Raises StatisticsError if البيانات has fewer than two values.

If you have already calculated the mean of your data, you can pass it as the optional second argument xbar to avoid recalculation:

This function does not attempt to verify that you have passed the actual mean as xbar. Using arbitrary values for xbar can lead to invalid or impossible results.

Decimal and Fraction values are supported:

This is the sample variance s² with Bessel’s correction, also known as variance with N-1 degrees of freedom. Provided that the data points are representative (e.g. independent and identically distributed), the result should be an unbiased estimate of the true population variance.

If you somehow know the actual population mean μ you should pass it to the pvariance() function as the mu parameter to get the variance of a sample.

Divide البيانات into ن continuous intervals with equal probability. Returns a list of n - 1 cut points separating the intervals.

جلس ن to 4 for quartiles (the default). جلس ن to 10 for deciles. جلس ن to 100 for percentiles which gives the 99 cuts points that separate البيانات into 100 equal sized groups. Raises StatisticsError if ن is not least 1.

ال البيانات can be any iterable containing sample data. For meaningful results, the number of data points in البيانات should be larger than ن. Raises StatisticsError if there are not at least two data points.

The cut points are linearly interpolated from the two nearest data points. For example, if a cut point falls one-third of the distance between two sample values, 100 and 112 , the cut-point will evaluate to 104 .

ال method for computing quantiles can be varied depending on whether the البيانات includes or excludes the lowest and highest possible values from the population.

The default method is “exclusive” and is used for data sampled from a population that can have more extreme values than found in the samples. The portion of the population falling below the i-th من م sorted data points is computed as i / (m + 1) . Given nine sample values, the method sorts them and assigns the following percentiles: 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%.

وضع method to “inclusive” is used for describing population data or for samples that are known to include the most extreme values from the population. The minimum value in البيانات is treated as the 0th percentile and the maximum value is treated as the 100th percentile. The portion of the population falling below the i-th من م sorted data points is computed as (i - 1) / (m - 1) . Given 11 sample values, the method sorts them and assigns the following percentiles: 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%.