1 of 29

Capítulo 8�

Prueba de hipótesis:�Comprobación de hipótesis sobre dos medias muestrales�

2 of 29

Contorno�

  • ¿Qué es la prueba de hipótesis (significación)?�Modelo de cinco pasos para organizar la prueba de hipótesis� Prueba Z para dos muestras�Prueba T para dos muestras�Una prueba de una cola frente a una de dos colas�Errores de Tipo I y Tipo II y selección del nivel alfa

3 of 29

¿Qué es la prueba de hipótesis (significación)?�

  • Otra aplicación de la estadística inferencial�¿Es la diferencia entre dos muestras lo suficientemente grande como para permitirnos concluir (con una probabilidad de error conocida) que las poblaciones representadas por las muestras son significativamente diferentes?�Por ejemplo, ¿difieren significativamente los hombres y las mujeres en Estados Unidos en su apoyo al control de armas?�¿Qué es significativo? Cuando la diferencia entre las muestras no se debe únicamente al azar

4 of 29

Ejemplo: Comprobación de hipótesis sobre dos medias muestrales �

  • Prueba Z�Muestra grande (>100)

Pregunta de investigación: �En Estados Unidos, ¿diferían los hombres y las mujeres en sus actitudes hacia el control de armas? �

5 of 29

Example cont.

  • Muestra 1 (Hombres)� x1̅ = 6.2� S1 = 1,3� N1 = 324�Muestra 2 (Mujeres)� x2̅ = 6.5� S2 = 1,4� N2 = 317

6 of 29

Modelo de cinco pasos para organizar la prueba de hipótesis (prueba Z)�

Debe seguir estos pasos:�

  1. Haga suposiciones y cumpla con los requisitos de la prueba.�Enuncia las hipótesis. �Seleccione la distribución de muestreo y determine la región crítica.�Calcule el estadístico de prueba.�Toma una decisión e interpreta los resultados.�

7 of 29

1. Hacer suposiciones y cumplir con los requisitos de la prueba

    • Muestras aleatorias independientes�Las muestras deben ser independientes entre sí. �El nivel de medición es la relación de intervalo�Las actitudes hacia el control de armas deben medirse a nivel de relación de intervalo�La distribución de muestreo es normal en forma� N > 100 casos, por lo que se aplica el Teorema del Límite Central y podemos asumir una forma normal.

8 of 29

2. Planteamiento de las hipótesis

  • Hipótesis nula�Hipótesis de investigación

9 of 29

2. Planteamiento de las hipótesis

Hipótesis nula (H0): �

Example:

H0: μ1 = μ2

    • En Estados Unidos, en 2006, los hombres no tendían a diferir de las mujeres en cuanto a las actitudes hacia el control de armas.

- Una hipótesis estadística que uno suele esperar rechazar�- Siempre se expresa en términos de parámetro de población�- Declaración de "sin efecto" o "sin diferencia"�- Esta es una hipótesis que se pone a prueba�

10 of 29

2. Enunciado de la hipótesis

Hipótesis de investigación (H1):�

Can take one of three forms:

1. H1: μ1 ≠ μ2 (non-directional, two-tailed test)

In the U.S. in 2006, men did tend to differ from women on the attitudes toward gun control.

2. H1: μ1 > μ2 (directional, one-tailed test)

In the U.S. in 2006, men were more likely to support gun control than women.

3. H1: μ1 < μ2 (directional, one-tailed test)

In the U.S. in 2006, men were less likely to support gun control than women.

Example: H1: μ1 ≠ μ2

- Un enunciado que contradiga directamente la hipótesis nula�- Lo que el investigador quiere demostrar o sospecha es cierto�- Una declaración que refleje la hipótesis sustantiva que uno no espera rechazar�- Expresado en términos de parámetros poblacionales��

11 of 29

3. Selección de la distribución de muestreo y establecimiento de la región crítica

  • Hay varias distribuciones de muestreo diferentes�Prestaremos atención a la distribución muestral descrita por la curva normal estándar (en forma de campana, perfectamente simétrica)�En este caso, la distribución z (porque nuestra muestra es mayor que 100)

12 of 29

3. Establecimiento de la región crítica (región de rechazo)

Example:

Establezcamos alfa o α= 0.05 y encontremos la puntuación Z �asociado con este nivel alfa. A esto se le llama�Z(crítico), y marca el comienzo de la crítica �región (encuentre el valor de alfa en la tabla de distribución Z, columna c,�en este caso ± 1,96).

- Área bajo la distribución de muestreo que incluye resultados de muestra poco probables�- La región crítica se notifica como alfa (α)�- El nivel alfa es el riesgo que estamos dispuestos a asumir de rechazar la hipótesis nula cuando en realidad es cierta�- Niveles alfa comunes: 0,05, 0,01. 0.001�- Convierte el alfa en una puntuación Z para encontrar el comienzo de la región crítica�

13 of 29

3. Establecimiento de la región crítica

Cualquier resultado de la muestra que caiga en las áreas sombreadas (más allá de la puntuación z crítica de ± 1,96) tiene una probabilidad de ocurrencia inferior a 0,05. Tal resultado sería un resultado de muestra poco probable y nos haría rechazar el H0�

14 of 29

4. Cálculo de la estadística de prueba

A continuación, tenemos que calcular la estimación agrupada del error estándar:

Y Z(obtenido):

15 of 29

4. Cálculo de la estadística de prueba cont.

Estimación agrupada del error estándar (σx̅ - x̅ )

σx̅ - x̅ =√(s1²/N1-1)+ (s2²/N2-1)

σx̅ - x̅ = √0.0114

σx̅ - x̅ = 0.107

Z(obtenido) = x1̅ - x2̅

(σx̅ - x̅ )

Z(obtenido) = (6.2 -6.5)/0.107

Z(obtenido) = -2.80

16 of 29

5. Tomar una decisión e interpretar los resultados

Decisión:�El estadístico de prueba (-2.80) cae en la región crítica, por lo tanto, rechazamos la hipótesis nula�Interpretación:�Parece que, en promedio, los hombres y las mujeres en los EE. UU. difieren entre sí en sus actitudes hacia el control de armas.

¿Rechazamos la hipótesis nula?�Sí, porque Z(obtenido) cae en la región crítica�

17 of 29

Una prueba de una cola frente a una prueba de dos colas�

Si el investigador no está seguro de la dirección de la �Relación = prueba de dos colas�H0: μ1 = μ2�En Estados Unidos, los hombres no tendían a diferir de las mujeres en cuanto a las actitudes hacia el control de armas.�Si el investigador se preocupa sólo por las diferencias en un�Dirección específica = prueba de una cola �H1: μ1 > μ2 (prueba direccional de una cola)�En Estados Unidos, los hombres eran más propensos a apoyar el control de armas que las mujeres.�H1: μ1 < μ2 (prueba direccional de una cola)�En Estados Unidos, los hombres eran menos propensos a apoyar el control de armas que las mujeres.�

18 of 29

19 of 29

Ejemplo: Comprobación de hipótesis sobre dos medias muestrales �

  • Prueba T�Muestra pequeña (<100)

Pregunta de investigación: � En los Estados Unidos, ¿las familias de los suburbios tenían significativamente menos hijos que las familias del centro de la ciudad?�

20 of 29

Ejemplo cont.

  • Ejemplo 1 (Suburbano)

x1̅ = 2.37

S1 = 0.63

N1 = 42

  • Ejemplo 2 (Centro de la ciudad)

x1̅ = 2.78

S2 = 0.95

N2 = 37

21 of 29

Modelo de cinco pasos para organizar la prueba de hipótesis (prueba T)�

Es necesario seguir estos pasos::

  1. Haga suposiciones y cumpla con los requisitos de la prueba.�Enuncia las hipótesis. �Seleccione la distribución de muestreo y determine la región crítica.�Calcule el estadístico de prueba.�Tomar una decisión e interpretar los resultados.

22 of 29

1. Hacer suposiciones y cumplir con los requisitos de la prueba

    • Muestras aleatorias independientes�Las muestras deben ser independientes entre sí. �El nivel de medición es la relación de intervalo�El número de hijos es intervalo-ratio�La distribución de muestreo es normal en forma

23 of 29

2. Enunciar la hipótesis nula y la hipótesis de investigación

  • H0: μ1 = μ2
    • En los Estados Unidos, las familias de los suburbios no tendían a diferir de las familias del centro de la ciudad en su número de hijos.�H1: μ1 < μ2
    • En los EE.UU., las familias suburbanas tendían a tener menos hijos que las familias del centro de la ciudad (hipótesis direccional, prueba de 1 cola)

24 of 29

3. Seleccione la distribución de muestreo y establezca la región crítica

  • Distribución de muestreo = distribución t (porque el tamaño de la muestra combinada es pequeño)�Alpha (α) = 0.05
  • Grados de libertad (df)= N1 + N2 – 2 = � 42 +37 – 2 = 77�t (crítico) = - 1.671 (encuentre el valor en la tabla de distribución t)

25 of 29

4. Calcular la estadística de prueba �

Estimación agrupada del error estándar (σx̅ - x̅ )�σx̅ - x̅ =√(N1s1²+N2s2²)/(N1 +N2-2)* √(N1+N2/ N1N2)

σx̅ - x̅ = (0.81)(0.23)

σx̅ - x̅ = 0.19

t(obtenido) = x1̅ - x2̅ � (σx̅ - x̅ )�t(obtenido) = (2,37-2,78)/0,19�t(obtenido) = -2.16�

26 of 29

5. Tomar una decisión e interpretar los resultados

  • Decisión:�El estadístico de prueba (-2.16) cae en la región crítica, por lo que rechazamos la hipótesis nula�Interpretación:�Al parecer, en promedio, en 2006, las familias de los suburbios tendían a tener menos hijos que las familias del centro de la ciudad.

¿Rechazamos la hipótesis nula?�Sí, porque t(obtenido) cae en la región crítica�

27 of 29

Nivel alfa: Errores de tipo I y II a: Errores de tipo I y II

La verdad sobre la población�

Decisión �Basado en la muestra�

Reject H0

H0True�

H1True�

Error de tipo I (la probabilidad de rechazar la hipótesis nula cuando en realidad es verdadera. �

Decisión correcta�

No rechazar H0

Decisión correcta�

Error de tipo II (La probabilidad de no rechazar la hipótesis nula, cuando en realidad es falsa. �

28 of 29

Selección de un nivel alfa�

  • Error de tipo I (error alfa): Rechazar la hipótesis nula de que no hay diferencia cuando en realidad es verdadera. �Error de tipo II: Es no rechazar la hipótesis nula de no diferencia cuando en realidad es falsa. �Controlamos el riesgo de error de tipo I mediante la manipulación de alfa�Sin embargo, a medida que reducimos el riesgo de error de tipo I, aumentamos el riesgo de error de tipo II

29 of 29

Selección de un nivel alfa�

Cuanto más bajo sea el nivel alfa:�Cuanto menor sea la probabilidad de error de tipo I�Cuanto más difícil es rechazar el H0 �Cuanto más pequeña es la región crítica�