Repasando el concepto de estadística inferencial, tenemos que tener en cuenta que se basa en una generalización desde lo particular (muestra) a lo general (población).
La muestra puede ser:
- Independiente: obtenida tras una única observación. Ej: estudio para conocer el patrón de alimentación en población escolar.
- Dependiente o apareada: comparan el mismo grupo de sujetos en dos tiempos diferentes.
Ej: comparar una variable en un grupo de sujetos antes y después de una intervención quirúrgica.
Dos formas de inferencia estadística:
- ESTIMACIÓN DE PARÁMETROS POBLACIONALES (Puntual o Por intervalos)
- CONTRASTE DE HIPÓTESIS (lo trataremos en los siguientes temas)
- ESTIMACIÓN PUNTUAL: consideramos el valor del estadístico muestral como estimación del parámetro poblacional. Ej: si el valor medio de colesterol en una muestra de pacientes es de 180.48, diríamos que ese es el valor medio en la población.
- ESTIMACIÓN POR INTERVALOS: establecemos un intervalo de confianza y mediríamos la probabilidad de que el parámetro poblacional se encuentre entre estos dos valores que delimitan el IC. Los IC los podemos establecer para el estudio de cualquier parámetro de la población. El límite superior e inferior del IC son denominados límites de confianza.
- Error Estándar de la Media (EEM): mide la dispersión hipotética que tendrían las medias de infinitas muestras de una población determinada. Depende de desviación típica (S) y tamaño muestral (n). (Si ↑ n, ↓ EEM)
- Error Estándar para una Proporción (EEP): se aplica cuando las variables a estudiar son cualitativas (atributos), no se pueden cuantificar para obtener sus medias aritméticas. Siendo P el porcentaje o proporción a estimar.
TEOREMA CENTRAL DEL LÍMITE:
Establece que si una muestra es suficientemente grande (+ de 30 sujetos) de la población, la distribución de las medias muestrales tienden a tener una distribución normal. Si el tamaño muestral aumenta, la media muestral se aproxima también a la media poblacional. Conseguir que la distribución sea normal es muy útil porque es fácil de aplicar en el contraste de hipótesis y establecer IC.
Intervalos de Confianza:
- De 95%: Z=1,96. X: media.
- De 99%: Z= 2.58. X: media.
Ej: estudio
para conocer si una determinada dieta reduce los valores medios de glucemia de
las mujeres embarazadas de una determinada zona básica de salud y el error
estándar de la media ha sido de 4.
El
valor medio de colesterol en una muestra de pacientes es de 180.48, diríamos
que este es el valor medio de colesterol en la población.
IC 95% = 180.48 ± (1.96 x 4) =
180.48 ± 7.84 = (172.64 ≥ μ ≤ 188.32)
Podemos afirmar que, con un 95% de probabilidad, el verdadero valor de la media poblacional está entre 172.64 y 188.32.
IC 99% = 180.48 ± (2.57x4) = 180.48 ± 10.28 = (170.2 ≥ μ ≤ 190.76)