domingo, 24 de mayo de 2020

TEMA 9: INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS.


Repasando el concepto de estadística inferencial, tenemos que tener en cuenta que se basa en una generalización desde lo particular (muestra) a lo general (población).

La muestra puede ser:
  • Independiente: obtenida tras una única observación. Ej: estudio para conocer el patrón de alimentación en población escolar.
  • Dependiente o apareada: comparan el mismo grupo de sujetos en dos tiempos diferentes. 
            Ej: comparar una variable en un grupo de sujetos antes y después de una intervención quirúrgica. 

Dos formas de inferencia estadística:

  1. ESTIMACIÓN DE PARÁMETROS POBLACIONALES (Puntual o Por intervalos)
  2. CONTRASTE DE HIPÓTESIS (lo trataremos en los siguientes temas)



  • ESTIMACIÓN PUNTUAL: consideramos el valor del estadístico muestral como estimación del parámetro poblacional. Ej: si el valor medio de colesterol en una muestra de pacientes es de 180.48, diríamos que ese es el valor medio en la población.
  • ESTIMACIÓN POR INTERVALOS: establecemos un intervalo de confianza y mediríamos la probabilidad de que el parámetro poblacional se encuentre entre estos dos valores que delimitan el IC. Los IC los podemos establecer para el estudio de cualquier parámetro de la población. El límite superior e inferior del IC son denominados límites de confianza. 
Es importante que tengamos en cuenta el Error Estándar de cualquier estimador (EE) que mediría la variabilidad en sus valores en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.
  • Error Estándar de la Media (EEM): mide la dispersión hipotética que tendrían las medias  de infinitas muestras de una población determinada. Depende de desviación típica (S) y tamaño muestral (n). (Si ↑ n, ↓ EEM)

  • Error Estándar para una Proporción (EEP): se aplica cuando las variables a estudiar son cualitativas (atributos), no se pueden cuantificar para obtener sus medias aritméticas. Siendo P el porcentaje o proporción a estimar.

TEOREMA CENTRAL DEL LÍMITE:

Establece que si una muestra es suficientemente grande (+ de 30 sujetos) de la población, la distribución de las medias muestrales tienden a tener una distribución normal. Si el tamaño muestral aumenta, la media muestral se aproxima también a la media poblacional. Conseguir que la distribución sea normal es muy útil porque es fácil de aplicar en el contraste de hipótesis y establecer IC.

Intervalos de Confianza: 

  • De 95%: Z=1,96.  X: media.

  • De 99%: Z= 2.58. X: media.
        Ej: estudio para conocer si una determinada dieta reduce los valores medios de glucemia de las mujeres embarazadas             de una determinada zona básica de salud y el error estándar de la media ha sido de 4.

         El valor medio de colesterol en una muestra de pacientes es de 180.48, diríamos que este es el valor medio de colesterol             en la población. 
IC 95% = 180.48 ± (1.96 x 4) = 180.48 ± 7.84 = (172.64 ≥ μ ≤ 188.32)

      Podemos afirmar que, con un 95% de probabilidad, el verdadero valor de la   media poblacional está entre 172.64 y 188.32. 


IC 99% = 180.48 ± (2.57x4) = 180.48 ± 10.28 = (170.2 ≥ μ ≤ 190.76)




sábado, 23 de mayo de 2020

TEMA 8: TEORÍA DE MUESTRAS

Este tema es un resumen del tema 3 que ya os publiqué, así que sólo profundizaré en algunos conceptos que sólo mencioné en su momento.

LA MUESTRA DEBE SER:
  • Representativa de la población diana de la que procede
  • De un tamaño adecuado
  • Comparable, de forma que se puedan comparar un grupo que ha sido expuesto a un factor y otro que no lo ha sido.
Los tipos de muestreo ya quedaron explicados, pero añadiré algunos detalles a tener en cuenta de alguno de ellos: 

M. CONSECUTIVO (no probabilístico): Es el más usado

M. DE CONVENIENCIA O ACCIDENTAL (no probabilístico):Selección de sujetos que son accesibles para el investigador. Las técnicas son menos sólidas, se usa mucho y es necesario que lo fenómenos que se quieran estudiar, sean homogéneos en la población ara evitar sesgos.

Ejemplo: en una calle determinada se les pregunta a los sujetos que pasan por ahí sobre los servicios sanitarios.

M. INTENCIONAL O A CRITERIO (no probabilístico):Se aplica a menudo cuando queremos obtener muestras de expertos.

ESTOS DOS ÚLTIMOS MÉTODOS SON LOS MÁS USADOS EN INVESTIGACIÓN CUALITATIVA

M. BOLA DE NIEVE (no probabilístico): nos permite acceder a personas difíciles de identificar por ejemplo pertenecientes a poblaciones marginales.

TAMAÑO DE LA MUESTRA: es necesario hacer el cálculo del tamaño muestral para evitar dos situaciones: 
  • Estudio con un nº insuficiente de sujetos. No seríamos precisos al estimar parámetros y no encontraríamos diferencias significativas cuando en realidad sí existen. ERROR TIPO II.
  • Estudio con nº innecesario de sujetos de pacientes. Pérdida de tiempo y uso de recursos innecesarios.
PARA EL CÁLCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR LA MEDIA DE UNA POBLACIÓN: n= Z 2 x S 2 /e 2
  • Necesitamos valores de 
  • Los demás datos los fija el investigador 
Si     Si no tenemos valor de S² realizaríamos una aproximación: determinar las              diferencias entre valores máx. y mín. y dividimos entres 4 = nº aprox. a desviación     típica: S. 

PARA EL CÁLCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR UNA PROPORCIÓN:
                                                     
  • Necesitamos el valor de p, los demás son fijados por el investigador.
  • Si no tuviéramos esos datos, consideraríamos que el parámetro (p) estará en la mitad de los sujetos estudiados → máxima indeterminación.
  • Inconvenientes: estudiaríamos un alto nº de sujetos con respecto al necesario para garantizar la representatividad de la muestra.

¡Espero que este recordatorio sirva de ayuda!


miércoles, 20 de mayo de 2020

TEMA 7: TEORÍA DE LA PROBABILIDAD

Teniendo en cuenta que la probabilidad es muy usada en nuestra vida diaria, es importante conocer qué teorías o formas existen para representar unos casos u otros.
La probabilidad se mide con números entre 0-1 o lo que es lo mismo, en porcentajes (%). Cuanto más probable es que ocurra un evento, más próxima a 1 o a 100% estará su medida de ocurrencia.
La probabilidad de un suceso imposible: 0

PROBABILIDAD CLÁSICA/A PRIORI: la fórmula a aplicar es la indicada en el esquema anterior.

Un evento puede ocurrir de N formas (se excluyen mutuamente y son igual de probables), si m de estos eventos tienen características E, la probabilidad de ocurrencia de E= m/N.

Ejemplo: la probabilidad de que salga un numero en un dado es 1/6 = 0,16 = 16%. En este caso la Frecuencia relativa o probabilidad a posteriori (valor real del suceso) es la misma que la probabilidad a priori. 

  • LEY DE LOS GRANDES NÚMEROS: la probabilidad real de que salga un número en un dado puede no ocurrir, pero si tiramos muchas veces el dado, la F. relativa de dicho suceso tiende a estabilizarse en torno al valor a priori.
PROBABILIDAD RELATIVA O A POSTERIORI: si al tirar un dado repetidas veces(E), uno de los números (m) se repite más, la frecuencia relativa de esta ocurrencia (m/N) es casi igual a la probabilidad de ocurencia de E: P(E)=m/N. Siendo la F. relativa o probabilidad a posteriori: nº veces obtenido el resultado/nº repeticiones experimento.

PROBABILIDAD SUBJETIVA/PERSONALÍSTICA: 

Mide la confianza que el individuo tiene sobre la certeza de una proposición determinada.

Ejemplo: epidemiólogos se basan en la experiencia para afirmar que en el próximo invierno, la epidemia de la gripe tendrá una probabilidad del 0,0018 = 180 casos por cada 100.000 habitantes.

  • ESTADÍSTICA BAYESIANA/ TEOREMA DE BAYES: expresa probabilidad condicional de un evento aleatorio A dado B. Vincula la probabilidad de A dado B con la probabilidad de B dado A. Ej: probabilidad de dolor de cabeza cuando tenemos gripe y probabilidad de tener gripe si se tiene dolor de cabeza.

EVENTOS O SUCESOS: 

El conjunto de todos los resultados posibles de un experimento: espacio muestral (S)

Suceso o evento: subconjunto de dichos resultados. Ej: veces que sale la cara de una moneda.

Evento complementario de un suceso A (Ac): elementos que no están en A. Ej: salir cruz en la moneda.

Evento de unión de A y B: resultados que están en A o B, incluye los que están en ambos. Ej: A=ser mujer, B=ser rubia, AUB: suma de ser mujer o suma de ser rubia. 

Evento insercción de A y B: elementos que están entre A y B, es decir, poseer las dos características. Ej:  la suma de ser mujer  (A) y ser rubia (B) =AΩB



PROPIEDADES DE LAS PROBABILIDADES: 

  • 2 sucesos se excluyen mutuamente: 


  • 2 sucesos no se excluyen mutuamente: 

  • A y B son eventos independientes: 



DISTRIBUCIÓN DE PROBABILIDAD EN VARIABLES DISCRETAS: BINOMIAL Y POISSON


  • D. BINOMIAL: se aplica cuando existen solo 2 posibilidades. Ej: cara o cruz. Probabilidad  de A es constante.
P: probabilidad de que ocurra
q: probabilidad de que no ocurra
X: nº sucesos favorables
N: nº total de ensayos.


  • D. POISSON: distribución de probabilidad de casos raros.


DISTRIBUCIÓN NORMAL: de Gauss o Gaussiana (lo expliqué en en el tema 5)🧐


TIPIFICACIÓN DE VALORES EN UNA NORMAL Y SU RELACIÓN CON CAMPANA DE GAUSS


  • Cuando usamos variables continuas con una distribución normal y tiene más de 100 unidades.
  • Nos permite conocer si otro valor corresponde o no a esa distribución de frecuencia.
                 La media coincide con lo más alto de la campana: 8
                • La desviación típica es de 2 puntos
            El 50% tiene puntuaciones>8
            El 50% tiene puntuaciones<8
      Aproximadamente el 68% puntúa entre 6 y 10
        media +/- 1 desviación típica: 68%

–  8+/-1: 6-10

        Media +/- 2 desviación típica: 95%

–  4-12

        Media +/- 3 desviación típica: 99%
                                –  2-14