La este vídeo vamos a repasar
una cuestión muy importante
cuando tenemos que trabajar
con análisis de datos,
y es la inferencia estadística.
Digamos que las investigaciones
más frecuentes pueden ser
o bien descriptivas o
bien inferencias
es una investigación de crítica en
la que se realiza sin plantear
una hipótesis inicial, y 1 va a
ver qué datos tiene en cambio
una hipótesis, inferencia;
una investigación de tipo,
confirmatorios, diferencial,
muy frecuente en los artículos de
investigación, donde al final
de la introducción de plantean la
hipótesis que quieren probar
y se realiza el análisis estadístico
adecuado para ver
si se confirma esa hipótesis.
Digamos que la mayor parte de las
investigaciones empíricas
que son esas que van a utilizar
datos provenientes de sujetos
o en general de unidades
de observación,
tienen por fin confirmar
una hipótesis.
En cuanto a las hipótesis,
vamos a diferenciar hipótesis
científicas,
de hipótesis, operativas, una
hipótesis científicas.
Cualquier afirmación que se pueda
comprobar y una hipótesis
para que se pueda comprobar,
necesita relacionar 2 o más conceptos
y necesita ser empíricamente
comprobable
una hipótesis operativa.
En cambio, en la que se expresa
de una determinada manera
idealmente se expresa de la manera
que debería confirmarse
o verificarse.
Vamos a ver algunos ejemplos.
Una hipótesis científica podría
ser que con mascarillas todos
somos más guapos y 1 hipótesis
operativa.
Podría ser.
Si una persona lleva mascarilla,
entonces será percibida
como más atractiva.
Observamos que la hipótesis
operativa nos dice
cómo tenemos que comprobar eso.
Si una persona la lleva, si
una persona no la lleva,
si una persona lleva,
entonces será percibida como
más atractivo otro caso.
El café quita el sueño
de manera operativa
si una persona toma café
por la tarde noche.
Entonces tardará más tiempo en
dormirse que si no toma café;
estamos redactando lo que
debemos observar
en caso de que sea cierta
esa hipótesis.
Así se plantea una hipótesis
operativa,
o en el caso mis estudiantes
de tercero,
de ESO son muy inteligentes.
Un ejemplo, la hipótesis operativa.
La inteligencia de los estudiantes
de este grupo de estudiantes
es superior a la inteligencia
promedio
de los estudiantes que tienen
su misma edad.
Una hipótesis operativa
a nivel estadístico
se traduce en 2 tipos de hipótesis,
una hipótesis nula
y una hipótesis alternativa.
La hipótesis nula siempre
va a plantear
que los elementos que se están
comparando en esa hipótesis
no difieren, son iguales.
La diferencia son nulas,
hay igualdad?
Las diferencias no son
significativas,
una hipótesis alternativa
justo lo contrario,
la que plantea, que sí que
difieren o en general
que la hipótesis nula es falsa.
Por ejemplo, hipótesis.
Las personas que llevan mascarillas
se perciben igual de atractivas
que si no la lleva,
o la ingesta de caja no supone
más tiempo para 2000,
supone el mismo tiempo para dormir.
Tomen café o no;
tomen café con los estudiantes
de tercero, de ESO.
Estos estudiantes, en concreto
de este aula,
tienen una inteligencia que no
difiere a la esperable en su edad.
En cualquiera de los casos la
hipótesis nula plantea
Que no hay diferencias; en cambio,
la hipótesis alternativa
en cada caso plantearía que
las personas que llevan
mascarillas se perciben más
atractivas que, si no la llevan,
que la ingesta de café supone
más tiempo para dormir
y que los estudiantes, ese grupo de
estudiantes del tercero, de ESO,
tiene una inteligencia superior
a la esperable para su edad,
hipótesis nula e hipótesis
alternativa.
Una investigación consiste en
decidir cuál es la correcta,
si la nula o la alternativa,
y para eso tenemos que recurrir a
la significación estadística.
Para eso utilizaremos una
prueba estadística,
y esa prueba estadística aportará
un valor de probabilidad
que siempre va a ser.
La probabilidad de que la hipótesis
nulas sea cierta
siempre siempre la probabilidad de
que sea cierta la hipótesis,
ahora, si la probabilidad de que
sea cierta la hipótesis nula
es muy, muy baja,
pues tendremos que pensar que la
hipótesis nula no es cierta,
pero cuando es muy baja
pues por convención,
por un acuerdo no escrito
bueno, escrito.
En algunos sitios se clara
cuando es inferior a punto 0.
5 probabilidad punto 0 5,
que equivale en porcentaje a una
probabilidad inferior o igual
al 5 por 100.
Si la probabilidad de que la
hipótesis nulas sea cierta
es del 5 por 100 menos, tendremos
que concluir
que la hipótesis nula no es
cierta, que es falsa,
y entonces asumir porque lo asumimos,
no lo comprobamos que la correcta
en la hipótesis alternativa.
Así por ejemplo,
en el caso de los estudiantes
de tercero de ESO,
la hipótesis nula plantea
igualdad que son igual,
tienen una inteligencia equivalente
a cualquier estudiante de su edad.
La hipótesis alternativa dice que
no, que son más inteligentes.
Hacemos una prueba estadística
que podría ser una prueba.
Te despiden y obtenemos
una probabilidad.
Aquí tenemos varios casos.
Si la probabilidad fuera de 0 23,
hay que rechazar.
La hipótesis y admitir la
alternativa difiere;
son más inteligentes.
Si la probabilidad fuese de 0,
10 es una probabilidad superior a
ese 5 por 100 que marcamos como barrera.
Entonces se aceptaría
la hipótesis, nula;
si la probabilidad fuese
de punto menor
al punto 0, 0 1 sería una
probabilidad muy baja,
se rechazaría la hipótesis, nula.
Si la probabilidad fuera de 0 71, 71
por 100 de que la hipótesis nula
sea sea cierta por la
aceptamos, la nula,
la consideramos cierta y admitimos
que no difieren nuestro grupo
de estudiantes con respecto
a lo de su edad,
y si la probabilidad de
que fuese cierta
fuese de 0, con 0, 0 a 3,
un 0,3 por 100, muy bajo,
pues tendríamos que rechazarla
y admitir que se difiere.
Así que una prueba estadística
te aporta esa probabilidad
que te indica la probabilidad de
ser cierta, la hipótesis nula,
y en base a eso tomamos una decisión.
Un ejemplo para medir la
inteligencia se utiliza antes de inteligencia
que suelen estar baremados;
con media 100 desviación típica, 15,
así que la población de estudiantes,
si todos los estudiantes
de tercero de ESO
completarán un de inteligencia,
tendríamos una distribución
de puntuaciones
de muchísimos estudiantes que
tendría por mediación y desviación típica,
aquí supongamos que extraemos
una muestra
de 50 estudiantes de esa población
y obtenemos su media.
Volvemos sea extremos otra muestra
distinta de 50 estudiantes
de esa población
y obtenemos un medio y eso lo vamos
repitiendo y repitiendo
y repitiendo.
Por ejemplo, 3.000 veces accedemos a
3.000 muestras de 50 estudiantes
y en cada caso obtenemos una media;
al final tendremos 3.000 medias
eso lo podríamos hacer
hasta hasta el infinito
que tendremos.
Al final tendremos una distribución
de medias,
un conjunto de medidas que sería una
distribución de puntuaciones
que vamos a denominar distribución
muestral de la media,
haya una distribución
mostrarle la media,
y hay una distribución muestral
de la proporción.
Hay una distribución muestral
de la mediana;
hay una distribución muestral
de la diferencia de medias,
hay mucha distribución; en muestra
utilizamos la de la media
para entender cómo funciona esto
de la inferencia estadística,
así que en la parte de
arriba en morado,
tendríamos lo que en la distribución
de inteligencia en la población
y si simulamos 1.000 muestras
de tamaño 50
obtenemos la media de cada una.
De esas muestras tendríamos
la distribución verde,
la media de una distribución
muestral.
La media de una distribución
formada por medias tiene
la misma media valga la redundancia
que la media de la población,
es decir la distribución mostrado,
tiene por media 100 a nivel teórico
sabemos cuál es la desviación típica
de esta distribución muestral
de la media marcada en verde
a nivel teórico
sería la desviación típica de
la población, que es 15,
entre raíz de que sería el
fallido 50 Es decir,
que esta distribución muestral
de la media
que sea se ha formado con medias,
demuestra de 50 personas,
tienen una desviación típica de 2,
una distribución especial
en la distribución
de puntuaciones típicas,
connotaciones estándar o
puntuaciones, etcétera,
se llama distribución normal
estandarizada y se se forma a
partir de las puntuaciones
etcétera,
de todas las puntuaciones posibles.
Una puntuación típica
puntuación CETA,
es el número de desviaciones típicas
que una comunicación
se aleja de la media en promedio,
una puntuación,
una, perdón, una distribución
de puntuaciones típicas
tienen media 0 desviación típica.
1 es una distribución especial
porque no tiene unidad de medida,
y, sea cual sea la distribución
de partida,
sea inteligencia que sea ansiedad,
que sea el número de
piezas defectuosa,
sea cual sea si se convierte
en una distribución
de puntuaciones típicas,
tendrá estas características
media 0 acción típica.
Así que si yo sé que la
distribución muestral
de la media, que es de
lo de donde venimos,
tiene media 100 desviación típica 2
con 12 Qué medidas ha obtenido
mi muestra?
Pues esa puntuación de la
media que ha obtenido
en mi muestra menos -100 que la
media de la población entre 2 con 12.
Me dará esa puntuación
y eso esta distribución teórica
es tan conocida
que sé perfectamente la probabilidad
de cualquier puntuación típica,
así que tengo la distribución
de puntuaciones típicas
y, como conozco perfectamente
la probabilidad asociada
a cada a cada puntuación,
puedo determinar que la puntuación
típica 1 96 que estaría aquí deja
por encima de si el 2,5 por 100
de las puntuaciones típicas
y la puntuación menos -1,
96, deja por debajo.
El otro 2,5 por 100 de las
contrataciones típicas,
antes estudiaba estadística,
con unas tablas
la tabla de la de la puntuaciones
de la distribución normal,
donde tú buscaba la puntuación
que puntuación
dejaba por debajo, el 2,5 por
100 eran menos -1, 96,
qué puntuación dejaba por
encima del 2,5 por 100
era 1, 96 Claro.
Si esto es una puntuación típica
menos -1, 96, que es una media,
me nacía, y dividido con dividido
entre 2 con 12,
arrastrando el ejemplo que traemos,
que media de la muestra
es la que tiene una puntuación
típica de menos -1, 96,
pues la media de la muestra, 95,
84, la puntuación un 1, 96.
La media de la muestra
sería 104 con 16,
que estamos diciendo
que entre 95, 8.404 16 se encuentra
el 95 por 100 de las posibles medias
que se puedan obtener en una
muestra de 50 estudiantes
que por encima de la media,
104, 16 se encuentra el 2,5
por 100 de la media,
las más altas y por debajo de 95, 84.
El 2,5 por 100 de la media
es con menor valor,
así que 95,
8.404 con 16 define el intervalo
de confianza al 95 por 100,
con un nivel de confianza del 95
por 100 en torno a la media,
todo lo que hay en medio son medias
valga la redundancia,
y si la y si la muestra,
y si tu muestra situ
con 50 estudiantes
ha sacado una media de 104,
hombre, por 104 estaría por aquí
cae en ese 95 por 100.
Vamos a decir que tu muestra se
diferencia de la población
cuando salga de ese 95 por 100,
cuando esté fuera de ese intervalo.
Por tanto una media de 104
tendremos que decir que no
difiere de lo esperable
en la población.
En cambio una media de 105 sí
porque está fuera de ese intervalo.
Una media de 93; también una
media de 106 también,
pero una media de 98 No.
De esa manera podríamos determinar
que si la media que tú has obtenido
en tu muestra de 103
no difiere de la población,
si es de 105,
es superior a la media
de la población,
y 7, 94 que está fuera del
intervalo también es;
es; es inferior a la media esperable.
Pero, claro, yo no necesito
estar comprobando
a nivel estadístico cuál es la media
y cuál es el intervalo de confianza,
aunque en muchas revistas piden
que se pongan los intervalos
de confianza,
porque en realidad el programa
estadístico en lo que me enfadara.
Es una probabilidad.
Si la probabilidad reportada
es inferior al 5 por 100,
vamos a admitir que está
fuera del intervalo,
y si la probabilidad superior
al 5 por 100,
como en este caso 0 15 Entonces
estará dentro del intervalo.
Si media está dentro de ese
intervalo pues no difiere.
Tengo que admitir que no difiere
de la población admitiré.
La hipótesis,
si está fuera, quiero advertirle
que sí que difiere
y que, por tanto, aceptaré la
hipótesis alternativa.
En eso consiste la inferencia
estadística,
pero además de la inferencia
estadística, cada vez
con más frecuencia las revistas
solicitan la significación práctica.
El tamaño del efecto observatorio,
si se aplique un tratamiento
a un grupo experimental y
a un grupo de control,
el efecto del tratamiento
como es muy bajo,
bajo medio alto para eso, se utiliza
determinados índices,
como la de Cohen ETA cuadrado ETA
cuadrado parcial o amiga
cuadrado que evalúa la magnitud de
ese efecto en función del valor
que tenga.
Por ejemplo, una vez de Cohen,
si se utiliza una prueba, te
para comparar 2 medias;
si es mayor de 0 con 8 la de cohecho,
pues el tamaño del efecto
es muy alto,
sin mayor de 0 50 medios y en mayor
de 0 20 bajo y sin menor de
0, 20, muy bajo o nulo,
así que, aparte de significación
estadística,
la significación práctica se hace
imprescindible también reportarla
en las investigaciones actuales.
Esto es lo mínimo que tenemos que
saber para poder avanzar
en la utilización de pruebas
estadísticas.
Aquí en este enlace que tenéis
en el doy podéis acceder
a toda una relación de índice
de tamaño del efecto
y los criterios de interpretación,
un saludo.
Muchas gracias.