Habla en el vídeo anterior,
estuvimos viendo la prueba que
destinen para comparar 2 grupos,
una ampliación lógica,
si tenemos que comparar 3 o más
y vamos al mundo del Anova,
en este vídeo, vemos a más, con
muestras independientes
o a no.
Vas inter-sujetos en concreto
no va simples,
en el que solo hay un factor
que nos define los grupos.
Vamos a ver 3 tipos de Anova,
la Nova, paramétrico, nueva
interés, sujetos clásico,
la nueva robusto o devueltas
y la nueva no paramétrico,
la prueba Cruz, cuáles
son pruebas que,
como decimos, se aplican cuando
las muestras de sujetos
son diferentes, en principio
para datos continua
y veremos que sobre todo
no paramétricos,
se pueden utilizar para datos
ordenarles un ejemplo,
en un centro escolar que
en muchos sentimos,
se ponen a prueba 3 programas para
reducir ese absentismo,
1 de mentoría donde a cada estudiante
se le asigna un tutor de
cursos superiores,
para que vaya acompañándolo
en el centro,
para ver si con eso se reduce
un programa de motivación
o bien un programa de apoyo académico
por parte de los docentes para
cada 1 de estos programas.
Si se se crea un grupo de José
asigna un grupo de estudiantes,
cuál de estos programas
en más efectivo,
la hipótesis nula nos dirá que
todos son igual de efectivos
y la hipótesis alternativa
que no todos son igual
que habrá alguno que sea diferente.
Bueno, pues vamos a ver qué
nos dicen los datos.
Lo primero que hacemos es
entrar en Jan móvil.
A mí pues sí sabemos centrarnos
en el móvil
y abrimos absentismo.
Vamos a ver los datos, los datos
tenemos 90, 90, 90 chicos y chicas
donde hay una variable,
estamos recogiendo qué
tipo de programa,
a qué tipo de programa asistido
y el número de horas
después de haber participado ese
programa en un tiempo de un mes,
cuántas horas sentimos?
Se han registrado.
Podemos hacer una valoración
descriptiva,
veremos que la media de horas ha
sido de 15, perdón, de 15 con 2,
pero si las separamos por grupo
entonces han sido de 19 horas
en mentoría 15 motivación y 10.
En apoyo académico,
parece ser que con el programa
de apoyo académico
se han registrado menor número de
ausencia de clase de horarios.
Si hiciéramos un gráfico con
un diagrama de caja,
podríamos ver un poco cómo,
cómo se ha comportado
como son los autónomos registrados.
Hay 2 valores no para verse extremos
en el caso de apoyo académico,
el caso número 70, que ha registrado
muchísimas horas
cuando su grupo no ha
sido lo frecuente
y un caso que apenas que también,
que tampoco era lo frecuente.
En ese caso estos datos
son son simulados, bueno, parece ser
que diferencias entre los grupos,
nos toca comprobarlas
y para eso tenemos,
como hemos visto, si tenemos
en realidad 3 opciones
o bien en la nueva paramétrico que
siguiendo la receta clásica,
sería para un nivel de medida.
Continuar cumpliendo la normalidad y
cumpliendo homogeneidad varianzas.
Aconsejo que se vea el
vídeo de la prueba.
Te has hecho el vídeo anterior,
donde se explica con más detalle
esto en la nota para robusto,
donde se aplica una corrección,
en el caso
de que no se cumpla el supuesto de
homogeneidad, de varianzas,
y si no se cumple, normalidad
con la variable
de medidas ordinal.
Una prueba no paramétrica bueno, con
un poco un poco más técnico,
ya lo vimos en el vídeo anterior.
En qué casos se va a utilizar
la nova paramétrico?
En qué casos, en la nueva
robusto y en qué casos?
En la nova no paramétrico, donde
hacemos estos análisis,
el paramétrico por defecto a
no va, no para lo veremos.
En la nueva robusto de Anova
de un factor Anova,
no paramétrico.
En la parte final la veremos.
Ahora aplicando la prueba de cruz.
Es bien que prueba tenemos
que vamos a utilizar,
va a depender.
Vamos a seguir la receta clásica
y va a depender,
sin duda de que se cumpla o no
se cumpla los supuestos,
así que no va.
Tengo 3 opciones paramétrico
robusto y no paramétrico.
Vamos a empezar haciendo
el paramétrico,
así que traslado horas como
variable, dependiente y grupo
como el factor factor
de efecto fijos,
porque los niveles mentoría
motivación y grupo de apoyo.
Han sido elegidos porque si
por los investigadores
una nueva paramétrico me
dicen que diferencia
estadísticamente significativas
pero depende de que se cumpla
los supuestos,
los supuestos los tenemos pruebas,
normalidad, homogénea,
varianza y gráfico, que es el
equivalente a la normalidad.
Vemos que sí que sí una
tendencia normalidad,
que no hay ningún problema
con la normalidad,
y tampoco lo hay con la homogeneidad
de varianzas.
Por lo tanto,
puedo utilizar este esta prueba
estadística que se.
La Nova paramétrico bien que
me da una probabilidad,
simplemente me da una probabilidad.
Yo tengo que saber que con
cualquiera de las 3 pruebas
anteriores voy a rechazar o no
rechazar la hipótesis nulas
y rechazo, la hipótesis nula estoy
admitiendo que hay diferencias
entre los grupos simplemente
que las hay,
no se entre cuales solo las hay y
luego, si se rechaza la hipótesis,
nula tengo que dar un
paso más para saber
entre qué grupos hay diferencias.
Tendré que hacer unas
comparaciones poso.
Unas comparaciones que solo
las voy a hacer solo solo
solo después de comprobar que
existen diferencias significativas
después de haber rechazado la
hipótesis nula del la Nova.
Bueno, pero aquí entramos
en un pequeño,
en una pequeña discusión.
Vamos a suponer Qué
quiere comprar un producto
y sabe que tiene?
Es el riesgo,
sea que tiene el riesgo
de un 5 por 100,
de que te salga mal ese producto.
Bueno, pues hombre, te la juega,
tienen un 95 por 100 de probabilidad
de que te salga mal,
pero y si pide ese producto de esos,
el riesgo de que te salga
o alguno mal sigue
siendo de un 5 por 100 No, no se
habrá elevado a un 30 por 100,
tienes un 30 porque es un
5 por 100 de 1 u otro,
otro 5 por 100 de otro.
La probabilidad de que salga una mal
muy muy alta muy muy superior
así solo hubiera adquirido un
producto esto para ejemplificar
lo siguiente.
La prueba de la Nova nos dice o nos
permite tomar una decisión
si hay o no hay diferencias
entre los grupos,
si tú admite que las hay y sabe
que te estás arriesgando,
está; tienes un riesgo de
equivocarte que es igual a la probabilidad
que que con la que tú rechaza
la hipótesis,
nula como mucho un 5 por 100.
Ese es el riesgo que tiene
de equivocarte al decir
que los grupos difieren 5 por
100 de posibilidades
de que no sea cierto, te
has equivocado bien,
pero admitamos que sí que
hay diferencias.
Entonces, vas a hacer comparaciones.
Las comparaciones son 2 a 2.
En el caso que estamos suponiendo
sería mentoría frente a motivación
mentoría frente a apoyo académico
y motivación frente a
apoyo académico.
Haría 3 comparaciones
poso tener 2 años,
pero si tuviera 4 grupos, el grupo B
C y de áreas taxi, comparaciones,
y en cada 1 tendría un riesgo
de un 5 por 100.
Entonces, en el total
de comparaciones
en la familia de comparaciones, el
riesgo de que alguna sea la meta,
qué diferencia,
cuando no es cierto, la el riesgo
de cometer un error tipo 1
muy alto enmendante
porque son 6 Entonces se incrementa
notablemente,
se incrementa hasta el punto de que
habría un 26 por 100 de probabilidad
de tomar una decisión incorrecta.
Por tanto, el riesgo de convencer en
un error tipo, 1 es muy alto,
cuando se hacen muchas comparaciones
poso que podemos hacer antes,
pues podemos utilizar distintas
pruebas de comparación.
Podemos utilizar unas incorrección
como la diferencia mínima,
significativa, muy utilizada,
muy utilizada,
pero no es nada aconsejable.
Esto es igual que realizar
en este caso
si se aprobase independientes 1 2
3 4 5 6 cada una de ellas bueno
eso está bien cuando tiene 2 grupos,
pero cuando tienes 6 están
relacionados entre sí
no es nada nada aconsejable.
Lo lógico sería hacer una corrección,
una corrección para evitar ese
riesgo de tomar una decisión equivocada,
y para eso tienen otro tipo
de comparaciones
tuviese cebó en Ferrol.
Ni bueno, hay muchísima más.
Hemos dicho que la diferencia
mínima significativa
no aplica ninguna corrección,
nada, nada aconsejable.
Toque, y en la más frecuente
y la más recomendada,
solo tiene una, una pequeña pega,
que requiere que los tamaños más
chalés, sean iguales bon Ferrol
ni no se recomienda,
porque muy conservadora esto quiere
decir que, sobre todo,
si se realizan todas las
comparaciones posibles,
porque te da probabilidades, no
sea una baja de las normales.
Entonces es posible que diga que no
hay diferencias entre 2 grupos
cuando sí que las hay,
y esto ocurre cuando hay muchas
comparaciones está ideado solo
para cuando quieres hacer
algunas concretas.
No todas se EFE.
También le ocurre lo mismo
muy conservadora.
Además, está diseñada para,
cuando quiere hacer
comparaciones complejas
una frente a varias
o 2 frente a otros 3 grupos
tampoco tampoco bueno
a nada es esa comparación es
planeada no no se pueden hacer en el famoso;
y, por último la dejo, que es una
modificación de la EBA en Ferrol
ni que, que está bastante bien;
incluso sería la preferible
después de toque,
y cuando el tamaño muestral
no son iguales.
En cualquier caso, todas
estas requieren
que se cumpla la homogeneidad
varianza
y que los en esa aproximadamente
igual;
es bueno nuestra recomendación Pues
utilizarla de la que no vamos aquí
y tenemos una pestaña para aprobar.
Pues eso, que simplemente
trasladamos el factor que nosotros queremos,
que tienen sus 3 niveles,
y entonces nos hace las
comparaciones.
Entre esos 3 niveles.
Hay diferencias significativas;
hay diferencia significativa;
haya diferencias significativas y
puede obtener el tamaño del efecto
de esas diferencias.
Bien, aquí además hay otro
tipo de contrastes.
Los contables o como unas
comparaciones,
pero un poco más especiales vamos a
verla marcando cada una de estas.
Por si podrían ser de interés.
Se van a hacer tantas comparaciones
como grados de libertad.
Tenga el modelo, tengo 3 niveles.
El factor grupo tiene 3 niveles.
Tengo 2º grados de libertad, 1 menos,
así que aquí podrá hacer
2 contrastes.
Si hago un contraste de desviación,
me va a comparar,
él siempre empieza por el segundo,
es el segundo frente a todos
y el tercero frente a todos,
sería como motivación
frente a la media general
y apoyo académico.
Frente a la media general,
a ver si hay diferencias
significativas.
Motivación no difiere del conjunto
de todo el apoyo académico,
sí que difiere apoyo, académico,
es menor,
al ser negativo en menor que
el que la media global
significa.
Hay menos ausencias en menor
hora de absentismo,
con apoyo académico que
el conjunto de los 3,
el simple me compara 1 a 1,
pero siempre frente al
primero, el segundo,
frente al primero y el tercero frente
al primero si hay diferencias
significativas entre ellos diferencia
y tienen sentido si los niveles
son originales, por ejemplo,
por qué Porque me compara el segundo
con respecto al primero
y el último con respecto
o el tercero,
frente a los 2 primeros en orden,
tiene más sentido cuando
son ordinarios.
En cualquier caso,
podría tener algún sentido
en ciertas situaciones,
así que motivación difiere
significativamente mentoría
y apoyo académico.
Consigue menos sentimos
que lo mentoría,
motivación en conjunto.
El dejarme muy parecido mentoría
frente a motivación y apoyo académico
motivación frente apoyo académico,
sería como los primeros frente
al último y además en orden
mentoría.
Tiene más horas de absentismo que
motivación y apoyo académico
en conjunto, y motivación.
Tiene más significativamente
más horas de absentismo,
que apoyo académico y, si
fueran ellas repetida,
sería una frente a otra memoria
frente a motivación y motivación,
frente a apoyo académico y
por último polinomio tal
si tengo 3, 3 tipos de donde
tengo el gráfico.
No lo he hecho, no lo he
hecho, aunque error.
Media marginal, desestimadas.
Se puede hacer un gráfico.
Entonces veo que esto marca
como una tendencia,
pero esa tendencia claramente lineal
pero con 3 puntos la tendencia
podría ser cuadrática.
Si este punto estuviera aquí
me estaría marcando una
o invertida una parábola
que es una tendencia.
Cuadrática pues con 3 puntos.
Yo puedo probar una tendencia lineal
o una tendencia cuadrática.
Los datos, no.
Si quieren una tendencia cuadrática,
se puede admitir que siguen
una tendencia línea
muy bien.
Me queda solo un pequeño detalle
aquí y tienen que ver con el modelo,
con el modelo estadístico.
Bien, vamos a suponer
que nosotros estamos estudiando la
altura en la población española,
y yo no tengo nada con que
predecir la altura,
así que digo.
El mejor modelo es que yo
no me arriesgo mucho
y diga que cualquier persona tiene
por estatura la media.
Unos 70.
A esto llama modelo nulo,
el peor de los modelos que
se puede utilizar,
que dice que todos somos
exactamente iguales.
La altura, una persona, la media
claro cometió un error.
Este es el error total que
yo cometo por decir
que cada persona mide la media,
equivale a la varianza.
El modelo nova.
Plantea que este no es un buen
modelo para predecir que es mejor
que cada persona se si se se predica
o se asigne la altura.
Cada persona va equivaler
a la media de su grupo,
no la media global,
de manera que si eres hombre,
tu media va a ser unos 77,
si eres mujer medio va a ser unos 63
Claro que sigo cometiendo un error,
un error.
Ahora cometo menos error
que con el otro,
porque como siga cometiendo
el mismo error
significa que este modelo no sirve.
En eso consiste probar la
hipótesis de un enfoque
de la comparación de modelos,
hipótesis nula el modelo nulo,
el mejor modelo es el nulo,
porque el error, si yo
utilizo un modelo,
no va.
El error que sigo cometiendo
es exactamente igual
que el cometido que cometía
o bien el modelo Nogal
sería admitir la hipótesis
alternativa
que el error que yo cometo
utilizando el grupo como como predicción,
es inferior al error que cometería
utilizando la medida para todos,
que modelos es el mejor,
el que consigue unos errores
inferiores.
Bien, realmente reduce el error.
El modelo que yo estoy utilizando
realmente reduce explicar
esta variación.
Eso es lo que mide el tamaño
del efecto en un modelo
Anova.
Tiene un modelo de regresión,
como veremos cuál es la magnitud
de porcentaje
de varianza que me explica el modelo.
Si la hipótesis nula sería
que el modelo explicado
0 por 100 no es capaz
de explicar nada.
Ahora, si el modelo,
si yo rechazo la hipótesis
nulas porque consigue,
explicaron porcentaje
de esa variación.
Ese porcentaje podrá ser
bajo medio alto,
en función de cómo sea el índice
que mide esta mañana.
El efecto, y tengo 3.
Está cuadrado, está cuadrado
parcial y omega cuadrado?
Está cuadrado?
Es equivalente al coeficiente
de determinación
que veremos en regresión.
Es el porcentaje de varianza
que me explica el factor,
está cuadrado parcial ese
mismo porcentaje,
pero sin tener en cuenta lo que
expliquen otros factores
pero lo expliquen otros factores
significa en diseño factorial
es en diseño más complejos aquí no
hay otros factores por eso,
en una nueva simple, que
solo hay un factor
está cuadrado, siempre es igual
al cuadrado parcial,
en cualquiera de los 2 casos
no es aconsejable.
En diseños inter sujetos simples
Por qué Porque da
una estimación, un poco
más alta, de la,
de la, de la que sería preferible
o me cuadra que es equivalente
al porcentaje de la varianza
explicada en la población,
no solo en la muestra, sino
en la población.
Es una estimación
y sería el indicador en cuanto
a las comparaciones.
Poso, pues, el tamaño del
efecto de la deuda
como como ya habíamos dicho eso y
que es recomendable cuadrado.
No podemos venir donde nosotros
planteamos el modelo
y solicitar al cuadrado y
se irá al principio.
Donde me dice que la magnitud
del efecto es muy alta
sería como decir este modelo.
Consigue explicarme el 43 por 100
de la diferencia que hay
entre las personas de este estudio
también se puede decir
que la diferencia que hay entre
los distintos grupos
tienen una magnitud muy alta.
Hay grandes diferencias ahora para
saber entre qué grupos,
pues ya me tendría que ir a las
pruebas a las pruebas.
Pues bueno,
pues vamos a visto esto.
Vamos a hacer lo mismo
con otro ejemplo,
y vamos a abrir un ejemplo.
Es sobre audios enviados con
basa sí veo las variables.
Tengo la variable género
masculino y femenino
y uso de redes que me va a decir
si estos chicos, adolescentes,
chicas, utilizan poco nivel medio o
utilizar mucho las redes sociales
y luego para cada 1 tengo cuántos
audios manda en promedio
Aldea, cuánto dura minutos,
no en segundo.
Bueno, vamos a dejarlo en minuto
porque, como los datos son
simulador lo mismo,
nada que sean en minutos
que en segundos,
así que tengo en promedio de
un minuto en promedio,
6 en promedio, 10.
Esto parece, si 31 minuto tengo
que parece demasiado,
así que venga, vamos a poner
un poco más creíble
y vamos a decir que sean
segundos de duración
promedio en segundos siempre
es un poco más.
Bien, pues tengo las donaciones
segundos,
y me planteo.
Me planteo, existe diferencia
entre el número de audios
que envían chicos y chicas.
Bueno, le puedo hacer aquí una
nueva haría una nueva normal
donde trasladaría el número de
audios como variable, dependiente y género
como un factor que alguien me diría
a quien me llame imaginable
por hacer un gráfico, trasladar
esto y decir.
Pero si solo 2 grupos, porque
no hacerse una prueba,
que es exactamente igual la nova es
exactamente igual que la prueba,
que cuando solo tengo 2 grupos eso
sí tengo comprobar los supuestos
y la prueba.
Homogeneidad de varianzas la
normalidad y la gráfica
y me dice que la que la homogeneidad
varianzas no se cumple, no se cumple
y que la nueva normalidad hay ahí
estamos sí que hay 90 sujetos
y sería recomendable la
prueba de colmo,
Gorospe antes que la prueba
de esa, pero voy,
pero pero es una muestra dónde hay
alguna alguna incidencia?
Así que vamos a asumir que se cumple
y luego y luego veremos qué pasa.
Si asumimos que no se
cumple muy bien.
Asumimos que se cumplen normalidad,
pero que no se cumple.
Homogeneidad, varianzas.
En ese caso debería hacer
una nueva robusto
y eso lo tengo que no va de un
factor que cuando entró
mi variable dependientes en el
número de audios, en función del género,
ya me indica, se está asumiendo que
la varianza son diferentes,
que no hay homogeneidad,
efectivamente,
por eso estamos y no hay diferencias
estadísticamente significativas.
El límite está en un 5 por 100
entre chicos y chicas,
pues se acabó el análisis
y no tengo nada, nada
más que hace nada.
Si yo hubiera hecho una nueva no
paramétrico sería el de crujan.
Cuales hubiera sido igual número
de audios por género
y entonces aquí aquí tenía
que concluir que sí que existen
diferencias significativas
y cuando hago comparaciones
poso me dice.
Efectivamente, lo mismo.
Bueno, es que no tiene sentido
por eso lo digo grupos.
La la diferencia de utilizar
una nova agua,
aunque sea robusto de una prueba,
no paramétrica por nos
pueden ocurrir,
no pueden ocurrir estas cosas.
Técnicamente habría que haber
utilizado la nueva robusto,
aunque perfectamente se podría
utilizar una nueva no parámetros
si yo obtengo el tamaño del efecto
tamaño del efecto es de un 3 por 100
si este pertenece al de la séptima
para no equivocarme.
Si yo aquí obtuviera el tamaño
del efecto donde lo tengo,
en este vería que es de un 1 por
100 de que estamos hablando,
de que estoy diciendo que
hay una diferencia,
pero es que esa diferencia
significativa es que baja,
que es que es bastante baja.
Por eso, por eso está en el límite
que un modelo me dice que sí y
otro modelo me dice que no,
porque realmente la significación
práctica de esa diferencia.
Bueno, pero también teníamos,
queremos saber si hay diferencias
entre el número de audios en función
del uso de las redes sociales
y de nuevo PSOE.
De nuevo todo el recorrido la Nova.
Hay diferencia estadísticamente
significativas
con una nueva paramétrico
que lo puede utilizar si se
cumplen los supuestos.
Vamos a verlo.
Homogeneidad, normalidad.
En este caso no hay dudas
con la normalidad,
no hay dudas, pero no se cumple.
Homogeneidad de varianzas, por tanto,
tengo que hacer una nueva robusto.
Negocian?
No va a engañar.
No va de un factor donde se
asumen que la varianza
no son iguales número de audios en
función de redes sociales Que
hay.
Diferencias estadísticamente
significativas,
como aquí sí que diferencia
estadísticamente significativas.
Puedo pasar a hacer las pruebas?
Pues eso, que en el caso de
una nueva robusto son
las que son.
Pruebas poso realizadas,
asumiendo que la varianza
no son iguales,
que nos confirman que diferencias
entre bajo y medio,
que que.
Las personas que tienen un uso
bajo de redes sociales
hace menos, manda menos audios que
las que hacen un uso medio,
las que son las que las personas
que hacen bajo uso
de las redes sociales
mandan menos audios que las
que hacen un alto uso,
y así sucesivamente, y vemos
que hay diferencias
entre los 3 niveles.
En el caso del de la Nova,
robusto no tengo medidas
del tamaño del efecto,
debería utilizar la medida
del parámetro,
así que estoy hablando
de un 24 por 100,
que es una magnitud considerable.
Digamos que un 24 por 100
varianza aplicada,
es un alto porcentaje de variación
y, en el caso
de las comparaciones poso que
debería utilizar las otras.
Pero aquí simplemente estimó
el tamaño del efecto.
El tamaño del efecto sería de
tipo medio de tipo medio
y de tipo.
La diferencia entre el
bajo, muy bien,
pues solo me quedaría sí si
aquí por lo que hubiera
sido no se hubiera cumplido
el supuesto normalidad,
pues hubiera hecho una prueba de
calculables número de audios,
en función de redes sociales,
me difieren, indica que diferencia
estadísticamente significativas.
El tamaño del efecto es de un 24
por 100, también muy alto,
y hay diferencias significativas
entre los distintos niveles.
Resaltar en el otro caso
como con con 1 paramétrico
sí pero con el robusto,
no es que el porcentaje era
mínimo, era mínimo,
estábamos entre poco y nada y a
veces pueden ocurrir esas cosas.
Por eso es tan importante la
significación estadística
y también la significación práctica.
Bueno, hasta aquí el vídeo
de hoy, gracias.