Idioma: Español
Fecha: Subida: 2025-03-24T00:00:00+01:00
Duración: 26m 40s
Lugar: Curso
Visitas: 94 visitas

Jamovi06: ANOVA (intersujetos). Comparando 3 o más grupos (diferentes)

Pruebas estadísticas para comparar 3 grupos (diferentes) cuando la variable de medida es continua (también ordinal)

Descripción

Pruebas estadísticas para comparar (las medias de) tres o más grupos independientes o diferentes:
ANOVA paramétrico
ANOVA robusto de Welch
ANOVA no paramétrico (Kruskal-Wallis)

Pruebas post-hoc según el tipo de ANOVA.
Tamaños del efecto (del modelo y de las comparaciones)

Transcripción (generada automáticamente)

Habla en el vídeo anterior, estuvimos viendo la prueba que destinen para comparar 2 grupos, una ampliación lógica, si tenemos que comparar 3 o más y vamos al mundo del Anova, en este vídeo, vemos a más, con muestras independientes o a no. Vas inter-sujetos en concreto no va simples, en el que solo hay un factor que nos define los grupos. Vamos a ver 3 tipos de Anova, la Nova, paramétrico, nueva interés, sujetos clásico, la nueva robusto o devueltas y la nueva no paramétrico, la prueba Cruz, cuáles son pruebas que, como decimos, se aplican cuando las muestras de sujetos son diferentes, en principio para datos continua y veremos que sobre todo no paramétricos, se pueden utilizar para datos ordenarles un ejemplo, en un centro escolar que en muchos sentimos, se ponen a prueba 3 programas para reducir ese absentismo, 1 de mentoría donde a cada estudiante se le asigna un tutor de cursos superiores, para que vaya acompañándolo en el centro, para ver si con eso se reduce un programa de motivación o bien un programa de apoyo académico por parte de los docentes para cada 1 de estos programas. Si se se crea un grupo de José asigna un grupo de estudiantes, cuál de estos programas en más efectivo, la hipótesis nula nos dirá que todos son igual de efectivos y la hipótesis alternativa que no todos son igual que habrá alguno que sea diferente. Bueno, pues vamos a ver qué nos dicen los datos. Lo primero que hacemos es entrar en Jan móvil. A mí pues sí sabemos centrarnos en el móvil y abrimos absentismo. Vamos a ver los datos, los datos tenemos 90, 90, 90 chicos y chicas donde hay una variable, estamos recogiendo qué tipo de programa, a qué tipo de programa asistido y el número de horas después de haber participado ese programa en un tiempo de un mes, cuántas horas sentimos? Se han registrado. Podemos hacer una valoración descriptiva, veremos que la media de horas ha sido de 15, perdón, de 15 con 2, pero si las separamos por grupo entonces han sido de 19 horas en mentoría 15 motivación y 10. En apoyo académico, parece ser que con el programa de apoyo académico se han registrado menor número de ausencia de clase de horarios. Si hiciéramos un gráfico con un diagrama de caja, podríamos ver un poco cómo, cómo se ha comportado como son los autónomos registrados. Hay 2 valores no para verse extremos en el caso de apoyo académico, el caso número 70, que ha registrado muchísimas horas cuando su grupo no ha sido lo frecuente y un caso que apenas que también, que tampoco era lo frecuente. En ese caso estos datos son son simulados, bueno, parece ser que diferencias entre los grupos, nos toca comprobarlas y para eso tenemos, como hemos visto, si tenemos en realidad 3 opciones o bien en la nueva paramétrico que siguiendo la receta clásica, sería para un nivel de medida. Continuar cumpliendo la normalidad y cumpliendo homogeneidad varianzas. Aconsejo que se vea el vídeo de la prueba. Te has hecho el vídeo anterior, donde se explica con más detalle esto en la nota para robusto, donde se aplica una corrección, en el caso de que no se cumpla el supuesto de homogeneidad, de varianzas, y si no se cumple, normalidad con la variable de medidas ordinal. Una prueba no paramétrica bueno, con un poco un poco más técnico, ya lo vimos en el vídeo anterior. En qué casos se va a utilizar la nova paramétrico? En qué casos, en la nueva robusto y en qué casos? En la nova no paramétrico, donde hacemos estos análisis, el paramétrico por defecto a no va, no para lo veremos. En la nueva robusto de Anova de un factor Anova, no paramétrico. En la parte final la veremos. Ahora aplicando la prueba de cruz. Es bien que prueba tenemos que vamos a utilizar, va a depender. Vamos a seguir la receta clásica y va a depender, sin duda de que se cumpla o no se cumpla los supuestos, así que no va. Tengo 3 opciones paramétrico robusto y no paramétrico. Vamos a empezar haciendo el paramétrico, así que traslado horas como variable, dependiente y grupo como el factor factor de efecto fijos, porque los niveles mentoría motivación y grupo de apoyo. Han sido elegidos porque si por los investigadores una nueva paramétrico me dicen que diferencia estadísticamente significativas pero depende de que se cumpla los supuestos, los supuestos los tenemos pruebas, normalidad, homogénea, varianza y gráfico, que es el equivalente a la normalidad. Vemos que sí que sí una tendencia normalidad, que no hay ningún problema con la normalidad, y tampoco lo hay con la homogeneidad de varianzas. Por lo tanto, puedo utilizar este esta prueba estadística que se. La Nova paramétrico bien que me da una probabilidad, simplemente me da una probabilidad. Yo tengo que saber que con cualquiera de las 3 pruebas anteriores voy a rechazar o no rechazar la hipótesis nulas y rechazo, la hipótesis nula estoy admitiendo que hay diferencias entre los grupos simplemente que las hay, no se entre cuales solo las hay y luego, si se rechaza la hipótesis, nula tengo que dar un paso más para saber entre qué grupos hay diferencias. Tendré que hacer unas comparaciones poso. Unas comparaciones que solo las voy a hacer solo solo solo después de comprobar que existen diferencias significativas después de haber rechazado la hipótesis nula del la Nova. Bueno, pero aquí entramos en un pequeño, en una pequeña discusión. Vamos a suponer Qué quiere comprar un producto y sabe que tiene? Es el riesgo, sea que tiene el riesgo de un 5 por 100, de que te salga mal ese producto. Bueno, pues hombre, te la juega, tienen un 95 por 100 de probabilidad de que te salga mal, pero y si pide ese producto de esos, el riesgo de que te salga o alguno mal sigue siendo de un 5 por 100 No, no se habrá elevado a un 30 por 100, tienes un 30 porque es un 5 por 100 de 1 u otro, otro 5 por 100 de otro. La probabilidad de que salga una mal muy muy alta muy muy superior así solo hubiera adquirido un producto esto para ejemplificar lo siguiente. La prueba de la Nova nos dice o nos permite tomar una decisión si hay o no hay diferencias entre los grupos, si tú admite que las hay y sabe que te estás arriesgando, está; tienes un riesgo de equivocarte que es igual a la probabilidad que que con la que tú rechaza la hipótesis, nula como mucho un 5 por 100. Ese es el riesgo que tiene de equivocarte al decir que los grupos difieren 5 por 100 de posibilidades de que no sea cierto, te has equivocado bien, pero admitamos que sí que hay diferencias. Entonces, vas a hacer comparaciones. Las comparaciones son 2 a 2. En el caso que estamos suponiendo sería mentoría frente a motivación mentoría frente a apoyo académico y motivación frente a apoyo académico. Haría 3 comparaciones poso tener 2 años, pero si tuviera 4 grupos, el grupo B C y de áreas taxi, comparaciones, y en cada 1 tendría un riesgo de un 5 por 100. Entonces, en el total de comparaciones en la familia de comparaciones, el riesgo de que alguna sea la meta, qué diferencia, cuando no es cierto, la el riesgo de cometer un error tipo 1 muy alto enmendante porque son 6 Entonces se incrementa notablemente, se incrementa hasta el punto de que habría un 26 por 100 de probabilidad de tomar una decisión incorrecta. Por tanto, el riesgo de convencer en un error tipo, 1 es muy alto, cuando se hacen muchas comparaciones poso que podemos hacer antes, pues podemos utilizar distintas pruebas de comparación. Podemos utilizar unas incorrección como la diferencia mínima, significativa, muy utilizada, muy utilizada, pero no es nada aconsejable. Esto es igual que realizar en este caso si se aprobase independientes 1 2 3 4 5 6 cada una de ellas bueno eso está bien cuando tiene 2 grupos, pero cuando tienes 6 están relacionados entre sí no es nada nada aconsejable. Lo lógico sería hacer una corrección, una corrección para evitar ese riesgo de tomar una decisión equivocada, y para eso tienen otro tipo de comparaciones tuviese cebó en Ferrol. Ni bueno, hay muchísima más. Hemos dicho que la diferencia mínima significativa no aplica ninguna corrección, nada, nada aconsejable. Toque, y en la más frecuente y la más recomendada, solo tiene una, una pequeña pega, que requiere que los tamaños más chalés, sean iguales bon Ferrol ni no se recomienda, porque muy conservadora esto quiere decir que, sobre todo, si se realizan todas las comparaciones posibles, porque te da probabilidades, no sea una baja de las normales. Entonces es posible que diga que no hay diferencias entre 2 grupos cuando sí que las hay, y esto ocurre cuando hay muchas comparaciones está ideado solo para cuando quieres hacer algunas concretas. No todas se EFE. También le ocurre lo mismo muy conservadora. Además, está diseñada para, cuando quiere hacer comparaciones complejas una frente a varias o 2 frente a otros 3 grupos tampoco tampoco bueno a nada es esa comparación es planeada no no se pueden hacer en el famoso; y, por último la dejo, que es una modificación de la EBA en Ferrol ni que, que está bastante bien; incluso sería la preferible después de toque, y cuando el tamaño muestral no son iguales. En cualquier caso, todas estas requieren que se cumpla la homogeneidad varianza y que los en esa aproximadamente igual; es bueno nuestra recomendación Pues utilizarla de la que no vamos aquí y tenemos una pestaña para aprobar. Pues eso, que simplemente trasladamos el factor que nosotros queremos, que tienen sus 3 niveles, y entonces nos hace las comparaciones. Entre esos 3 niveles. Hay diferencias significativas; hay diferencia significativa; haya diferencias significativas y puede obtener el tamaño del efecto de esas diferencias. Bien, aquí además hay otro tipo de contrastes. Los contables o como unas comparaciones, pero un poco más especiales vamos a verla marcando cada una de estas. Por si podrían ser de interés. Se van a hacer tantas comparaciones como grados de libertad. Tenga el modelo, tengo 3 niveles. El factor grupo tiene 3 niveles. Tengo 2º grados de libertad, 1 menos, así que aquí podrá hacer 2 contrastes. Si hago un contraste de desviación, me va a comparar, él siempre empieza por el segundo, es el segundo frente a todos y el tercero frente a todos, sería como motivación frente a la media general y apoyo académico. Frente a la media general, a ver si hay diferencias significativas. Motivación no difiere del conjunto de todo el apoyo académico, sí que difiere apoyo, académico, es menor, al ser negativo en menor que el que la media global significa. Hay menos ausencias en menor hora de absentismo, con apoyo académico que el conjunto de los 3, el simple me compara 1 a 1, pero siempre frente al primero, el segundo, frente al primero y el tercero frente al primero si hay diferencias significativas entre ellos diferencia y tienen sentido si los niveles son originales, por ejemplo, por qué Porque me compara el segundo con respecto al primero y el último con respecto o el tercero, frente a los 2 primeros en orden, tiene más sentido cuando son ordinarios. En cualquier caso, podría tener algún sentido en ciertas situaciones, así que motivación difiere significativamente mentoría y apoyo académico. Consigue menos sentimos que lo mentoría, motivación en conjunto. El dejarme muy parecido mentoría frente a motivación y apoyo académico motivación frente apoyo académico, sería como los primeros frente al último y además en orden mentoría. Tiene más horas de absentismo que motivación y apoyo académico en conjunto, y motivación. Tiene más significativamente más horas de absentismo, que apoyo académico y, si fueran ellas repetida, sería una frente a otra memoria frente a motivación y motivación, frente a apoyo académico y por último polinomio tal si tengo 3, 3 tipos de donde tengo el gráfico. No lo he hecho, no lo he hecho, aunque error. Media marginal, desestimadas. Se puede hacer un gráfico. Entonces veo que esto marca como una tendencia, pero esa tendencia claramente lineal pero con 3 puntos la tendencia podría ser cuadrática. Si este punto estuviera aquí me estaría marcando una o invertida una parábola que es una tendencia. Cuadrática pues con 3 puntos. Yo puedo probar una tendencia lineal o una tendencia cuadrática. Los datos, no. Si quieren una tendencia cuadrática, se puede admitir que siguen una tendencia línea muy bien. Me queda solo un pequeño detalle aquí y tienen que ver con el modelo, con el modelo estadístico. Bien, vamos a suponer que nosotros estamos estudiando la altura en la población española, y yo no tengo nada con que predecir la altura, así que digo. El mejor modelo es que yo no me arriesgo mucho y diga que cualquier persona tiene por estatura la media. Unos 70. A esto llama modelo nulo, el peor de los modelos que se puede utilizar, que dice que todos somos exactamente iguales. La altura, una persona, la media claro cometió un error. Este es el error total que yo cometo por decir que cada persona mide la media, equivale a la varianza. El modelo nova. Plantea que este no es un buen modelo para predecir que es mejor que cada persona se si se se predica o se asigne la altura. Cada persona va equivaler a la media de su grupo, no la media global, de manera que si eres hombre, tu media va a ser unos 77, si eres mujer medio va a ser unos 63 Claro que sigo cometiendo un error, un error. Ahora cometo menos error que con el otro, porque como siga cometiendo el mismo error significa que este modelo no sirve. En eso consiste probar la hipótesis de un enfoque de la comparación de modelos, hipótesis nula el modelo nulo, el mejor modelo es el nulo, porque el error, si yo utilizo un modelo, no va. El error que sigo cometiendo es exactamente igual que el cometido que cometía o bien el modelo Nogal sería admitir la hipótesis alternativa que el error que yo cometo utilizando el grupo como como predicción, es inferior al error que cometería utilizando la medida para todos, que modelos es el mejor, el que consigue unos errores inferiores. Bien, realmente reduce el error. El modelo que yo estoy utilizando realmente reduce explicar esta variación. Eso es lo que mide el tamaño del efecto en un modelo Anova. Tiene un modelo de regresión, como veremos cuál es la magnitud de porcentaje de varianza que me explica el modelo. Si la hipótesis nula sería que el modelo explicado 0 por 100 no es capaz de explicar nada. Ahora, si el modelo, si yo rechazo la hipótesis nulas porque consigue, explicaron porcentaje de esa variación. Ese porcentaje podrá ser bajo medio alto, en función de cómo sea el índice que mide esta mañana. El efecto, y tengo 3. Está cuadrado, está cuadrado parcial y omega cuadrado? Está cuadrado? Es equivalente al coeficiente de determinación que veremos en regresión. Es el porcentaje de varianza que me explica el factor, está cuadrado parcial ese mismo porcentaje, pero sin tener en cuenta lo que expliquen otros factores pero lo expliquen otros factores significa en diseño factorial es en diseño más complejos aquí no hay otros factores por eso, en una nueva simple, que solo hay un factor está cuadrado, siempre es igual al cuadrado parcial, en cualquiera de los 2 casos no es aconsejable. En diseños inter sujetos simples Por qué Porque da una estimación, un poco más alta, de la, de la, de la que sería preferible o me cuadra que es equivalente al porcentaje de la varianza explicada en la población, no solo en la muestra, sino en la población. Es una estimación y sería el indicador en cuanto a las comparaciones. Poso, pues, el tamaño del efecto de la deuda como como ya habíamos dicho eso y que es recomendable cuadrado. No podemos venir donde nosotros planteamos el modelo y solicitar al cuadrado y se irá al principio. Donde me dice que la magnitud del efecto es muy alta sería como decir este modelo. Consigue explicarme el 43 por 100 de la diferencia que hay entre las personas de este estudio también se puede decir que la diferencia que hay entre los distintos grupos tienen una magnitud muy alta. Hay grandes diferencias ahora para saber entre qué grupos, pues ya me tendría que ir a las pruebas a las pruebas. Pues bueno, pues vamos a visto esto. Vamos a hacer lo mismo con otro ejemplo, y vamos a abrir un ejemplo. Es sobre audios enviados con basa sí veo las variables. Tengo la variable género masculino y femenino y uso de redes que me va a decir si estos chicos, adolescentes, chicas, utilizan poco nivel medio o utilizar mucho las redes sociales y luego para cada 1 tengo cuántos audios manda en promedio Aldea, cuánto dura minutos, no en segundo. Bueno, vamos a dejarlo en minuto porque, como los datos son simulador lo mismo, nada que sean en minutos que en segundos, así que tengo en promedio de un minuto en promedio, 6 en promedio, 10. Esto parece, si 31 minuto tengo que parece demasiado, así que venga, vamos a poner un poco más creíble y vamos a decir que sean segundos de duración promedio en segundos siempre es un poco más. Bien, pues tengo las donaciones segundos, y me planteo. Me planteo, existe diferencia entre el número de audios que envían chicos y chicas. Bueno, le puedo hacer aquí una nueva haría una nueva normal donde trasladaría el número de audios como variable, dependiente y género como un factor que alguien me diría a quien me llame imaginable por hacer un gráfico, trasladar esto y decir. Pero si solo 2 grupos, porque no hacerse una prueba, que es exactamente igual la nova es exactamente igual que la prueba, que cuando solo tengo 2 grupos eso sí tengo comprobar los supuestos y la prueba. Homogeneidad de varianzas la normalidad y la gráfica y me dice que la que la homogeneidad varianzas no se cumple, no se cumple y que la nueva normalidad hay ahí estamos sí que hay 90 sujetos y sería recomendable la prueba de colmo, Gorospe antes que la prueba de esa, pero voy, pero pero es una muestra dónde hay alguna alguna incidencia? Así que vamos a asumir que se cumple y luego y luego veremos qué pasa. Si asumimos que no se cumple muy bien. Asumimos que se cumplen normalidad, pero que no se cumple. Homogeneidad, varianzas. En ese caso debería hacer una nueva robusto y eso lo tengo que no va de un factor que cuando entró mi variable dependientes en el número de audios, en función del género, ya me indica, se está asumiendo que la varianza son diferentes, que no hay homogeneidad, efectivamente, por eso estamos y no hay diferencias estadísticamente significativas. El límite está en un 5 por 100 entre chicos y chicas, pues se acabó el análisis y no tengo nada, nada más que hace nada. Si yo hubiera hecho una nueva no paramétrico sería el de crujan. Cuales hubiera sido igual número de audios por género y entonces aquí aquí tenía que concluir que sí que existen diferencias significativas y cuando hago comparaciones poso me dice. Efectivamente, lo mismo. Bueno, es que no tiene sentido por eso lo digo grupos. La la diferencia de utilizar una nova agua, aunque sea robusto de una prueba, no paramétrica por nos pueden ocurrir, no pueden ocurrir estas cosas. Técnicamente habría que haber utilizado la nueva robusto, aunque perfectamente se podría utilizar una nueva no parámetros si yo obtengo el tamaño del efecto tamaño del efecto es de un 3 por 100 si este pertenece al de la séptima para no equivocarme. Si yo aquí obtuviera el tamaño del efecto donde lo tengo, en este vería que es de un 1 por 100 de que estamos hablando, de que estoy diciendo que hay una diferencia, pero es que esa diferencia significativa es que baja, que es que es bastante baja. Por eso, por eso está en el límite que un modelo me dice que sí y otro modelo me dice que no, porque realmente la significación práctica de esa diferencia. Bueno, pero también teníamos, queremos saber si hay diferencias entre el número de audios en función del uso de las redes sociales y de nuevo PSOE. De nuevo todo el recorrido la Nova. Hay diferencia estadísticamente significativas con una nueva paramétrico que lo puede utilizar si se cumplen los supuestos. Vamos a verlo. Homogeneidad, normalidad. En este caso no hay dudas con la normalidad, no hay dudas, pero no se cumple. Homogeneidad de varianzas, por tanto, tengo que hacer una nueva robusto. Negocian? No va a engañar. No va de un factor donde se asumen que la varianza no son iguales número de audios en función de redes sociales Que hay. Diferencias estadísticamente significativas, como aquí sí que diferencia estadísticamente significativas. Puedo pasar a hacer las pruebas? Pues eso, que en el caso de una nueva robusto son las que son. Pruebas poso realizadas, asumiendo que la varianza no son iguales, que nos confirman que diferencias entre bajo y medio, que que. Las personas que tienen un uso bajo de redes sociales hace menos, manda menos audios que las que hacen un uso medio, las que son las que las personas que hacen bajo uso de las redes sociales mandan menos audios que las que hacen un alto uso, y así sucesivamente, y vemos que hay diferencias entre los 3 niveles. En el caso del de la Nova, robusto no tengo medidas del tamaño del efecto, debería utilizar la medida del parámetro, así que estoy hablando de un 24 por 100, que es una magnitud considerable. Digamos que un 24 por 100 varianza aplicada, es un alto porcentaje de variación y, en el caso de las comparaciones poso que debería utilizar las otras. Pero aquí simplemente estimó el tamaño del efecto. El tamaño del efecto sería de tipo medio de tipo medio y de tipo. La diferencia entre el bajo, muy bien, pues solo me quedaría sí si aquí por lo que hubiera sido no se hubiera cumplido el supuesto normalidad, pues hubiera hecho una prueba de calculables número de audios, en función de redes sociales, me difieren, indica que diferencia estadísticamente significativas. El tamaño del efecto es de un 24 por 100, también muy alto, y hay diferencias significativas entre los distintos niveles. Resaltar en el otro caso como con con 1 paramétrico sí pero con el robusto, no es que el porcentaje era mínimo, era mínimo, estábamos entre poco y nada y a veces pueden ocurrir esas cosas. Por eso es tan importante la significación estadística y también la significación práctica. Bueno, hasta aquí el vídeo de hoy, gracias.

Intervienen

Juan Jose Lopez Garcia
Profesor Titular de Metodología de Investigación

Propietarios

Juan Jose Lopez Garcia

Comentarios

Nuevo comentario

Serie: Jamovi (+información)

Análisis Estadístico Básico con Jamovi

Descripción

En esta serie de videos se muestra el uso de Jamovi para la realización de los análisis estadísticos más frecuentes en la investigación empírica. Incorporación de nuevos contenidos cada semana.