Idioma: Español
Fecha: Subida: 2020-04-29T00:00:00+02:00
Duración: 23m 39s
Lugar: OnLine - Online
Lugar: Curso
Visitas: 1.679 visitas

Tema 7 - Parte II

Verificación de las suposiciones iniciales del ANOVA y comparaciones múltiples de medias

Descripción

En este video se aborda como verificar las suposiciones iniciales de normalidad y homocedasticidad, y como realizar comparaciones múltiples de medias mediante el método de Tukey. Además se presenta el contraste de Kurskal-Wallis como alternativa al ANOVA cuando no se verifican las suposiciones iniciales.

Transcripción (generada automáticamente)

Hola, alumnas y alumnos de la asignatura de Estadística declarado de Ciencias Ambientales, vamos en este vídeo la segunda parte del tema 7, donde lo que vamos a hacer va a ser completar el análisis de recordar que ahora mismo lo que estamos viendo cómo se lleva a cabo en la comparación de media me acuerdo de más de dos poblaciones y de lo que estuve viendo el vídeo anterior. Nosotros hablamos una situación en la cual tenemos más de dos variables que nos damos por un instructor, las cuales asumimos de partida que tienen una distribución normal y constante. Igual así lo que se mal. Hipótesis de la suposición de Homo certifica que además consideramos que la variable que subí son independientes. Cuando tenemos esta situación lo que hemos visto es que a través de la nova no, lo que hemos visto es que a través de la nueva podemos contactar la hipótesis de que la media de las iguale frente a la hipótesis alternativa de que por lo menos hay una pareja de variables o poblaciones para las cuales sus medidas son distintas. Por lo tanto, supone una extensión del problema abordando el tema anterior. Al caso de más de dos poblaciones, la cuestión ahora es que esas hipótesis de contactar y la técnica de la nueva que utilizamos solamente son válidas y se verifican estas hipótesis que hemos considerado anteriormente hipótesis de independencia se oiga simplemente por la forma en que se obtienen. Las observaciones no va a ser un problema al que nos tenemos que preocupar, puesto que los datos vienen dados de antemano, pero si quieren verificar la normalidad, por otro lado, la omc, electricidad o igualdad, vamos a ver cómo llevamos a cabo esa verificación de las suposiciones iniciales. Entonces, resumiendo lo que hemos dicho anteriormente. El análisis de la alianza parte de esa hipótesis de normalidad y emocional y ahora hay que verificar, puesto que si no, resultado o conclusión de la Nova no van a ser válidos. Recordar que yo puedo realizar cualquier técnica a cualquier conjunto de datos, incluso datos que se han inventado, pero otra cosa es que eso esos resultados tenga sentido o sea válido en particular en la nueva. La validez solamente está asegurada si la normalidad y la igualdad de la pareja, cómo vamos a llevar a cabo esa modificación de hipótesis inicial? En primer lugar, recordarán que siempre he dicho que es un análisis estadístico intentar completar la información que con lo contrate con técnicas gráficas, que apoyen las conclusiones que obtengan. Acuerdo no es una cuestión que yo vaya a pedir en el examen, pero sí es una cuestión que debería de tener en cuenta en usos posteriores de la estadística, ya sea porque tienen que emitir un informe Trabajo, Fin de, Grado o cualquier estudio de tipo científico. Aquí en el caso de la nueva, la técnica gráfica más fácil y más interesante de usar la de caja de la muerte, de acuerdo, vamos a hacerlo de caja. El ejemplo con el que hemos hecho la primera parte de entonces aquí tenemos una repuntado relativa, mediciones efectuadas por distintos laboratorios, y voy a recuperar esas observaciones. Entonces teníamos cuatro muestras de cinco laboratorios y recordar y esto es muy importante porque también lo vamos a necesitar para esta parte que juntamos todos los datos en un mundo vector de datos, el texto de 14 puntos, ejemplo uno después hemos creado un vector de factores, una institución que me indica con un 5, con una clave, que en este caso la clave son La 1, La 2, hasta las cinco de donde provienen cada una de las observaciones que están almacenadas ahora en este vector. Entonces creamos es el resto de factores y lo que teníamos entonces era un vector con todos los datos de acuerdo, 50 observaciones, y después teníamos otro vector que el resto de factores del 11 indicado, con una clave de dónde proviene cada una de las observaciones, bien cuando ya lo tenemos. En ese formato podemos generar diagrama de caja de las cinco muestras juntas; en un único gráfico la función que me permite, generarla, es estar aquí y fijarlo que aparece aquí y la distinción del vector de datos y aparece. El resto de factores se separaban por este simbólico que aparece encima de la letra. Bueno, pues sí lo ejecutado; ese comando fijado que lo que obtenemos o no encaja bigote para la muestra del laboratorio 1, 2, 3, cuatro cinco de acuerdo. El uso de diagramas, de caja para identificar la normalidad es muy sencillo, basta ver si hay simetría dentro del drama de caja; bigote asimetrías, una indicación de que es posible mantener los datos anormales. Una cuestión adicional es que nosotros esa normalidad con el contraste de Samir Will que conocíamos del anterior acuerdo y la otra cuestión relativa a la variante porque fijaron que la de la amplitud de los diagramas de caja indican como la Maria Anza de los conjuntos de Marta, desafortunadamente, el uso de diagramas, de caja para identificar normalidad y como una primera aproximación es válido cuando se tiene un tamaño muestra relativamente adelante, 30, 40, 50 observaciones. En este caso, como el tamaño pequeño, no muy informativo, pero aún así quiere indicado cómo poder obtenerlo para incluirlo en cualquier informe o cualquiera, volvemos a nuestro a nuestro tema, y entonces, como hemos dicho, la hipótesis que hay que verificar son las de normalidad y la de igualdad. La hipótesis de normalidad ya la tenemos resuelta. En realidad tenemos una herramienta que se contacte de Spirou y, por lo tanto, tendría que hacer un contraste de Spirou para cada una de las muestras por separado que necesito tener las muestras separada; es decir, no puedo aplicar el servido a los datos del ejemplo todos juntos, sino que tengo que hacerlo para cada una. La muestra que aparecen aquí por lo tanto necesito tener almacenadas la información de lo tanto muy estable en los dos formatos muestras separada o en una muestra, con todos los datos, junto más el vector de factores, así que una vez que tenemos los datos y muestras separadas simplemente y aplicadas a cada una de ellas, este caso es claro, la izquierda o 36 grande la aceptamos la normalidad aquí es cero 28 nueve tenemos la misma situación que antes. 137, cuatro la misma situación que antes hicieron 6, 5, siete en la misma situación de antes. Por lo tanto, podemos considerar que todas nuestras variables y una distribución, bien el siguiente paso era verificar la homogénea electricidad, igual de bien, pues para eso tenemos una herramienta muy importante, que es la que se llama el contact de contacto. Permite contratar como hipótesis que la variedad de poblaciones son iguales frente a la hipótesis alternativa de que haya una pareja que son distintas. Este tipo de contrato, como podéis ver, es imposible calcular. Jamás se puede hacer, pero con mucho tiempo no hay ningún problema. Nosotros lo llevaremos a cabo, como siempre lo calcula. Haremos con cómo se lleva a cabo este contraste con algo muy sencillo. Utilizaremos la función? Vale? Entonces tenemos que tenerlo los datos en el formato de todos los datos, en un conjunto de factores, y cuando lo tenemos de esa forma, el contraste se analiza esa de esa forma. Aquí tenéis vuestro estadístico y aquí tenéis vuestro solo dos valores que tenemos que recuperar para continuar en este ejercicio. En este ejemplo de contrastes, 4, 4.235, 2, con lo cual dolor suficientemente grande para cualquier nivel de significación que fijemos, aceptaríamos la hipótesis, ha hecho su cerebro y, por lo tanto, la apariencia serían igual, es decir, que ya tenemos verificada la hipótesis de normalidad y de igualdad, y eso lo que hace ahora es que podamos dar por válidos los resultados de la nueva y, por tanto, como vimos en vídeo anterior, la media son distintas, bien llegado a este punto en el punto en que la media son distintas y ahora lo que nos plantea es ver qué pareja te media podemos considerar distintas y además no solamente eso, sino que podremos ver cómo se ordenan esas parejas de medidas, que son distintas. Bueno, para abordar este problema hay muchas técnicas disponibles en lo que se llaman las técnicas de comparaciones múltiples de media, y entre todas ellas la que vamos a seleccionar es el método de Turquía, que es una que se utiliza y que mejor funciona bien. Entonces yo digo que no es la única técnica, mucho más técnica. Esa técnica se llama la de contacto múltiple, de media, comparación en múltiples de media y de entre todas ellas lo que vamos a hacer es utilizar el contraste de Turquía, es un grupo de técnicas, en realidad son un grupo de técnicas que lo que hacen es construir lo que se llama intervalo de confianza simultáneo para cada pareja de media, que podamos considerar el problema que tenemos. Es decir, por ejemplo, en nuestro caso tenemos cinco variable. Entonces, las parejas de medidas que pueden considerarse la primera media con la segunda, la tercera de la cuarta y la quinta, cuanto a posibles comparaciones, la segunda con la tercera, la cuarta y la quinta ya llevó otra comparación normal. En total 7. La tercera la puedo comprar con la cuarta y la quinta ya serían nueve comparación en total, y la cuarta la puedo comparar con la quinta tuvo esta técnica que me va a generar, son 10 intervalos de confianza para eso 10 posibles, pareja de media, y decidir, a partir de ese intervalo, cómo se comportan las medidas que estoy comparando cada 1, el hecho que sean intervalo de confianza simultáneos. Lo que quiero decir es que la probabilidad de que todos los intervalos que estoy considerando contengan a todas las parejas de media, está fijada antemano al 25, al 99 por 100. Bien, esto es muy importante porque la técnica de utilizar los intervalos de confianza que vivimos en el tema anterior para cada intervalo no asegura que la creación por separado su intervalo, la, no asegura que la probabilidad de que todos los intervalos a la vez sea negado por ese método de 1, 25, 99 por 100 no es así para poder hacerlo tenemos que utilizar el intervalos de confianza simultánea. Bien, entonces nosotros lo vamos a utilizar. El base del método de tu método, de tu, que lo que se hacen es construir intervalo para cada pareja de diferencia, musgo y musgo j. De acuerdo a esta fórmula es una fórmula compleja. Aparece un balón de ocu que se calcula, a partir del número de variables del alfa, que utilicemos en el intervalo de confianza, y de este valor. Es el que aparece aquí. Por lo tanto, no es sencillo de calcula y por supuesto nosotros vamos a hacer cosas. La forma en que se utilizan intervalos muy sencilla, sin intervalo, tiene, los dos extremos positivo quiere decir que la diferencia, muy suprimen o musgo j va a ser positiva y, por lo tanto, la media mayor que los ojos, si el intervalo tienen los dos extremos negativo. La conclusión es al revés, me vi muy sujeto a ser negativo y, por lo tanto me vi base menor que los ojos. No queda el caso última, que el extremo inferior sea negativo y el extremo superior sea positivo. De acuerdo. Entonces, en este caso no podemos decir nada porque la diferencia puede ser negativa, puede ser positiva, pero también puede ser igual hacer. Por lo tanto, no podremos concluir significativamente nada en el caso en que el intervalo sea negativo o extremo superior positivo. Solamente cuando los dos extremos son negativos o positivo. Podemos concluir significativamente algo sobre cómo se comporte esa diferencia de media y cómo se ordena esa pareja, pues lo vamos a hacer, es ver cómo podemos obtener eso intervalo con forma de obtenerlo mediante la función Tuke Sede, y eso lo que hace es aplicar a los datos, a la conclusión de la nueva, a todo lo que hacemos con la nueva construir esos intervalos, y aparte recordar esto es un intervalo tenemos que indicarle el nivel de confianza del intervalo por ejemplo vamos a hacerlo aquí al 25 por 100. Bueno, cuando lo ejecutaron ese comando fijará lo que aparece, aparece una tabla bastante larga del agua o tiene que fijar en las dos columnas que aparecen aquí esas dos columnas. Lo que generan son el extremo inferior y superior del intervalo de confianza que hemos visto en las fórmulas anteriores, y aquí aparecen 10 intervalos de conferencia de confianza que se corresponden a las diferencias que se indican aquí; por ejemplo, ese primer intervalo se correspondería a la diferencia de la media del laboratorio; el segundo menos la media del laboratorio. Primero, por ejemplo sería el intervalo que se genera para Mursi, cuatro menos y así para cada uno de los 10 intervalos que aparecen allí fijarlo que aquí aparecen todas las posibles parejas que podamos montar de vih y musgo j tenemos la primera con el segundo, con la segunda, con la tercera, la cuarta y la quinta, la segunda con la tercera la cuarta y la quinta la tercera con la cuarta y quinta y la cuarta. De esa forma recorremos todas las posibles pareja de media de las cinco variable, entonces como he dicho anteriormente los intervalos que tienen funciones nativo y estemos superior positivo no pueden utilizarse para concluir en ningún sentido puesto que la diferencia Mosul donde no supo uno en este caso podría ser negativa igual a cero positiva y solamente nos fijaremos en aquellos intervalos en los cuales los extremo inferiores y superiores a la vez o son negativo o son positivo, por ejemplo, este primer intervalo que aparece aquí tiene extremos inferior y superior negativo. Eso lo dice porque hemos un cuadro muy bueno en negativo. Por lo tanto, musgo 4, va a ser menos que un grupo, y así tenemos que proceder con todo lo integral que aparecen aquí voy a volver a la transparencia para hacer el análisis correspondiente. Entonces, si utilizamos todos los intervalos que hemos generado anteriormente, hemos dicho lo que son negativos impositivo lo descartamos, no se puede hacer nada, con lo cual descarta también que esté aquí sí que lo podemos utilizar hemos dicho antes música cuatro base menorquín muy bueno estoy aquí ocurre lo mismo lo podemos utilizar en este caso lo que tendríamos que Muse cinco menos, muy bueno en negativo. Por lo tanto, un sus cinco ser que supo uno intervalo, no nos sirve para nada, tampoco que tampoco esté si nos sirve para decir que hemos un 4, tres que aquí también nos sirve para decir que hemos sufrido mucho, y aquí nos sirve para, con lo cual la conclusión final que tendríamos de aplicar, el método de tu, que sería la siguiente, tendrían que Moix un cuarto menor. Como su pueblo, como consecuencia de este intervalo apareció aquí pero concluiremos que, Mosul, cinco a partir de intervalo, concluiremos que queremos un cuadro a partir de tintero y, por último, concluye que usó 3.005 a partir de ahora. Podemos también ver un poco eso resultado con el diagrama y caja bigote de acuerdo. Aquí lo que tenemos que Muse uno era mayor, que hemos un 4, cinco eso lo vemos claramente aquí no encaja porque caja mucho más bajo que tiene aquí de acuerdo. La otra conclusión que teníamos era que, Mosul, tres era mayor que un 4, 5, pero sin embargo, no hay evidencia suficiente para decidir, por ejemplo, que un insulto mayor, como su cuadro cinco usualmente. Aunque aquí se ve ese comportamiento en organigrama de caja, para poder concluir significativo mente con la técnica de tu que hubiéramos necesitado más observaciones, con lo cual conectó ya cerramos completamente nuestro problema. Bien, una cuestión que se puede generar a partir de aquí es que pueda fallar una de las hipótesis inicial de nuevo, un acuerdo. Bueno, pues, si hay alguna hipótesis inicial de la nueva y no se puede aplicar ni a la nueva y la técnica de tu que entonces podríamos utilizar como técnica para detectar diferencias entre esa variable, lo que se llama el contraste de el contraste de es una extensión del contrato de uil, Cookson- Whitney del tema anterior. Para el caso en que tengamos más de dos variables depende independiente. Entonces ese contraste lo que hace es contratar como hipótesis que la media son iguales frente a la hipótesis alternativa de que por lo menos hay una pareja de variables que tienen mediana distinta. Eso es lo que se conoce como contraste de guardar, fijar que hace lo mismo que la nova, pero en vez de fijarnos en la media, nos fijamos en la mediana. Igual que el contraste Wilco son hace lo mismo que contacte de la estudian pero en vez de cuánto medias, pues con dos medianas bueno, como se lleva a cabo, el contraste de cual es bueno. Se utiliza esta función que la función club Al Punto y de Onagawa necesiten los datos almacenados en este formato, que clamó Ran y obtenemos nuestra tríptico de contracción y nuestro valor no incluye ni la fórmula. No incluye la fórmula de este tipo de contrato porque son bastante complicada de acuerdo, y si volvemos a nuestro ejemplo lo que en el caso en que no se hubiera modificado aquí no es necesario porque se verifica la hipótesis. Pero supongamos que no se verifica bueno, pues, si utilizamos contraste con lo que haríamos, sería contactar con él como hipótesis nula que la mediana son distintas, frente a la hipótesis alternativa de que haya una pareja de variables de entonces, recuperando los datos. Este valor es una cantidad muy pequeña para cualquier bar ordenanza, con lo cual rechazaremos la hipótesis nula de este contraste, pero no puede ser simplemente contraste. Aceptaremos una hipótesis alternativa y, por lo tanto, concluir que por lo menos hay dos medianas que son distintas. Se podría completar con alguna técnica adicional sin llegar al contraste de tu que, pero no lo voy a incluir por cuestiones de tiempo, pero saben que se pueden utilizar? Bueno, pues conectó. Dejamos cerrado la parte de la nueva y lo que voy a hacer es recuperar. El esquema de trabajo de la nueva, que es similar a lo que estuvimos haciendo en el tema anterior para la parte de comparación entre dos variables. Entonces voy a recuperar aquí ese trabajo. Y vemos aquí la implementación de todas las técnicas que hemos visto anteriormente. Entonces la situación es variable con mayor. Igual que lo primero que nos planteamos la variable. Si hubo una distribución normal lo abordamos el contraste. Si las variables son normales y lo siguiente que hacemos es aplicar el para ver si la apariencia son iguales o son distintas, si la variante son iguales, entonces lo que tenemos es que se la hipótesis de la nueva, y podemos aplicar la tabla, no va en contra de si las medidas son iguales frente a una pareja en las cuales son distintas en el caso en que se siente que las medias no son iguales, aplicamos método Duque para detectar entre que hay diferencia y cómo nos podemos ordenar activar paso. No hay normalidad, por lo que hacemos una distribución. Lo normal, así que transformamos los datos, con el hogar imperial y hacemos nuestro contraste. Para haber sido normalidad en el caso de que haya normalidad. Realizaremos los pasos 2, tres cuatro para dato transformado mediante. Lo haré me acuerdo bien. Si no hay normalidad de acuerdo y no podemos realizar todos estos vaso o si no se verifica la hipótesis de igualdad de la Alianza en cualquiera de esas situaciones, lo que hacemos es aplicar el contraste de cal para detectar diferencia entre la mediana de la pared y, por último, se que como resultado de la nueva hipótesis, nula la conclusión final es que no existen diferencias entre la pared, bien la parte clave de la normalidad. Lo que sí que es verdad es que, si hay que hacer el análisis de normalidad, pues alarga mucho los problemas. Yo no voy a plantear, ni en los ejercicios ni en el examen una situación donde no haya normalidad y donde sí que haya normalidad, porque eso nos llevaría a realizar mucho contraste. Por lo tanto, si la variable no se una distribución normal, lo que habría que hacer saltar directamente a la aplicación del contraste, igual que si la apariencia no son iguales, directamente, saltamos al contraste con este. Ha dejado muy cerrado toda la parte de la nueva, y eso nos queda la última parte tercera de comparación de proporciones o probabilidades, más de dos poblaciones, un saludo y, y no soy hasta luego.

Intervienen

Felix Luis Belzunce Torregrosa

Propietarios

Felix Luis Belzunce Torregrosa

Comentarios

Nuevo comentario

Serie: Estadística (Grado CC. Ambientales) (+información)

Asignatura (1797)

Canales

Tema 5 - Parte VIII

Inferencia estadística para analizar la probabilidad o proporción de un suceso