Idioma: Espa帽ol
Fecha: Subida: 2020-05-06T00:00:00+02:00
Duraci贸n: 37m 51s
Lugar: OnLine - Online
Lugar: Curso
Visitas: 1.501 visitas

Tema 8 - Parte II

An谩lisis de la varianza en regresi贸n y coeficiente de determinaci贸n

Descripci贸n

En este video vemos el análisis de la varían como herramienta para contraste si al pendiente del modelo es 0, y el uso del coeficiente de determinación para medir la bondad del modelo

Transcripci贸n (generada autom谩ticamente)

Una alumna del uno de la asignatura de Estad铆stica de Ciencias Ambientales en este segundo v铆deo del tema de las relaciones entre variables. Vamos a continuar con el an谩lisis de regresi贸n lineal y, en particular, vamos a ver c贸mo se hace, inferencia en este modelo, que estamos considerando. En el an谩lisis de regresi贸n l铆nea recordamos que la situaci贸n que estamos considerando es el estudio de una relaci贸n entre dos variables, y si a partir de un conjunto de observaciones, desat贸 variable conjunto de observaciones, sub铆 y sub铆 en la suposici贸n que estamos considerando en cuanto a la forma en que se relacionan la variable y la variable que lo hemos puesto como las suposiciones, normalidad e independencia, comentamos en el v铆deo anterior que la modelo que estamos considerando que los valores de Kisufim, que son valores que fija el experimentador, son valores que se relacionan a trav茅s de la variable en la historia y sui esta cantidad es aleatoria mediante esta relaci贸n en la cual la variable ley se descompone, en un trozo que es una relaci贸n lineal, con la variable m谩s otro trozo, que es un trozo que es aleatorio y ese plazo aleatorio, consider谩bamos que ser铆a una distribuci贸n normal de medio hacer o equival铆an obstante, sin m谩s cuadra, comentamos en el tema anterior en el d铆a anterior que ese modelo se puede escribir de manera equivalente diciendo que en realidad para cada equis sui lo valore y suya solo asociados. Son valores aleatorio, que tienen distribuci贸n normal, que son independiente y verifica que su media tienen una relaci贸n lineal con el valor de la equis y su alianza constante. Se recuerda es el ejemplo artificial que utilice para explicar algunas de las ideas de este modelo. La idea era que cada vez que fijamos un valor de que por ejemplo equis, igualado los valores de la variable y son aleatorio y se comportan como una distribuci贸n norma donde la media de esa variable normal est谩 colocada sobre la recta mas ve que la apariencia de esas poblaciones normales son constantes. Lo que comentamos en un 煤ltimo v铆deo, que lo 煤nico que nosotros conocemos son las observaciones, lo 煤nico que vamos a conocer, su punto de aqu铆 y lo que queremos es hacer obtener informaci贸n sobre esta recta y tambi茅n impl铆citamente ya veremos d贸nde parece eso tenemos que vamos a obtener informaci贸n de sin m谩s cuadra y a partir de ah铆 que eso es lo importante y muy interesante, nosotros vamos a poder utilizar esta estructura para lo siguiente, ya que si yo fijo un valor de nuevo a partir de la estructura creo que hemos ajustado a partir de lo tanto. Podemos hacer una predicci贸n de cu谩les ser谩n los posibles valores, de ah铆 que yo voy a observar para ese valor y es aqu铆 donde entra en juego la inferencia estad铆stica. Entonces, volviendo a la transparencia. La cuesti贸n ahora es que lo primero que me va a interesar es ver c贸mo puedo hacer una estimaci贸n de esos par谩metros. Hay, ve que es un desconocido recordar que los par谩metros desconocidos son A, b y se inmaculada, pues lo primero era ver c贸mo se puede obtener una estimaci贸n de esos par谩metros, de acuerdo a las ideas de timadores que hemos visto en el tema 5. Bien, en este caso los de ah铆 debe no hay que preocuparse o por ellos, en el sentido de que son ya valores que nosotros conocemos. Eso de ah铆 debe, vienen dados por el coeficiente de la renta de m铆nimos cuadrado, que ya en el tema de Estad铆stica descriptiva y lo que vamos a hacer ahora es recordar las expresiones que tienen esos par谩metros de la recta de m铆nimo escuadra. Entonces para obtener la expresi贸n de eso, de esa pendiente y esa constancia en la recta de m铆nimos cuadrados se utilizaba de manera indiscriminada datos estad铆sticos, que son por uno la cobard铆a; danza, entre las parejas que sub铆 y sub铆 o el coeficiente correlaci贸n entre las parejas equis. Sub铆 y si cuando vi efectos estad铆sticos el tema estad铆stica descriptiva lo vi como unos estad铆stico descriptivo que intenten estudiar el grado de asociaci贸n entre la variable equis y y aqu铆 lo que vamos a utilizar son esos estad铆stico como herramienta para hacer estimaciones de esos valores que son desconocidos en t茅rminos de estos estad铆stico, lo que parece la renta de m铆nimos cuadrados que ha quemado se pueden escribir de esta forma F贸rmula uno o de esta forma, formulados en el primer caso, tenemos el valor de la constante en la recta de m铆nimo cuadrado, que viene en t茅rmino de de varias muestras de media, muestra, no es importante ahora es la expresi贸n que tiene, puesto que eso va a calcular r, sino que seamos conscientes de que estas expresiones dependen de estad铆stico, muestran que dependen de equis y di descriptivos, que dependen de esa de un conjunto de puntos equis, sub铆 y sub铆 y, por otro lado, la estimaci贸n de la pendiente de la renta de m铆nimos, que viene dada por esta expresi贸n, que tambi茅n depende de esos estad铆sticos 谩rabe. Qu茅 relaci贸n tienen estos? El tr铆ptico descriptivo con la estimaci贸n de aire? Bueno, pues eso es lo que vamos a ver en este v铆deo en concreto. Bueno, recordar que con esos dos valores se construye una recta que lo que se llama la recta de m铆nimos cuadrados y que nosotros en este contexto vamos a llamar la recta de regresi贸n di sobre ello simplemente la recta de m铆nimos cuadrado. Lo que ocurre es que aqu铆 nosotros estamos metiendo una informaci贸n extra, porque recordar que ahora los valores de la de los valores de la variable y los valores de vih que observamos son aleatorios, con lo cual esta recta ya tiene un componente aleatorio que lo convierte en un estad铆stico dentro de la inferencia estad铆stica, y lo mismo ocurre con estos dos par谩metros de la recta m铆nimos cuadrado, al depender de los valores de y que son aleatorios se convierten ahora en estad铆stico. La cuesti贸n ahora es ver si esos estad铆sticos tienen alguna buena propiedad a la hora de estimar, y la respuesta es que si lo que veremos es que es un estimado de m铆nima var铆a de esos dos par谩metros, con lo cual ya tenemos resuelto el problema. Aqu铆 simplemente una observaci贸n de acuerdo. Que toda la construcci贸n de ahorro y gorro, as铆 como en la recta de m铆nimos cuadrados, se puede obtener para cualquier conjunto de pared de punto. No, no, no hay ninguna restricci贸n. Ahora lo que ocurre es que estamos metiendo el hecho de que los valores de un aleatorio y por lo tanto todo valores que aparecen aqu铆 se convierten en estad铆stico y de hecho vamos a ver que son estimados. Les vale recordar que los valores de que no son aleatorios est谩n prefijados de antemano antes de observar. Los valores de y podamos considerarlo como valores constantes. Simplemente van a depender como estad铆stico de los valores, y si bien pues entonces la respuesta a la cuesti贸n de qu茅 tipo de propiedades tienen muy sencilla lo vamos a ver a continuaci贸n. Antes de eso, simplemente para que lo viera. Y c贸mo funciona en este caso pues pod茅is ver c贸mo queda la recta de regresi贸n sobre el conjunto de puntos. Luego parece ser que esta recta describi贸 bastante bien el comportamiento, y lo que voy a hacer es ir a la red para recuperar el comportamiento de esa recta de la abstenci贸n de esa recta regresi贸n eso es algo que. Dijiste el tema voy a volver a recuperar. Entonces recuperando nuestros vectores de datos. De acuerdo. Ante esta opci贸n que aparece aqu铆 pudimos recuperar la recta de regresi贸n de acuerdo 茅ste ser铆a el valor de uso del t茅rmino ahorro y este de aqu铆 abajo ser铆a el valor del t茅rmino de gorro y podemos pintar y obtener la gr谩fica anterior a trav茅s de recorriendo la recta aguarda un gorro a partir de estos balones que aparecen aqu铆 los construimos, los pintamos y obtenemos la gr谩fica anterior. Me acuerdo bien. Entonces ahora qu茅 relaci贸n tienen estos dos valores que hemos calculado aqu铆 con los valores de aire desconocido de la recta agresi贸n? Pues lo dicho anteriormente van a ser estimados indicado de m铆nima variar el resultado que asegura. Eso es un resultado muy conocido. En la estad铆stica, que se llama el teorema de caos, marc贸 este teorema. Bajo distinta suposici贸n. Se obtuvo en Porto matem谩tico. Nos digamos que los resultados. Se complementan por dos de los matem谩ticos m谩s famoso entre la probabilidad y como son Gaos y Marco, y bueno, caos es uno de los matem谩ticos m谩s conocidos de la de las Matem谩ticas. En general. Entonces teorema nos dice que, efectivamente esa expresi贸n en un o铆do de agosto y me gorro notables timadores de m铆nimo. Hasta aqu铆 a帽ade un t茅rmino adicional, que es el hecho de lineales, y eso se incluye porque, excepto o sea, ese valor de, en realidad se pueden poner como combinaci贸n lineal de los valores de eso, y es una cuesti贸n t茅cnica. La indic贸 por. Porque tenga m谩s claro lo que estoy haciendo, pero no es determinante para entender que lo que estamos manejando son estimado en ese estado de m铆nima o alianza bajo determinadas condiciones que lo realmente importante. De acuerdo, este teorema se podr铆a aplicar incluso aunque la variable que estamos considerando, si no fueran normales. Aqu铆 estamos suponiendo adicionalmente que son normales y por lo tanto sigue siendo vale acuerdo bueno pues lo que hace lo que acabamos de hacer es simplemente justificar que esos dos par谩metros de la recta m铆nimos cuadrados, que ahora se llama la regresi贸n de y sobre que me producen dos valores, que es una aproximaci贸n muy buena de los verdaderos valores de-y ahora una vez que hemos llegado a este punto, no vamos a plantear una cosa. Las dos cosas principales que nos vamos a plantear van a ser el modelo anterior. El par谩metro b puede ser 0, no estamos descartando la posibilidad de que la constante que usa la pendiente de la renta sea 0. Por lo tanto, ser铆a interesante descartar esa situaci贸n. Evidentemente, cuando nosotros vamos a dar ejemplo y vemos la estimaci贸n debe de acuerdo. Eso nos da una dedicaci贸n que casi seguro que va a ser distinto. Lo que queremos es hacer, confirmar que distinto de 0. Por qu茅? Porque si ve fuera cero en realidad la variable y no tienen ninguna relaci贸n con la variable y nos podemos olvidar completamente. Todo lo que vamos a hacer es confirmar que la pendiente distinta de 0, con un contraste de hip贸tesis, de acuerdo y la otra cuesti贸n, es que yo quiero utilizar ese modelo que estamos construyendo sobre los datos para poder dado ahora un valor de cualquiera. Por ejemplo, en el ejemplo hemos visto valores de igual a 0, 1, 25 con 5, 5. Pues imagina que yo ahora quiero considerar el valor de 3, puedo saber yo que le va a pasar a los valores de y cuando el valor de xs iguala, pues eso es lo que veremos a continuaci贸n y en ese proceso tanto de contestar, si la pendiente es igual a hacer o no y c贸mo puedo predecirlo de ah铆 en funci贸n de la vamos a introducir un elemento que es el coeficiente de determinaci贸n, que va a servir como herramienta para decidir si el modelo es suficientemente bueno para predecir los valores de y en funci贸n de Laiki. Pero eso ser谩 m谩s adelante. Bien, entonces c贸mo vamos a hacer el contraste de si la pendiente es igual a cero o distinta? Pues lo vamos a hacer de la siguiente forma. Vamos a volver al ejemplo, que est谩bamos considerando artificial de acuerdo y vamos a considerar la situaci贸n que estamos abordando, en la cual nosotros ten铆amos esto grande de acuerdo, y tengo estos puntos de acuerdo donde proceden de esta variable y que son nada, y aqu铆 tenemos una situaci贸n muy pendiente, distinta. Bueno, por lo que voy a hacer va a ser algo que os va a recordar mucho a lo que vimos en el tema anterior, Dano lo que vamos a hacer, ver estos valores. Di en su conjunto en realidad c贸mo se comporta. Es decir, yo lo voy a hacer ahora va a ser coger todos esos puntos. Lo voy a juntar en un 煤nico conjunto. T煤 y voy a ver qu茅 comportamiento tiene este conjunto ahora compar谩ndolo con la situaci贸n en que la pendiente de fuera igual acero, es decir, nosotros tenemos ahora este conjunto de observaciones de la pendiente distinta, cero noroeste y voy a compararlo con una situaci贸n en la cual la pendiente en vez de ser distinta es igual a 0. Los puntos, pues ahora se quedan por encima y por debajo de la recta de forma distinta. Seguimos considerando que est谩 en este modelo. La variable son normales con la misma alza, solo que ahora la media no cambia respecto a la medida es constante en esta situaci贸n. Y voy a coger ahora los puntos de esta situaci贸n. Y lo pudieran comparar con los puntos de esta situaci贸n fija. La principal diferencia que hay es que la movilidad del conjunto de datos la separaci贸n entre los datos es mucho m谩s grande que en esta situaci贸n, y aqu铆 ocurre una situaci贸n muy parecida a la que vivimos en evidente en los v铆deos correspondiente al tema a fijar que lo que ocurre ahora es en las variables y hay una variaci贸n que proviene de el factor sima, cuadrado de acuerdo, puesto que hay una fase inmaculada en esta variable, pues se producen desviaciones entre la observaciones, pero ahora, cuando yo introduzco aqu铆 en la recta un par谩metro distinto de cero por el par谩metro expositivo de la recta, sube hacia arriba, que es lo que hace, separa los puntos. Cuanto m谩s distinto sea la pendiente, cuanto m谩s exagerada se la pendiente m谩s se van a ir separando los puntos. Entonces, fijar谩 que en estas situaciones tienen que los valores tienen una variabilidad que depende, por un lado, del factor sima cuadrado de la variaci贸n que hay dentro de cada una de las variable y, por otro lado, depende de c贸mo la pendiente de distintas, cuanto m谩s distinta de hacer m谩s variabilidad entonces lo hago me pas贸 lo mismo que era, no voy a descomponer la variabilidad de los datos, y sub铆 en una parte que proviene del factor sin y en otra parte, que proviene del factor b. Si ve distinta de hacer esa variabilidad que proviene debe distintas, pero se va a hacer grande en comparaci贸n con la variabilidad que proviene de Sigma Cuadrado, y a partir de ah铆 vamos a documentar. En contraste de hip贸tesis ve igual a cero frente a distintos. Volviendo a la transparencia y ya entonces lo que vamos a tener es que vamos a poder contactar como hip贸tesis nula que fue es igual hacer frente a la igualdad es exacta nativa, de que ve distinta, y ese contraste se va a realizar a trav茅s de la siguiente, de composici贸n, de la variabilidad en concreto. Vamos a utilizar esta f贸rmula que aparece en esta f贸rmula. Aparece una serie de t茅rminos que de primera no est谩 muy claro, pero que vamos a ir estudiando poco a poco. Entonces, vamos a ver c贸mo vamos a ir interpretando cada uno de los t茅rminos que aparece entonces, el primer t茅rmino que aparece aqu铆 esta suma de acuerdo. En realidad lo que estamos haciendo fijaron que calcula la diferencia entre las observaciones y su media al cuadro, pues algo denominado en realidad lo que tenemos ah铆 en la cuasi de los datos y sui y eso termin贸 lo 煤nico que hace. Es medir la variabilidad que el conjunto de observaciones y si la que b谩sicamente ese t茅rmino lo que est谩 viviendo toda la habilidad que hay en este conjunto de observaci贸n vale ese t茅rmino, al igual que en la Nova. El tema anterior se va a notar por la suma de cuadrados total. Pues si volvemos a la ponencia anterior, hay otro t茅rmino aqu铆 un poco m谩s vamos a interpretarlo en qu茅 consiste ese t茅rmino entonces que termine aqu铆 lo que hace medir las diferencias que hay entre y sub铆 y el valor de la recta de regresi贸n en cada uno de los puntos que sub铆 sea. Lo que est谩 haciendo esta diferencia es que la observaci贸n al respecto de la media de la red de represi贸n c贸mo se comporta y fijaron en la amplitud de esa distancia, de quien depende simplemente de Sigma Cuadrado, cuanto m谩s grandes e Inma cuadrado m谩s se van a poder separar esos puntos de la agresi贸n. De acuerdo. As铆 que este t茅rmino en realidad lo que est谩 midiendo es que parte de la probabilidad proviene de Sigma Cuadrado. Indic贸 adem谩s que la parte de la variabilidad que proviene del residuo, recordar que en el desarrollo del tema hemos considerado un t茅rmino sub铆 que se sumaba a la renta y generar valor de, y sub铆 de acuerdo entonces ese t茅rmino le llam贸 el residuo, pudo haberlo y fijaron que lo que estamos considerando aqu铆 son diferencia entre los valores de, y sub铆 y diferencia entre los valores de la recta de regresi贸n en los que sub铆. Es una aproximaci贸n de este valor si no se puede justificar te贸ricamente, pero se declar贸 que estos valores de aqu铆 lo que est谩n haciendo aproximar estos valores de aqu铆 de acuerdo. Pues bien, en realidad lo que nosotros estamos aqu铆 haciendo es una suma de esos aproximaciones del residuo cuadrado. Por eso podemos decir que mide qu茅 parte de la variabilidad proviene del residuo y recordar que el residuo? La magnitud del residuo depende de su alianza cuanto mayor sea la fianza, mayor base del valor del residuo. Por eso, adicionalmente, ponemos tambi茅n que la variabilidad que proviene de Sigma se puede decir de una forma o de otra. Lo interesante tener en mente esa dependencia, porque eso, bueno, vamos a explotar. En distintos sentidos y despu茅s tenemos un 煤ltimo t茅rmino estoy aqu铆 me acuerdo que lo que hace. Es medir que parte de la variabilidad proviene del efecto que tienen pendiente fijar o que aqu铆 lo que estamos viendo es la diferencia que le entreg贸 a-b o requis贸 -vih sea lo que hacemos para acabar. Aqu铆 no vamos a dar recta venimos aqu铆 de acuerdo, y lo comparamos con la media de todas las observaciones fijado, que este es el t茅rmino que estamos calculando, y eso le va a marcar la diferencia que hay de ese c谩lculo, en este caso en que la pendiente distinta de cero en este caso la pendiente es igual a 0, puesto que aqu铆 el t茅rmino. A Gorman sub铆 puesto que ve 0, pues ese t茅rmino pr谩cticamente borr贸 de acuerdo; y pod茅is ver nuevo te贸ricamente, y de mucha forma ese t茅rmino lo 煤nico que est谩 haciendo es estimar la media de la variable, as铆 que fijar谩 lo que tenemos. Es un t茅rmino que s铆 ve distinto de cero marca, una diferencia muy grande respecto de la media. Muestran de la de observaciones. Pero si ves igual, acero que este t茅rmino de aqu铆 y est茅 terminado aqu铆 se tienen que parecer mucho, dijeron que en este caso valores que van a salir m谩s se parece mucho a la media; muestran y aqu铆 se va diferenciando mucho m谩s los valores de la recta regresi贸n en esos puntos, as铆 que en realidad este t茅rmino se hace grande si ve distinto, 0, pero s铆 ve igual, acero. Este t茅rmino se va haciendo muy peque帽o, as铆 que determin贸 que parte de la variabilidad proviene del efecto que tiene la pendiente, que es la constante, el t茅rmino que propina el residuos es una demanda de esta forma como la suma de cuadrados residual, y la parte que proviene de la pendiente se suelen llamar la suma de cuadrados de regresi贸n, as铆 que en terminante esa dotaci贸n en realidad nosotros lo que estamos diciendo de acuerdo a la f贸rmula de acuerdo en la f贸rmula anterior, y es que la variabilidad total en el conjunto de observaciones, se puede componer una parte que proviene del residuo o de la danza, y en otra parte que proviene de la pendiente de la recta. De regresi贸n me acuerdo y vamos a hacer ahora un juego muy parecido al de la nueva. Lo que vamos a hacer es comparar la variabilidad que proviene de la pendiente con la variabilidad, que proviene del residuo o variar si este t茅rmino es muy grande en comparaci贸n con este. La idea es hacerlo, y si este valor es peque帽o en comparaci贸n con este, la idea ser铆a que la pendientes igual hacerlo en concreto y oyendo a la al detalle, tenemos que si la hip贸tesis una cierta es decisiva, es igual hacerlo. La relaci贸n lineal con los que sub铆 desaparece y, en realidad, tenemos una serie de poblaciones que son todas iguales que si mira en la f贸rmula, tiene media constante igualada. El acuerdo por lo tanto en la media de todos los datos y es lo que me llam贸 Ibarra, as铆 como el valor de la recta de ser el punto de que soy, es decir, en realidad son estimaciones de la media y, por tanto, la suma adecuado de regresi贸n toma valores bajos, por lo que este t茅rmino y est茅 terminado aqu铆 estiman la misma cantidad y por contra, el valor de la suma de valor residual. Por valores, tanto la variabilidad de los dato se reparten los t茅rminos que son positivo, sino un peque帽o. El otro tiene que ser alto. Como consecuencia, una forma de identificar, si el Parlamento ve cero o no vas a comparar, eso me acuerdo, y la forma de hacerlo, pues va a ser inicialmente tomando el cociente entre esa cantidades, siete cociente toma valores bajo, porque la suma de regresi贸n es peque帽a en comparaci贸n, en la suma, cuando te represi贸n pendiente es peque帽a en comparaci贸n con la suma de residual, y entonces la pendiente, pero si por contra, que cociente toma balones altos. Entonces, hay una gran variabilidad que depende de la recta de regresi贸n y concluyan que la pendiente es distinta. Como ocurre en el tema del del Anova, es el cociente original, tenemos que modificarlo para tener en cuenta el n煤mero de observaciones etc etc y en particular en este caso hay que modificar el t茅rmino de la suma de color residual y dividirlo por entonces. Este cociente y ha modificado incluimos abajo, en la, como est谩 aunque a de todas formas, lo vamos a renombrar y tendremos dos t茅rminos, que son el cuadrado medio de regresi贸n y el cuadrado medio de los residuos y la interpretaci贸n en la misma. Siete cocientes bajo la pendiente distinta de 0, si el cociente es alto, porque la pendiente, perd贸n, si es consciente, es bajo, porque la pendiente es igual, hacer y ser consciente es alto porque la pendiente es distinta. Bien, en todo este apartado estoy utilizando el t茅rmino de Anova en regresi贸n. Acuerdo. Por qu茅? Porque seguimos con la situaci贸n, seguimos con la situaci贸n donde lo que estamos haciendo es analizar la variabilidad de los datos, y, por eso, seguimos utilizando el t茅rmino Anova, an谩lisis de la variaci贸n al alza. Lo que hacemos ahora es ponerle el apellido de que este an谩lisis de la alianza es dentro del contexto de regresi贸n. Bueno, pues entonces lo hubiera dicho cuando inconsciente, Antonio tuvo dolor bajo. Lo identificamos como desigual acero, y si tengo valores distintos ahora, como decidimos eso, pues bueno, ese cociente es un estad铆stico y a partir del estad铆stico que va a ser un atentado con car谩cter calcular, el valor se calcula a trav茅s de esta f贸rmula, aunque nosotros no la vamos a utilizar r va a ser el que no de 茅l. Adem谩s, en el c谩lculo de este valor y sus interpretaciones, como siempre, pero valor bajo, rechaza mucho sucio la pendiente de hacerlo y, en caso contrario, aceptar铆a opciones y, por lo tanto, la pendiente de hacer yo incluy贸 esta f贸rmula y esto por completo, pero ya sabe que tanto el estadio como el que va o no va a dar ahora bien esa descomposici贸n de la variabilidad y el c谩lculo estad铆stico y el valor se resumen siempre en una tabla que en este caso se llama la tabla del an谩lisis de la crianza en el modelo de regresi贸n y es una tabla similar a la que utilizamos en la Nova. Por un lado, tenemos una columna donde aparece la descomposici贸n de la variabilidad total en t茅rminos de la variabilidad, de la regresi贸n y la habilidad del residuo. Despu茅s se calcula eso valore fundamentalmente viviendo la suma de los residuos, el partido por 1, 2, cuando ya tenemos esto, el conscientemente determina la estad铆stica de Contact a partir del cual se calcula el valor. Esta tabla, al igual que en el tema anterior, es obligada a incluirla en cualquier problema de an谩lisis de an谩lisis, de regresi贸n, l铆nea de vuelo aqu铆 ten茅is. El esquema y ten茅is que reproducirla, la ten茅is que reproducir a partir de los Valores correspondiente que obtenga ese y vamos a ver c贸mo se obtienen esos valores. Entonces, volviendo a nuestro ejemplo, acuerdo que esa tabla se puede obtener a trav茅s de este comando que aparece aqu铆 parece Anova. Aqu铆 lo que parece es que hace referencia al modelo de regresi贸n, l铆nea la variable, y quieren la que hace de entonces ejecutamos ese valor, ese comando que obtenemos estatal, la que aparece aqu铆. Esta tabla en la que tenemos que volcar el modelo de tabla anterior aqu铆 ten茅is la suma de Regresi贸n. La suma del cuadro residual, la suma de acuerdo total no aparece, pero recordar que se obtiene como la suma de este valor y estoy aqu铆 lo tendr茅 que hacer a mano cuadrado medio. Aqu铆 solamente tenemos que modificar la suma de cuadrado residual, la tenemos que vivir, porque ese es el valor que se obtiene el cociente de los cuadrados medios lo ten茅is aqu铆 y aqu铆 ten茅is una indicaci贸n del valor del valor de este problema, a veces r por cuestiones de aproximaci贸n, no puede ofrecer directamente cu谩l es el valor exacto, pero s铆 que puede dar una cota. Entonces, por ejemplo, aqu铆 con esta anotaci贸n lo que os indica es que el valor que es menor qued贸 por dos por 10 elevaba al menos -16 saques, que se valore es pr谩cticamente nulo, y con esa informaci贸n ya podemos resolver. As铆 que toda esta informaci贸n que nos da para nuestro Anova en regresi贸n con nuestro Tato lo recuperamos, lo volcamos en una tabla que quedar铆a de esta forma irregular. Pero yo recuerdo eso obliga a incluir esa tabla. En cualquier ejercicio que resolver. Bien, pues entonces para los datos del ejemplo, la tabla que se obtiene ese d铆a est谩 simplemente volcado, los datos anteriores, y aqu铆 lo 煤nico que tengo que hacer es incluir en la tabla de la nueva la suma de cuadrados total, que no viene en la tabla anterior, pero s铆 que podr铆a obtener sumando esta cantidad. Con esta cantidad, al final fijado, que dice que del la variabilidad total del conjunto de observaciones, y sub铆 293 con 40, de las cuales 282 unidades provienen de la regresi贸n y 10 provienen del residuo, con lo cual se ve claramente que la mayor parte de la variabilidad proviene de la rendici贸n, y la conclusi贸n, casi segura, va a ser que la pendiente distinta lo confirmamos calculando nuestro estad铆stico de contraste, y nuestro pueblo, como ya hemos dicho. Pero no era menor que dos por dos por 10 elevado a menos -16 por tanto, ese valor es pr谩cticamente nulo. Va a ser menor que igual que el nivel de significaci贸n que consideramos, y tenemos que aceptar la hip贸tesis alternativa de que ve distinto. Bueno, pues la parte diferencia ya lo hemos terminado, podemos estimar, podemos estimar b y adicionalmente podemos contactar, si la pendiente es distinta. Pero esta tabla no va a servir para una cuesti贸n adicional. Porque recordar que el objetivo 煤ltimo del an谩lisis de regresi贸n lineal es ajustar un modelo que me sirva para predecir el valor de y en funci贸n del valor de la equis, pero recordar que la variable ley depende no solamente de la Ekhi, recordar que nuestro modelo. En nuestro modelo. En un modelo volviendo aqu铆 fijado cu谩l es la relaci贸n de estar aqu铆 pero no solamente depende de la equis tambi茅n depende del residuo y el residuo que sea, m谩s grande, m谩s peque帽o, depende de su alianza, es inmaculada, luego la variable y depende de la relaci贸n lineal, con t茅rminos inmaculada ahora, aunque la pendiente de sea, distinta de 0. Si resulta qu茅 hay una dependencia, aunque sea distinta de acero baja respecto de qu茅 depende m谩s del residuo, lo que nos vamos a encontrar es que todo aqu铆 no va a ser suficiente para obtener un posible valor de la variable, y el modelo va a ser bueno cuando dependa casi todo el comportamiento de la variable. Respecto de Ekhi y depende un poco del residuo, ahora podemos medir nosotros si la varita es la variable y depende mucho o poco de la recta de regresi贸n sobre aqu铆 fijado, que ya no estoy intentando comparar. Qu茅 magnitud de la variabilidad depende de 茅ste con la magnitud de la variabilidad que depende del residuo? Estoy comparando esto con esto. Lo que estoy diciendo esto aqu铆 depende mucho o poco de esto, pero solo podemos hacer de forma muy sencilla, puesto que ahora que nosotros ya hemos puesto que ahora nosotros ya hemos obtenido. Mientras la composici贸n de la variabilidad y s茅 que parte de la variabilidad total depende de la regresi贸n y qu茅 parte depende del residuo, puedo obtener un criterio? Pudo determinar un criterio para ver si el modelo va a ser bueno para predecirlo, en funci贸n de que observando que parte de la variabilidad total proviene de la agresi贸n, vale entonces en particular lo que vamos a hacer es considerar de aqu铆 y este t茅rmino de aqu铆 es un t茅rmino fijado, que es un n煤mero que est谩 entre cero 1, puesto que es un cociente de un n煤mero positivo, y el es siempre m谩s peque帽o que denominado lo que me va a decir en tanto por 1. Qu茅 porcentaje de la variabilidad total proviene de la regresi贸n y cuanto m谩s cerca de uno m谩s indicaci贸n tengo de que la principal fuente de variaci贸n de la variable y la recta de regresi贸n, y eso me va a llevar a que el modelo va a ser bueno para predecir los valores de y en funci贸n de la idea, est谩 de que quiere decir que el modelo vaya a ser bueno para predecir ahora mismo est谩 un poco en el aire. Pero cuando pasemos al apartado, estimaci贸n y predicci贸n prolong贸 valor de que lo veremos con m谩s detalle, vale? Yo lo que quiere es que ahora mismo, con esa idea general de que al final yo quiero predecir el valor del a帽o en funci贸n del acuerdo, quiero sabiendo la Ekhi decir cu谩nto vale ah铆 y ahora necesito medida una forma, lo bueno que va a ser el modelo para hacer esa tarea de predicci贸n. Entonces eso lo vamos a hacer en t茅rminos de 30.000, lo que parece el coeficiente de determinaci贸n entonces fijar谩 ese coeficiente de determinaci贸n como cuando lo multiplicamos por 100 no va a dar. Qu茅 porcentaje de la variabilidad de los datos, de la variable y est谩n explicado por el modelo de regresi贸n, y ese t茅rmino se conoce como coeficiente de determinaci贸n, vale. Simplemente que calcular eso casualmente y no tan casualmente ese coeficiente de determinaci贸n es simplemente coeficiente correlaci贸n adecuada. El coeficiente de coronaci贸n muestral, que estoy viviendo en los temas de Estad铆stica vale, y entonces la forma en que se usa ese t茅rmino es simplemente intentar ver qu茅 porcentaje de la moneda ya lo tanto est谩 aplicada por el modelo de regresi贸n. Es nuestro ejemplo, el valor de creciente determinaci贸n. Toma esta cantidad, no lo ten茅is que calcular Amano har谩 despu茅s recuperar茅 c贸mo se puede obtener de acuerdo y por lo tanto, que sirva para atraer lo que me dice, se termin贸 tanto por 196 puntos, cinco por 100 de la variabilidad. Los datos est谩 explicada por un modelo de regresi贸n, y eso me da una idea de que la variable ley va a poder predecir, se bastante bien en t茅rminos de la variable, que es decir. El modelo va a ser bueno para predecir la ley en t茅rminos de la funci贸n de la variable. La cuesti贸n ahora es cuando consideramos que es bueno cuando malo. Bueno, pues eso no hay ning煤n criterio, pero bueno, en general se considera que cuando cociente determinaciones superior a 9, el modelo es bueno, porque el 90 por 100 de la variabilidad de la variable y depende de que con lo cual conociendo el valor de que voy a poder explicar el 90 por 100 de ah铆 y cuando ya nos quedamos por debajo del nueve nos vamos alejando hacia cero no vamos a hacer canciones de 0, perd贸n, cuando estamos perdiendo el modelo como un modelo bueno, para apreciar los valores de funci贸n. Ahora nosotros hemos llegado un punto, el paso siguiente va a ser c贸mo pudo usar el modelo para predecir el valor de y en funci贸n de la, pero eso ya ser谩 el contenido del v铆deo tercero de este. Por tanto lo dejamos aqu铆 y en la pr贸xima entrega veremos c贸mo se verifican las posiciones iniciales del modelo de an谩lisis de regresi贸n lineal y c贸mo, una vez que hemos determinado que el modelo es bueno para predecir la palabra y en funci贸n de c贸mo hacer esa t茅cnica de predicci贸n. Todos estamos aqu铆 y nos vemos si no soy un saludo y cuidaron mucho.

Intervienen

Felix Luis Belzunce Torregrosa

Propietarios

Felix Luis Belzunce Torregrosa

Comentarios

Nuevo comentario

Serie: Estad铆stica (Grado CC. Ambientales) (+informaci贸n)

Asignatura (1797)

Canales

Tema 5 - Parte VI

Inferencia estad铆stica para una variable con distribuci贸n lognormal.

Canales

Tema 5 - Parte VIII

Inferencia estad铆stica para analizar la probabilidad o proporci贸n de un suceso

Canales

Tema 7 - Parte I

Comparaci贸n de medias mediante el an谩lisis de la varianza (ANOVA)

Canales

Tema 7 - Parte II

Verificaci贸n de las suposiciones iniciales del ANOVA y comparaciones m煤ltiples de medias