En este vídeo vamos a ver cómo se
ha avanzado en el anterior.
La parte correspondiente a
las medidas descriptivas
que nos cuantifican la
relación que existe
entre dos variables cuantitativas.
Todas estas medidas son el
coeficiente de correlación
y la cobardía bé tarjetas.
Vamos a esta.
Esta sección ya hemos visto la parte
de la representación gráfica
como de apoyo.
La ecuación de una recta entonces,
vamos a ver ahora la parte
de cuantificar la relación que
existe entre esas dos variables
a que hayamos hecho la gráfica
y vemos qué interrelación,
cuántas relaciones existe bien.
Entonces, en primer lugar,
tenemos las covarianzas das
las dos variables,
como siempre, seguir cuantitativas,
como mucho valores diferentes,
aunque en realidad con
sean cuantitativos,
es suficiente para calcular
estas medidas.
Tenemos blanco, varianza entre
Ellis y es la suma,
de.
Igual aún no está en el recordar
que tenemos para en individuos
las observaciones de
las dos variables,
pues la suma para esos en individuos
de igual aún hasta en el de xhup.
Vi menos ekin barra por su vi,
menos Ibarra, partido,
ponerme es decir,
cada observación de la ley y menos
su media por cada observación
de la y menos su media acordaron
que el equiparla
y el era la media de barra,
es la media.
Veré que Ibarra es la
media de entonces.
Esto nos mide la relación
que existe entre dice.
Y por qué la propiedad la siguiente.
Si la covarianzas entre
quise y es positiva.
Entonces la relación es creciente,
directa os digo etc.
Si, por el contrario la gobernanza
es negativa,
entonces la relación es
decreciente y, y,
en caso de que no haya relación,
nos tiene que salir
que que la varianza espero.
Vale?
Por qué?
Por qué se cumple esa propiedad?
Fijaros que si las relaciones,
por ejemplo,
vamos a suponer las relaciones
creciente entre esas dos variables,
si las relaciones creciente hemos
dicho que valores altos
de la equis van asociados con
valores altos del AEI y valores bajos
de la van asociados con
valores bajos de ley.
Entonces, qué va a pasar?
Yo tengo la colección de puntos,
seguís uno 1, dos dos dicen no?
Entonces, si yo represento
de manera un y variante
cada una de esas variables,
por ejemplo,
vamos a representar aquí la
equis y aquí la hay.
Entonces yo tendré aquí una serie de
valores que serán los equis uno
1.
Por ejemplo, estoy aquí
uno el cuadro 2,
porque aborda los que no tenían
por qué estar ordenados.
Vale, eso no, no tienen por qué
pasa etc, etc. Entera,
y más o menos por el medio
no extra, la barra,
y con la invasora lo mismo,
más o menos por el medio
y tal, ayuda,
porque la medida siempre se sitúa
por el centro de las observaciones,
y luego tendré también, pues
las observaciones
y uno tres no, por ejemplo y uno
indrets imponer un y 2, etc.
Etc. Entonces, si las relaciones
creciente vas
a ver algo así, por ejemplo,
aquí vamos a poner allí
siete aquí siete vale.
Por qué?
Porque si la equis es grande,
este valor, por ejemplo,
sería para los valores
altos de la equis.
La ahí también tienen que ser grande,
porque eso es una relación creciente
de la misma manera.
Por ejemplo, para este, si
la equis es pequeña,
la India hay que ser pequeña.
Eso cómo se traduce al comparar
la escuela media?
Porque si comparamos la equis
gran, las equis subir,
que son grandes, con la media,
eso va a ser positivo,
porque como estamos con
los valores altos,
los valores altos van a estar
por encima de la media.
Entonces, asociados a
este, vi va estar
un y su vi que también
va a ser grande, no,
aunque hemos dicho que es la
relación es creciente.
Quiere decir que valores altos de
una le corresponden valores altos
de la otra.
Por lo tanto, si esto está
por encima de su media,
estaba estar por encima de la suya.
Entonces, como las dos
van a ser positivas,
pues el producto de las dos
va a ser positivo.
De la misma manera.
Cuando cojamos los valores
bajos de una,
vamos a coger los valores
bajos de la otra.
Entonces, yo cojo el
xhup, vi pequeño.
Esto va a ser negativo
porque en su viva estar por
debajo de la barra.
Pero, claro, lo mismo va
a pasar con el bic,
porque ese quiso vi bajo.
Le va a corresponder
un y sus vi bajo.
Por lo tanto, esto también
va a ser negativo,
pero menos por menos.
Es más, cuando las relaciones
creciente,
todos estos términos de aquí son
positivos, por lo tanto,
la suma va a ser positiva,
sin por el contrario,
analizamos qué pasa cuando la
relación entre creciente,
cuando las relaciones de creciente
vamos a tener lo contrario.
Es decir, por ejemplo, yo tengo aquí
la barra de aquí la barra.
Vamos a coger, por ejemplo el.
Pues yo, que hay unos y da igual,
si las relaciones de creciente
imaginaros que le quiso,
uno está por aquí pues
a valores bajos
de una variable le corresponden
valores altos de la otra variable.
Entonces, el equis uno
está por aquí herí,
supo.
Uno va a estar por aquí porque
las relaciones de creciente
vale.
Estamos suponiendo que la relación
entre creciente vamos a agujerear
o, por ejemplo, leí cinco cinco
vamos a suponer ahora
que le qui cinco grande, pues
el edi, 5, grande,
como la relación entre creciente
valores altos,
van con valores bajos.
Entonces eran cinco estar por aquí.
Entonces, qué pasa?
Que cuando yo cojo, le
quiso, uno menos.
Seguir barra por si, uno
menos Ibarra es todo.
Aquí es negativo.
El Lewis, uno está por
debajo del embarra.
Entonces, este menos
este en negativo.
Ahora, sin embargo, el y su boom,
menos el Ibarra positivo
menos por más menos,
esto es negativo.
Si cogemos el otro 5, menos
seguim barra por,
y cinco menos Ibarra, que vamos
a dar cinco menos.
Ekin, barras positivo.
Le cinco está la derecha de la barra.
Por lo tanto, esto menos es positivo.
Ahora el y 5,
menos el en negativo.
Entonces, otra vez más,
por menos menos.
Entonces, los términos que
aparecen en la varianza.
Van a ser negativo.
Por lo tanto, la suma
va a ser negativa.
Entonces, las relaciones de
creciente la varianza es negativa,
mientras que, si las relaciones
creciente,
las gogó varianza, es positiva.
Entonces se cumple esta relacional.
Bien, cuando no hay relación,
no saldrán 0.
Es un poquito más difícil de
justificar, pero entonce,
eso lo dejamos.
Lo dejamos así ahora, problema
de esta medida.
Está bastante claro que cuando es
positiva la relación es creciente
y cuando en negativa,
desgraciadamente creciente,
pero hay mucha relación
o poca relación,
pues el problema que presenta
esta medida es que depende
de las unidades de la variable.
Entonces, si imaginaros que yo
analizo la relación que,
si te entre entre el importe del
gas y el consumo del gas,
pues me va a salir una
gobernanza distinta.
Si yo calculo el importe neuro,
que si lo calculo,
el libro son dólares, pero
eso no tiene sentido,
porque independientemente de las
unidades que ellos cojan,
las variables son las mismas,
deberían tener la misma relación,
pero eso no lo cumple esta medida.
Entonces, por esa razón se introduce
el coeficiente de correlación
que nos elimina este problema,
de manera que no solo nos informa
claramente del tipo de relación,
que es lo que nos informa
también la varianza,
sino, además, no nos dice
de manera sencilla
si hay mucha o poca relación en el
anterior pase del coeficiente
de correlación en el guión.
Tenéis también esta formulada aquí
la fórmula intuitiva para entender
qué hace la covarianzas en la que yo
soy utilizado para explicar hola.
El interés de esta que tenéis
aquí a la derecha
es simplemente para el cálculo.
Cuando nosotros la tenemos
que calcular a mano.
Es mucho más fácil coger esta
aquí que coger esta,
porque aquí hay muchas
menos operaciones
que alguien,
simplemente es por eso
son equivalente
un razonamiento sencillo, pero
es verdad que matemático
y, bueno, pues puede resultar
para vosotros complicados.
Si alguien tiene curiosidad, yo
se lo explico sin problemas,
pero como tampoco quiero asustar
así en general,
porque no lo voy a explicar,
pero vamos es muy sencillo
llegar de esta expresión a esta
simplemente desarrollar el producto
y el fumador y con propiedades
básicas,
y llega insisto que si alguien tiene
curiosidad que me lo pregunte
toda el interés de esta fórmula,
simplemente para el cálculo.
Nosotros de esta sección no vamos
a hacer nada a mano,
vamos a hacer todo con
r, lo importante
son las interpretaciones.
Entonces,
por eso tampoco me detener mucho en
explicarlos el cálculo a mano
porque no lo voy a venir.
Vale?
Entonces, la importancia
de la gobernanza
es porque realmente es por donde se
inicia el estudio de la Asociación
de las variables para cuantificarla.
Pero, como esta medida viene el
problema con su explicado,
que depende de las unidades,
entonces en realidad lo
que se hace definir
el coeficiente de correlación
tenéis aquí la fórmula,
y este es el que realmente es más
sencillo de interpretar.
Entonces tenemos la varianza.
Y a partir de la varianza,
construimos el conciente de
correlación entre quise
y como la covarianzas, entre
equis y partido.
El producto de las desviaciones
típicas.
Vale.
Ese veis, es la vía acción típica.
De qué es, y eso sería la
desviación fílmica.
Del entonces.
Esto, que es el coeficiente,
como digo,
de correlación es la medida
que realmente es útil
para saber cuántas relación existe.
Entre las variables, por
qué por su propiedad
es sobre todo, la diferencia
respecto con la varianza
es que esa dimensional no depende
de las unidades,
es decir, las variable.
Es decir, si yo, por ejemplo,
calculara el coeficiente de
correlación para el consumo
y el importe de la factura en
euros me daría exactamente
lo mismo que en dólares, que es
lo que a mí me interesa.
Cuántas relaciones entre esas
variables, en la vida,
como la mida esta que es la
propiedad más importante.
Luego no está siempre
en tres menos -1 1.
Eso es lo que nos permite saber
cuántas relación hay de
manera sencilla.
El signo simplemente nos indica
el tipo de relación,
o sea, cuando es aquí sí positivo
hay relación creciente.
Mientras que si es aquí
si es negativo
hay relación de creciente.
Y el caso extremo, es decir,
cuando r qui si es aproximadamente
uno o aproximadamente menos -1.
Eso quiere decir que
la relación lineal
entre los datos es casi perfecta,
o sea prácticamente de
verdad puedo decir
que la ahí es aproximadamente
a más b por ellos,
buscando lo que vamos a ver en la
última sección, esa y sabe,
pero existe una y una vez de manera
que la ahí es prácticamente
igual a mover por ellas.
Es bueno entonces importante,
qué información nos aporta
el suficiente?
Con relación?
El tipo de relación que existe entre
las variables es positivo,
relación creciente y negativo;
relación de creciente se cero
cuando no hay relación,
y, además, cuánta relación hay,
porque cuanto más se vaya
a los extremos,
cuanto más se aproxime,
al menos -1 alumno,
más relación hay.
De de manera buena, como
una ayuda vale,
porque o cuesta decidir si hay mucha
boca o regular redacción; 3,
una tabla en el guión.
Un.
Vale para decidir si es
ponga o en muchas.
Entonces, siempre que fijaros
bien que el valor absoluto
del cociente con relación este
entre cero cero 25;
diremos que es muy débil; si
está entre 25 cero 5;
digamos que debí entonces eran
5; 75 modelado entre 0;
75; hicieron 9, bastante
fuerte y de nueve
a uno muy fuerte, porque vemos
el valor absoluto.
Esto quiere decir valor absoluto
del coeficiente
porque, como se ha dicho,
el signo solo me dice el
tipo de relación,
pero la cantidad de información
me la su valor absoluto.
Por ejemplo, si dos variables tienen
un coincidente con relación de 0,
cuatro otras tienen un coeficiente
de correlación de cero cuadro,
yo lo he dicho, pero bueno, menos -0.
Como un cuadro hicieron cuadro las
dos parejas tienen exactamente
la misma redacción, solo que
esta es decreciente
y estas relaciones crecientes, pero
la cantidad es la misma,
porque la cantidad es el número,
vale, el signo es el tipo,
pero el número lo que me dice
cuántas relacionadas hay entonces
en particular, por ejemplo,
para las calificaciones
de los alumnos.
Nosotros tenemos un una covarianzas
de unos punto 56
un coeficiente de correlación
de cero puntos, 65.
Entonces, como el cálculo lo
vamos a ver en práctica.
Entonces alguien no me a
en la interpretación.
Cómo interpretamos esta información?
Pues, como digo, el coeficiente
de correlación
es el que más nos ayuda
a interpretar.
Por qué?
Porque la covarianzas como
depende de las unidades
de la variable, no es fiable,
y yo no sé decir si el uno con
56, grande o pequeño,
porque no sé compararlo
con qué pequeño,
con respecto a qué grande.
Con respecto a que, mientras que
el coeficiente de correlación
yo puedo comparado con el uno o
con el menos -1 en función
del tipo, con el 1,
si es positivo y con el menos
-1 sin negativo,
entonces para la interpretación,
nos fijamos
en el coeficiente correlación, dice
que la relación directa,
porque es positivo.
Eso qué quiere decir?
Que si la calificación obtenida en
el primer parcial es grande,
pues en el segundo parcial también,
y si la planificación era
parciales, pequeña,
pues el segundo también será pequeña
y, además, como están
el intervalo 5, 75,
pues sabemos que esas relaciones
moderada estamos aquí
en este intervalo.
Todas las relaciones moderados,
es decir,
los puntos están moderadamente
cerca de la recta,
vale.
Tenemos una relación lineal moderada
entre las dos variables.
Quiero decir algo que
se olvida completo.
Vale?
Entonces, hasta aquí la parte de la
media descriptivas covarianzas
correlación y ya hemos visto
la interpretación.
Ahora nos falta la última parte, que
es la recta mínimos cuadrados,
o estamos todo el rato hablando
de que sí vamos a estudiar
si hay una relación lineal entre
las variables o no vale.
Si esas gráficas se parecen
una recta o no,
entonces si se parece una recta
como es este caso,
a mí me interesa buscar esa recta,
cuál es esa recta entonces.
En función de la recta en
función de la red?
Bueno, en función del gráfico
o más bien voy al grano.
Bueno, lo he explicado aquí
en función del gráfico
que tenemos de dispersión.
Vale, por ejemplo, en este
ejemplo era este.
Aquí hemos dicho
que nosotros podríamos poner una
recta entre esos puntos
y sabíamos por el vídeo que hemos
visto de la evolución de la recta,
que cualquier recta se puede
escribir como a MASb por Ellis.
Entonces, qué es lo que nos
falta ahora mismo?
Pues ahora mismo lo que nos falta
saber es como encontrar esa y sabe
que es la que nos determina cuál
se está recta en particular,
por qué redactase mucha.
Nosotros queremos saber cuál es esa
recta, que es la que es mejor,
la que más se aproxima
a nueve puntos.
Eso es lo que