Bueno, vamos a ver la última sección
de la última subsección
de la sección dos variables
cuantitativas,
que toman pocos valores distintos
o variables cualitativas,
y esta sección corresponde al
estudio de la dependencia o relación
que si te entre 2, dos
variables vale.
Principalmente, se basa en el
estudio del coeficiente de contingencia.
Vale, como ya hemos hablado en
varios en varias ocasiones
a lo largo del tema.
El objetivo principal es el
estudio de la relación
que si te entrevisté hoy, entre
Ellis y o lo que es lo mismo,
si las variables son dependientes o
son independientes al es recordar
que tenemos dos variables
con posibles valores.
A uno a dos acá para equis
y una vez dos bien,
para ir vale.
Partimos de esta situación dos
variables con sus posibles valores.
Entonces lo que nos preguntamos
es las variables.
Sí son independientes que
sean independientes.
Quiere decir que no existe ninguna
relación entre ellas?
Entonces son independiente?
No hay relación en caso de que
no sean independientes,
entonces serán dependientes.
Si son dependientes,
es que si tienen relación y entonces
cuantificaré hemos además
cuántas relación existe
entre las variables.
Entonces, el primer paso es intentar
traducir esa característica,
el que sean independientes o no, en
algo que nosotros podamos comprobar,
verificar a partir de los
números que tenemos.
Entonces, qué significa?
Que en dos variables sean
independiente una manera
de expresar lo formalmente, es decir,
que los valores que toma
una de las variables
no condicionan los valores que
toma la otra variable,
como ya hemos dicho en otro vivió
cuando introducimos las
las frecuencias condicionada.
Os hable, por ejemplo,
de las variables,
altura y sexo o número de mi número
de hermanos y sexo del alumno.
Entonces dijimos en principio,
si no hubiera relación,
pues a mí me da igual mirar
el número de hermanos
en un grupo de chicos que en un
grupo de chiva que en el grupo total
de estudiantes, tanto chicos
como chicas juntos,
porque si no, si no afecta,
yo tengo que ver más
o menos el mismo reparto,
por supuesto,
siempre entendiendo que tenemos
un volumen grande de datos,
lógicamente, sin consenso.
Si solo consideramos 10
chicos y ocho chicas,
posiblemente veremos diferencias,
independientemente de si hay relación
o no.
Pero por qué?
Porque el volumen es tan pequeño,
que los números van a ser diferentes.
Todo esto es verdad cuando los
números son muy grandes,
cuando tenemos mucha cantidad
de información,
entonces de mucha cantidad,
información, pues, como digo,
por un lado,
si para los chicos tenemos lo
mismo que para las chicas
y que para todos juntos a la
vez, entonces en general,
lo que decimos es.
Si el reparto de frecuencias
de la variable equips
es exactamente igual al reparto
de frecuencias
de la variable condicionada.
Alguien ahí toma cada uno de
los posibles valores.
Como ya hemos comentado en este caso.
Entendíamos, frecuencias
marginales y de nuevo,
frecuencias condicionadas, por
ejemplo, acuerdos que fiamos,
vamos a ver si la da
y el sexo perdón,
o si también en realidad podríamos
hacerlo, dar por ejemplo,
el grupo, por ejemplo,
la variable da,
y la variable sexo.
Se son.
Son independientes.
Esto sería un ejemplo de
este tipo de problema,
aparte del que tenemos ya por poner
otro diferente edad y sexo
son independientes.
Yo tengo un conjunto de
180 estudiantes.
Vale?
Vamos a suponer que tenemos
los mismos estudiantes
que en el caso anterior,
en el ejemplo que enseñar tenemos
180 estudiantes.
Son 180 estudiantes,
analizamos la edad
y el sexo de cada 1.
De esos 180 estudiantes,
como son de una facultad, pues
el intervalo de edad,
pues no tenemos muchos posible
en valor diferente,
porque, como poco, estos alumnos
tendrán 18 años.
Bueno, 17 años incumplen.
Después de septiembre,
pueden tener 17.
Hasta, por ejemplo, vamos
a poner 25, al,
incluyendo en 25 también
los que sean mayores,
pues hay alguna persona más, más
mayor que está estudiando el grado,
que puede pasar, por supuesto, pero
para tener valores sueltos
por los incluimos, por ejemplo, se
supone que los posibles valores
para dar son 18, 19, 20, 21.
Perdone, he dicho 17
en podíamos saber.
Si entramos en si cumplíamos
después de septiembre,
entonces 17, 18, 19, 20, 21 mejor.
Vamos a poner que en veintidos ya
están contemplado los mayores,
vale.
Tenemos e imposibles
valores para edad,
y para sexo tendríamos mujeres.
Un hombre vale, como se ha
comentado, usualmente,
lo que haríamos sería poner como
variable y la menos valore,
en este caso sea el sexo
y como variable
y la que toma más valores, que
sería en principio la edad.
Entonces tenemos las variables
equis, que sería el sexo,
y sería, pues no les vale para
la equis a su boom,
hombre, usualmente, se ordenan por
orden alfabético dos mujeres,
o sea, tenemos cada igualado posible.
Paradores.
Ahora, qué pasa con la nada?
Pues tenemos un beso bulo, que sería
17 años de sus 2, que sería 18, ves,
o 3, que sería 19, ves
un cuadro, sería 20,
ves un cinco ese día 21 ves un
6, que sería veintidos,
aunque, como hemos dicho,
incluiríamos todos los mayores
de veintidos también en este caso
posible valores de la variable
e y seis en este caso el ancaba,
le dos la 6.
Entonces, una manera de
analizar si el sexo
y le da tienen relación o no
son independientes o no
sería analizar si el reparto entre
los distintos grupos de edad
para todas las personas para
todos los estudiantes,
el haber parecido en proporción
en proporción,
vale, acordaron que aquí no
consideramos valora absoluto
porque no unámoslo en
la misma cantidad
en todos los grupos un grupo sería
el total de alumnos vale,
total del alumno.
Por otro lado, tenemos las mujeres
y, por otro lado, tenemos
los hombres.
Estos son los tres grupos
que podemos formar
en relación al sexo del individuo
o no hacen distinción del sexo,
los ponemos todos o cojámoslo
sobre las mujeres
o famoso de los hombres?
Si resulta que la edad
de los estudiantes
no está influenciada por el sexo
porque, por ejemplo, podría
basar que resulte
que las mujeres en general
terminen antes?
Por lo tanto, tenemos en general
que las mujeres son más bajas.
Eso puede pasar no, o, al contrario,
que sea una carrera que,
por lo que sea,
se le dieran mejor a los hombres
y pasará al contrario
que en general,
tuviéramos que los hombres
son más jóvenes.
Eso sería una posibilidad entonces
en ese caso el sexo,
si influye sobre la edad
o, por el contrario, podríamos decir
que no tenga nada que ver al final
no hay destrezas distintas entre
los hombres y mujeres
que hagan que eso cambie
y, por lo tanto,
teníamos más o menos
el mismo reparto,
independientemente de los sexos.
Como analizamos esos colon número,
pues nos vamos a un total de alumnos
y vemos cómo se reparten entre
las distintas edades.
Entonces vemos qué pasa
con la variable edad,
independientemente del sexo.
Ahora hemos qué pasa con
la variable edad
dentro del grupo de mujeres.
Es decir, cogemos edad condicionada.
Aunque el sexo es mujer y, por
último, vamos a los hombres
y vemos cómo se reparten los hombres
las distintas edades.
Es decir, vemos edad condicionada.
Aunque el sexo sea hombre.
Como hemos dicho, sí no influye el
sexo en la edad de los alumnos
tendremos que ver el mismo reparto
aquí aquí y aquí;
proporcionalmente imaginaron
que en el grupo total
tenemos un 30 por 100 de hombres
y un 31 70 de mujeres vale,
30 por 100 de mujeres y 70
por 100 de hombres.
Pues si de verdad influyera el sexo
en la mujer es más o menos perdón
el sexo, en nada más o menos
tendríamos que tener alguien,
30 por 100 de mujeres y un
70 por 100 de hombres,
y allí también aproximadamente
un 30 por 100 de mujeres
y un 70 por 100 de hombres si
de verdad no influye ahora
sin por el contrario, influye, pues
observaremos cosas diferentes.
El grupos idea cogemos una variable
de forma muy variante,
en este caso sería la edad y
comparamos la frecuencia relativas
de esta variable con la frecuencia
en el antiguas de esta variable
y de esta variable, es decir,
de todas las condicionadas
por la otra variable
que queremos saber si está,
si le influyeron al influye,
esto serían en este ejemplo
particular de manera general,
como se puesto de arriba lo que
comparamos en la variable equis,
en este caso en realidad lo estamos
haciendo con la variable
e y en la variabilidad, vale,
se lo voy a cambiar mejor
para no liarnos, pero
lo explico entonces
de manera general que estamos
viendo de manera general.
Lo que estamos analizando
es si la variable edad
sí la variable allí presenta
una frecuencias relativas
que sean exactamente iguales a
las frecuencias relativas
de la variable e y condicionada
a los posibles valores.
Como la variable.
Vale, este pueblo de aquí sería
lo mismo que hemos hecho aquí
pero de manera generalizada
denomina la variable edad
y la variable sexo, analizamos
la variable edad
y la comparamos con la variable edad,
condicionada a las mujeres,
digo la variabilidad condicionados
hombres
y hemos eso coincide o no coincide,
y en caso de que no coincida
cuál es la diferencia,
porque eso es lo que nos va a
cuantificar la relación.
Hemos dicho que si son iguales
no hay relación.
Son independientes ahora;
si son diferentes,
quiere decir que se influye,
que sí hay relación.
Por lo tanto, si cuantificamos
cuánta diferencia hay cuantificamos.
Cuántas relación ahí vale abordarlo?
Como he dicho,
si yo tengo muchos alumno vale; si
son pocos, voy a ver diferencias,
independientemente de
cómo se han variado
y siempre suponiendo que tenemos
muchos alumnos,
pues si tenemos muchos alumnos y
resulta que de ninguna destreza
que marca una diferencia
entre cuando acababan
o cuando no acaban, los estudiantes
en principio
debería tener el mismo reparto de
edad para los hombres y mujeres,
ahora sin voz.
Por el contrario, hay alguna
característica del sexo
que influye en 13 para
obtener ese título.
Bueno, lo normal es que yo
observé una diferencia
cuando tú y el grupo de los hombres
por separado del grupo de las mujeres
en general vemos si el reparto
que tenemos para la variable
e y es el mismo que tenemos para
la variable e y condicionado,
aunque la otra variable toma
todos los posibles valores
que pierden de la misma manera
que hemos hecho esto,
podíamos haber planteado el problema
de manera contraria,
vale?
Yo también podría haber planteado,
en lugar de la edad condicionada
al sexo,
podríamos haber analizado el sexo
de manera independiente
y luego el sexo condicionado;
aunque la edad de 17;
el sexo condicional, aunque la
da 18 así también último;
que se diga la verdad.
Ha condicionado perdón;
el sexo condicionado.
Aunque la fuera veintidos;
estas hay otra posibilidad; valent
y en este caso compraríamos;
sexo con sexo condicionado; queda
17; en senso convencional,
18; 19 de intentar emitidos;
esto, es otra posibilidad,
porque en realidad la relación
que tiene la colabore hable
y en la misma que viene.
De ahí con la variable y entonces
son dos exactamente lo mismo.
No hay que hacer las dos cosas
porque tenemos que tener
las mismas conclusiones con
los dos planteamientos.
Entonces o planteamos 1; planteamos
el otro cual elegiríamos;
de manera natural;
siempre va a haber una predominante.
Eso no quiere decir que no podamos
elegir cualquier vale;
cualquier acta bien;
pero por ejemplo, en este
caso de la edad
y el sexo normal lo como planteaba
al principio no;
allí no estoy aquí; por qué?
Porque sexos o tomado
valores diferentes,
mientras que da tomás 6.
Aquí tenemos que analizar, siendo
variable, que aquí tres
terminamos ante algo más que más
fácil comparar tres conjunto
a comparar siete conjunto.
Entonces, por lo general,
pues lo haríamos
si el alma intuitivamente me
hace un poco más lógico,
aunque en realidad las dos
cosas tienen lógica,
vale?
En un sitio vemos si dentro
de cada grupo sexo
tenemos un reparto similar
de la drama, manera.
Vemos, y dentro de cada edad tenemos
un reparto de ese similar.
En realidad la idea de exactamente
la misma vale,
pero lógicamente mejor tres
variables que siempre
o por rapidez solamente por rapidez.
Entonces, tanto una cosa como
la otra, pues equivalente,
vale?
Entonces lo que tenemos
que comprobar,
nosotros vamos a acoger.
De manera general me
deduje la variable
y vamos a buscar la variable
de manera general.
Vamos a analizar sí el reparto
de frecuencia de equips.
Es igual el reparto de frecuencia
de, condicionado,
aunque ahí toma valore.
Me subjota.
Ahora juega un papel, es decir,
todo lo posible variable
condicionadas de equipos
para la variable.
Ley entonces, como he dicho,
la frecuencia relativa
o aunque obviamente, si no
consideran la frecuencia relativa,
porque no las vamos a tener
iguales, no, no tenemos
el mismo número de chicos
que decimos,
por ejemplo, a entonces para
hacer justas o comparación
la hacemos en porcentaje
o como las relativas.
Entonces, las frecuencias relativas
para la variable equis,
cuáles son en términos de este tema
sería es fe, perdón y punto.
Y sería ahí punto activa por el
y, y entonces el ya de igual
a una taca para cada uno de
los posibles valores
de la equips recordar que hemos
dicho que tenemos cada valores posible
para cada uno de los
posibles valores.
Cuál es su frecuencia relativa
o su frecuencia relativa?
Es renuncia absoluta partió
el número total
de individuos que tenemos y
la frecuencia absoluta.
La representada en la letra de
fe y de subíndices y punto
la hay por queda.
El día hace referencia al posible
valor de la variable equis
y el punto porque nos daba igual
la otra variable.
Estamos con una marginal.
Entonces ponemos el punto
va ahora que basa
con cada una de estas variables.
Cuál es su frecuencia relativa?
Para cada uno de los posibles valores
para cada uno de los posibles
valores de la equis que al final
son los posibles valores que tenemos
aquí no abordarlos como he dicho,
que la variable condicionada
y condicionado
que ella es igual a su cota, tienen
los mismos posibles valores
que tienen la variable.
Por qué exactamente igual
entonces tendremos que calcular
con frecuencias,
de manera que valga la frecuencia
y encima en general
tenemos el fdic fdic j.
Partido, fe, punto j.
Porque todo esto da igual.
Aún tendrán a la uno vez porque
insisto acordaron que decían.
Cómo calculaban las frecuencias
condicionadas?
Pues son los individuos que cumplen.
Las condiciones, la la equis
y la jota vara ley griega,
partido por el número total de
individuos que están considerando.
Son básicamente todos los individuos
que cumple la condición.
Igual habéis upj cuáles son los
individuos que cumplen
la condición de su jota con
la frecuencia marginal
de la subjota.
Punto j.
Me da igual a y la variable
en que pongo un punto
y para laico ojo!
La jota!
Pues lo que pongo.
La jota entonces es donde
me hubiese igual a esto
o lo que es.
Lo mismo, fdi j tiene que
ser igual a efe,
de ir punto por punto j;
partido por el simplemente despejado
para despejar e todo allí
pasa multiplicando esto, a mí lo
único que estamos haciendo
y esto para igual no estaca y
barajo, da igual el papel,
o sea, para todos los valores
posibles de y para todo lo posible,
Pepe.
Eso lo que tienen que pasar
un pongo Maceo
porque formal estamos recibiendo
de manera formal.
Al final esto es lo que
hemos dicho antes,
con palabras que queríamos
comprobar si el reparto
en cada uno de los grupos era
exactamente el mismo
que sin considerar los grupos.
De esa manera veríamos que el grupo
no afecta a la variable.
Entonces básicamente este lo
comprobar cierto basa.
Si tenemos esa igualdad,
entonces las variables
son independientes.
Cuanta más diferencia haya entre
ellas, pues mayor relación
habrá entre las variables.
Vale.
Ahora esto aquí vale.
Tiene un nombre en particular y
es la frecuencia esperada.
Bajo la hipótesis de independencia
suena muy raro,
pero en realidad muy sencillo.
Yo tengo un general asumir de su
jota un posible valor para la variable
equí y un posible valor
para variable.
Por ejemplo, imaginaros el
valor para el ejemplo
que se puede imaginar,
o que tenemos mujer y 20 1.
Eso es un posible valor.
Todas las mujeres que tienen
mente una ellos vale?
Pues para ese pago.
Yo tengo una observación.
Yo dentro de mi muestran con Juan
todos esos estudiantes que teníamos
y cuento cuántos son mujeres
que vengan 21 años.
Es decir, cuántos hay que cumplan
la característica a su vi
y su jota?
Cuántos hay?
Pues hay.
Eso es lo que hay.
Esto entonces la frecuencia
que se llama observada.
Cómo se llama en la frecuencia?
Observa ahora si fuera verdad, el
hecho de que sean independientes?
Acabamos de ver que eso se
empiezan a traducir
como que esa es su quijotada.
Tienen que ser igual a esta cantidad
y decir.
Esto deberían ser igual a fdi,
punto por punto, j.
Artio Moreno, en el caso de
que sean independientes.
Entonces, esto es lo que
se llama frecuencia.
Espera, es lo que esperamos,
observa si las variables
son independientes.
Entonces, básicamente lo
que vamos a hacer
es ir cogiendo todas las diferencias
entre esta cantidad
y esta cantidad para todos los
pares a sus vive subjota,
y vamos a analizar cómo de grandes
son esas diferencias.
Si nos da 0, si no hay diferencia,
quiere decir que las breve
son independientes.
Ahora si sigue hay diferencia,
querrá decir que la breve
son dependientes
y además, cuanta más diferencia
más dependientes va.
Ahora.
Esto en el guión tenéis el ejemplo.
Voy a enseñarnos.
Un evento.
Aquí en el guión tenéis un ejemplo.
Cómo calcular todas estas
frecuencias esperadas para el caso
en el que teníamos el grupo de
edad y las horas de estudio
para esos 180 estudiantes
que estamos analizando?
Esto sería estatal que
tenéis aquí vale.
Esto es lo que tenéis.
Aquí corresponde a todas
las frecuencias
esperadas para esas dos variables.
Cómo interpretamos eso tabla?
La idea es que la tenemos
que comparar
con la, como hemos dicho; valent,
con la tabla de de frecuencias
observadas.
Vaya donde tenemos ahí; bueno,
pues la recuerda,
y ya vale lo voy a apuntar al lado.
La tabla de frecuencias observadas
es simplemente que tenemos
que no lo daba el enunciado,
era 52, 36, 24 68,
vale lo números que quitó, yo serían
las frecuencias observadas,
lo que realmente tenemos.
Tenemos 52 estudiantes con 20 años
o menos, que estudian cinco horas
o menos, tenemos 36 estudiantes
con más de 20 años que estudian
cinco horas o menos,
etc, etc. Y los números que
aparecen en esta tabla
calculado son lo que deberíamos
haber visto,
los estudiantes que deberíamos tener.
Si esas dos variables fueran
independientes, por ejemplo,
cuando estudiante deberíamos
tener que tuvieran 20 años
o menos y estudien cinco horas
o menos, cuántos,
pues podríamos aplicar la fórmula
que acabamos de ver.
La frecuencia esperada es f
de ir punto por punto j.
Partido por.
En este caso particular, por ejemplo,
cuál sería el coste de dicho yo
20 años o menos -5 horas
o menos?
Pues en este caso la y valdría 1.
Primera categoría para
la variable equis
y la jota también vale uno primera
categoría para la variable
y entonces sería f.
Uno punto por punto 1.
Partido por 180, quienes
desde unos puntos,
pues todos los estudiantes que
vienen 20 años o menos para eso
necesitaríamos.
La tabla marginal, junta
de uso único, 88, 92.
7.604.
Vale todo lo que tenemos de
la primera excepción,
la frecuencia marginal.
Entonces es uno punto f,
unos puntos de aquí número alumno
que tienen 20 años
o menos, pues el número de alumnos
que vienen 20 años o menos
y que estudian cinco horas Romeror
y todos los que tuvieran
más de cinco horas,
entonces serían 76 por 88.
Es el punto uno
este de aquí me da igual la
fila, primera columna,
pues sería el partido de 180
esto no saldría el 37,
punto unos, 5, 5, 6.
Entonces, por ejemplo, para
ese su particular,
pues deberíamos detener en
vez de 52 estudiantes,
37 estudiantes.
Si las variables fueran
independientes,
este cálculo de hecho, como ejemplo,
esto lo vamos a hacer con ellos, no
vais a tener que calcular a mano
ninguna hasta frecuencias de
hecho en las actividades.
Ya veréis que no pregunto en
ningún sitio este cálculo,
si tenéis que saber interpretarlo,
porque eso lo vamos a
ver en prácticas.
Además, yo lo pediré en el
examen de prácticas,
pero la parte teoría no
solo del inicio,
saber interpretar qué significa la
tabla de frecuencias esperadas
y como la interpreta entonces,
qué significa la tabla de
frecuencia inesperada,
los individuos que debería haber
observado en cada paz,
si las variables son independientes,
entonces,
cómo interpreta, por ejemplo,
esta tabla en particular
que va a ser, por ejemplo,
como he dicho,
para los de 20 años o menos
que tuvieran cinco horas
o menos?
Pues yo evito que tengo
52 estudiantes,
pero si las variables fueran
independientes,
deberían tener 37.
Veo que hay diferencia.
Eso ya me indica que la variable
van a tener relación.
Qué pasa, por ejemplo, aquí
más de cinco horas,
20 años o menos?
Pues debería de haber observado
30 casi 39 sin embargo solo
tengo 24.
Veo diferencias.
Aquí tengo, debería de haber
visto 51 en realidad
tengo 36 de aquí 53 tengo 68.
Ya nos vamos haciendo la idea
de que son dependientes,
si hay diferencias.
Por lo tanto sí relación.
Ahora vamos a la parte de
cuantificar las relación que eso es lo que nos va
a medir el confidente, contingencia,
que es lo que vamos
a construir ahora a partir
de esas diferencias.
Entonces, cómo se construyó el
coeficiente de contingencia?
Volvemos por donde íbamos,
estamos diciendo
que cuentan la diferencia
entre el eje de hijos.
Da, o sea, entre la frecuencia
observada,
y la frecuencia esperada mayor
será la relación,
pues una manera de cuantificar
la es precisamente
coger esas diferencias.
Entonces, cogemos hijos, da
menos punto por punto j.
Partido, ponerme esto
sería la diferencia que hay para
el han subido, ves upsj.
Ahora nosotros queremos ver si hay
relación o no de manera global
no, esto lo tendríamos que ver para
todos los pares posibles,
o sea, esto lo deberíamos de sumar
para todos los y para
todos los jotas.
Eso es lo que se traduce con las
letras en las que vivimos
en un momento dado con el sumatorio
y sumaríamos desde igual
a una caca j; iguala
una vez, es decir,
para todos los y para todos.
Los jotas para todos los
países posibles.
Ha subido, en su j álbum,
unamos esas diferencias entre
lo observado y lo esperado.
Entonces, cuanta mayor relación
mayor diferencia
habrá por lo tanto más grandes
de esa cantidad,
ahora que pasa que habrá veces que
esta diferencia sea positiva
y habrá veces que esta diferencia
sea negativa.
Voy a ver si, casualmente
aquí no pasa eso.
Si, por ejemplo, vamos a fijarnos
en estos dos números aquí
en este primero, la frecuencia
esperada 37 con 15 es más grande.
Perdón?
Es más pequeña que la frecuencia
observada que 52,
por lo tanto, está recta tememos
este 52 menos -37 sería positivo,
pero sin embargo,
para la siguiente tenemos
que fe de hijos, de 36,
pero sin embargo, la esperada de 50
con mucha, o sea, en este caso
sea negativa que vas
a que entonces estamos sumando cosas
que pueden ser negativas
o positivas.
Entonces, por esa razón lo que
hacemos es coger los cuadrados
de esa garantía simplemente para
evitar perder información.
Entonces vamos, acumulando siempre
el valor en positivo,
y el último detalle es que en lugar
de coger estas diferencias,
así tal cual las cogemos divididas
por la frecuencia, espera,
porque para tener en cuenta si
esa diferencia es muy grande
o muy pequeña en función de la
magnitud de nuestros valores,
por ejemplo, imaginaros que tenemos
dos variables diferentes,
y para esas dos variables diferentes
tenemos una diferencia de 5,
cinco unidades o sea de hijo, otra,
menos de ir punto por del punto j.
Partido brent.
Esa diferencia 5, vale?
Un 5, cinco es poco; en
muchos pueden vende,
porque, por ejemplo 90
menos -85 son 5,
pero es que 10 menos
-5 también son 5.
Aquí tenemos muchísima diferencia
proporcionalmente que aquí
aquí tenemos el doble,
mientras un poquito más
para tener en cuenta
que hecho dividimos por ese
valor de manera que sería
de esta cantidad por 85
esta cantidad por 5.
Entonces, de esa manera ya estamos
teniendo en cuenta
cuánto suponen sobre el
total esta cantidad,
lo que en realidad a nosotros
nos importa, porque cinco
de cinco es uno o sea hemos doblado.
Hemos subido un 100 por 100,
mientras que de cinco a 85 cuánto?
Segundo tengo.
Entre 85 son cero con 6,
o sea aquí hemos incrementado
solo un seis por 100.
Entonces, por eso dividimos
por esta cantidad.
Y esto es lo que se llama.
No soy consciente de contingencia
todavía,
pero el estáis cuadrado
vale de esta manera,
sí cuadrado, que ya es algo muy
parecido a lo que va a ser.
El coeficiente de contingencia
encontró insuficiente.
Contingencia en la letra fe, es la
raíz cuadrada de es momento
de calcular partido más
sin en detalles,
que esto sí que es un poquito
más complicado.
Es simplemente para que entendáis
un poco que se hace.
El problema del estadístico tribu
cuadrado es que se ve alterado
por el número de datos que tenemos
entonces para evitar,
para corregir ese problema.
Pues cogemos el coeficiente partido
por el coeficiente más
el número de datos,
de manera que no se vea tan
influenciado por esa ampliada datos
y de manera que más fiable
la interpretación.
Entonces, esta c fe es el
coeficiente de diferencia.
Por lo tanto, pasamos, tenemos
dos variables
si queremos saber si son
independientes o no.
Saben que si son independientes
se cumple esta formulari la
que hemos escrito aquí
está formulada aquí el es decir
la frecuencia observada
y la frecuencia esperada son iguales
para todos los pares posibles.
Entonces, como la frecuencia
observada,
es igual a la frecuencia esperada.
Estas diferencias son
0, por lo tanto,
el coeficiente contingencia
es 0, es decir,
que si las variables son
independientes.
Si los variables son independientes.
Entonces el paciente con King,
Francia tiene que valer, no hay
diferencia entre lo observado
y lo esperado; si son independientes
porque precisamente son
independientes, ahora,
si las variables son dependientes sí
sí existe relación entre ellas,
entonces va a ser mayor, que será
este valor siempre es positivo
en una red, de manera que
cuanto más grande,
más relación además sí.
Cuanto más grande.
Mayor relación.
Y lo último que nos queda saber por
qué número está acotado, o sea,
cuánto puede valer como mucho,
cuál sería la la mayor relación que
pueden tener las variables.
Entonces, como mucho, ese confidente
contingencia,
vale la raíz cuadrada de el mínimo
entre que hay menos -1.
Entonces, una vez menos -1
partido por el mínimo.
Esto es lo que puede valer como
mucho el coeficiente de contingencia.
Entonces, este tema sí podemos decir.
Entonces, en nuestro caso,
sería la raíz cuadrada
de el mínimo en trenca cada del
número posible de valores
que tenemos.
Por ejemplo, para las horas de
estudio y el grupo de edad,
pues 2, tenemos dos posibles valores
para un buen posible.
Valores para la y para las
horas de estudio 2,
también menos -1 partido,
el mínimo entre dos 2.
Entonces iba a la red cuadrada
de cuánto vale el mínimo.
Entre dos 2, 2, dos menos
-1 partido por 2,
la raíz cuadrada de un medio puntos,
70, 70, perdón y 1.
Entonces ahora ya sin pudo decir,
una vez que tenga el número máximo,
si puedo decir.
Si el símil -coeficiente
es pequeño o grande,
cuánto vale eficiente?
Tenéis alguien en el día el
coeficiente en nuestro caso vale,
sería simplemente ir calculando.
Una vez que tenemos cómo se calculan
todos estos números,
esta tabla sería la que nos ayudó
a construir el coeficiente.
Esta sería para el estadístico
igual cada número
es la frecuencia observada menos.
La frecuencia esperada
es lo que teníamos
en la anterior partido por
al cuadrado, perdón,
partido por la frecuencia.
Esperaba, y eso es un
cuadro numerito.
Todo lo que haríamos sería.
O sumar esos cuatro numeritos, vale,
y luego hubo sumamos el
valor resultante.
Partido por el valor resultante,
más en,
etc, etc. Eso es lo que
tampoco voy a pedir.
Vale, lo vamos a calcular con eso.
Yo quiero que interprete la tabla
y que de frecuencias esperaba
y que interpreta el coeficiente
de contingencia.
El cálculo no lo vamos a
hacer a mar. Entonces,
en este caso particular tenemos aquí
que el coeficiente de contingencia
en nuestro caso es 0.
Punto 31, 68.
Fijaros, como todos estos numeritos
lo hemos explicado a la misma,
se ha hablado aquí con
fijado cójannos,
este número más tiene un número, una.
Tiene un mero.
En fin, esos cuadro número
partido en más de cuatro números.
Vale, está formulada.
Básicamente, estos serán
los chico cuadrado
y esto servirá de contingencia.
Pero insisto, este cálculo
de aquí nace con ese,
no vamos a hacer nosotros a mano.
Nosotros nos quedamos con el
valor del coeficiente
de contingencia que nos interesa.
Entonces, sabemos que nos
hace cero punto,
31, 68, nos trace máxima.
Es un punto, 70, 71.
Todas las variables tienen
relación que, al final,
lo que a nosotros nos interesa,
pues si tienen relaciones,
que valona 0.
Además, cuando relación tienen,
pues este valore,
casi la mitad de este tiene
bastante relación
no relación modelado y ahora
sí que ya hemos terminado,
vale?
Tras sería la parte del estudio
de la relación o asociación.
Entre las dos variables tenemos
la tabla de frecuencia
esperada, que es bajo la hipótesis
de que las variaciones
son independientes, o sea, así las
variables son independientes
que tenemos que observar.
Eso lo comparamos con lo que
realmente hemos observado,
con lo que realmente tenemos
y en función
de esas diferencias construimos el
coeficiente de contingencia
para saber si hay relación
y cuánta tienen
y con esto terminaríamos la parte