Bueno, este es el décimo
segundo vídeo
de análisis discriminante y bueno,
lo que queremos aquí es
intentar primero,
decidir qué métodos era mejor cuando
estamos en la práctica
y en cierto modo, como hacíamos
en componente principal,
en ver si nuestros métodos
son robustos
y ver si funcionan bien o no,
a pesar de que no se podamos
garantizar que se cumplan
las hipótesis que hemos visto, como,
por ejemplo de que sean normales,
de que tenga matrices covarianzas,
iguales de que tengamos una muestra
etc. Bueno, este método,
que se conoció como validación
cruzada,
estaría dentro de una
serie de métodos
en los que se trabaja únicamente
con una muestra,
y a partir de la muestra
se quiere estimar
y ver como de fiables son los
métodos que se utilizan,
pero usando únicamente los datos
muestreos de r muestreo.
Sobre la propia muestra que funciona
sin necesidad de suponer
un modelo teórico han contado, vale?
Por lo tanto,
aquí ya no necesitaríamos que
los datos sean normales,
que los grupos de verdad, grupos,
etcétera, simplemente lo vamos a ver
es el método de clasificación
que hemos usado,
funciona o no en la práctica fondo
de lo que se hace ahora del virus,
pues para ver si funcionan
por los pruebas
y y funcionan bien y si no
funciona cuando funciona
y hay que devolverlos o con la usa.
Bueno, también se conoce como
el descriptivo en inglés,
como dejar a uno fuera o ana un vale
y tener dentro de técnicas
que se llama naíf, vale
en estadística,
bueno, lo no, claro.
Nosotros partimos siempre
de unos individuos
de los que se van a hacer
en grupo, vale?
Tenemos nuestra un tanto variable z
y luego tenemos la variable grupo
que se supone que está bien.
Si la variable grupo está bien,
pues lógicamente los métodos
que estamos teniendo,
pues puede que no funcionen.
Bien, vale.
Si hay alguno que estaba,
al no pasa nada,
me sigue mucho que está mal,
pues los métodos,
pues están mal.
Luego, hay que suponer que estos
individuos que tenemos,
que o, pues, sabemos su grupo,
de verdad o claro, luego no llega
a un individuo nuevo,
que es el que queremos planificar, y
es que no sabemos si está bien.
Entonces, bueno, la idea es si
tenemos un método de clasificación,
es que sea el lineal el
discriminante o el de una divino,
pues aplicárselo a estos individuos
de los que se conoce,
entonces, por ejemplo,
si yo santo la función discriminante
lineal fs,
pues, en vez de aplicárselo acepta
si este es el objeto.
Uno es el objeto en, pues
se lo puedo obligar,
al objeto.
J vale.
Bueno, haciendo esto,
pues, yo puedo ver si ese objeto
j nos da mayor o menor
que gas, estamos en el
caso de dos grupos,
y en qué grupo se clasifica.
Este sería el grupo
que clasificación, vale, por
ejemplo, es eficaz?
Pues lo puedo ver, es si
de verdad acierta.
Ellos se objetos j.
Este grupo jesuita, vale.
J, vale, sólo se está aquí va a ser
simplemente contada, cuántas veces
esto se panzer?
De hecho, lo hacemos en la práctica
correspondiente que pasaría aquí
pues lógicamente va a ser y aquí que
estaríamos haciendo trampa,
porque cuando vamos a clasificar
a un individuo,
pues la función ele que se usa
no hemos usado centra
para no escolar,
mientras que en esta función en sí
que se ha usado el objeto jota para
calcular la en cierto modo
pues este, objeto jota
dentro de la nube,
de puntos ha hecho que es la
clasificación del grupo j
se digamos que tienda hacia
él y en cierto modo vale,
ha hecho que tire hacia ese
punto, vale y bueno
estaríamos en cierto modo haciendo
un poquito de trampas,
y esto nos va a dar una probabilidad
de acierto mayor,
un poquito mayor de las ruedas.
La real sería que cuando uno va
a clasificar a un individuo,
ese individuo no se ha usado
para calcularé vale
lo mismo que decimos o decimos.
Cuando símbolos cuadrática va.
Entonces la idea de la validación
cruzada es muy sencilla
y ven el nombre.
Cuando voy a clasificar
al individuo jota
lo que voy a hacer es calcular
la función discriminante,
el dj,
en la que usamos todos los
individuos jota-asaltamos a j vale.
Calculamos la función discriminante
lineal, con todos.
Menos os j.
La precisión será similar,
porque hay un tanto menos solo pero
j no influye en su clasificación.
Conecta función discriminante
el dj sin el objeto.
J. Sequía certificará el objeto,
j, y se cuenta a ver si hacer
se aceptaba, lógicamente.
Entonces, la mano impensable
y hacerla vano solo con con una
complicaba, pues hacerlo con todo lo
con cada individuo calcularla, el
clasificar etc complicado,
pero hacerlo en el ordenador
sencillo,
y eso es justamente lo que
hace automáticamente
cuando le decimos que la validación
cruzada es igual,
a verdad vale?
Ya lo hace y simplemente
se trataría de contar,
pues el número de veces que se hacía.
Vale, además de de, para ver
si es el método fiable
y de distinguir o de decidir.
Si usamos el ideal, vale
discriminante lineal,
cuadrática o simplemente viendo
cuál acierta más,
vale y decidir si son fiables.
No.
Este método también nos podría
servir para decidir qué variables
son las que mejor discriminan
al grupo.
Vale tanto el punto de vista,
empezando desde abajo,
como desde arriba.
Por ejemplo, tenemos un centro acá
tenemos una precisión de acierto
en el línea de ser el 90 por 100,
pues podríamos ver si podemos
quitar alguna variable.
Cuanto desciende está probabilidades.
Acierto, vale.
Globala lineales.
Siempre va a defender,
porque la opción
de poner una cuestión consciente,
igual acero,
siempre está ahí y la óptima,
siempre va a ser mejor
que todas las demás Valero con
quitar una variables nuevo.
Hace que sientan que ver la que
nos hace encender menos
si queríamos quitar alguna variable.
Con quitamos la otra opciones,
empezar desde cero con las variables,
viviendo cuanto a cierta, cada
una, vale construyendo.
Quiero una, quiero, 2,
etc. Por supuesto,
el óptimo esos valores.
Luego esto realmente no tiene mucho,
el discriminante lineal.
Habría otra opción que parecía la
cosa componentes principales,
que es estandarizar las variables.
De este modo, esto no va a afectar
al a la, al pueblo,
la probabilidad de acierto lineal,
porque nuestra variable,
esta función discriminables
fiscales, discriminante decisión,
era lineal.
Vale?
Así si yo veo usar esas uso o estas.
Vale tipificadas, vale, pues
simplemente lo que tenemos
es cambiándola, cambiando
la del múltiple,
vale llamémoslos coeficientes y la
proyección va a ser exactamente
la misma.
Que para que me sirve el asterisco,
coeficientes usando las variables
estandarizadas.
Pues me serviría para que
estas variables,
que podrían tener unidades
diferentes,
derecho no tener,
pues estas variables estándar
no tienen unidades, vale,
con lo cual estos coeficientes
se pueden comparar entre sí
y la que más para influir a
la hora de diversificat
simplemente será la que tenga,
el máximo de los coeficientes
en valores absolutos,
como las componentes, la que más
pesa a la hora de clasificar
cuando estandaricemos,
sino estandaricemos no, porque
estos coeficientes,
pues, dependerán de que unidades va.
Por ejemplo, se iban centímetro
expresivas metros?
Pues esta simplemente hemos cambiara.
Se multiplicará por 100.
Se debe?
Vale?
Entonces, para que sean comparables?
Pues lo haríamos simplemente,
pues si queremos ver cuál
es la que más influye,
lógicamente en la práctica.
Esto es un problema, porque habrá
que estimar la media
de cómo viven transformaciones como.
Pues tendremos que usar la
media, no el grupo,
y sino la media global
de la variable.
La varianza global de la variable.
En cierto modo, es hacer
un poco de trampa.
Vale, al final, no vas a nada,
porque lo único que estamos haciendo
es una transformación lineal.
Las medidas de derechos
se pueden quitar,
porque no es necesario, necesitamos
quitarle unidades,
basta con dividir por la
desviación cívica,
vale?
Entonces cómo voy a hacer
con la variable global,
suponiendo que la varianza
sean igual.
Bueno, esto que no tiene
mucha importancia,
lo vemos en las prácticas,
pero sí simplemente
para ver qué variables son las
que mejor discriminan,
que muchas veces se ve en
el estudio inicial
de los datos, que también
hay que hacerlo,
y ahí se ve qué variables son las
que mejor sepan en las que peor,
cuando vemos en los vicios