Este último vídeo del tema 5.
Vamos a ver cómo podemos
validar los resultados
de una interpretación, es decir,
hacernos una idea de la magnitud
del error que podemos
estar cometiendo.
El error estándar
de la televisión lineal nos daba
una estimación del error,
pero ésta sólo es fiable si
se cumplen los supuestos
de la regresión.
Los procedimientos que vamos
a ver ahora valen
para cualquier método
de interpelación
y, además son independientes
de los supuestos.
La forma más clásica de validación
consiste en dividir.
El conjunto de puntos de muestreo
que tenemos para interponer
en su conjunto uno que presenta
como puntos azules
lo utilizaremos para interponer del
otro, que estará presentado
con puntos rojos.
Lo utilizaremos para validar
de esta manera
los puntos de obligación.
Vamos a obtener una estimación de z
y tenemos seis puntos de validación.
Como veis, en cada uno de ellos
tenemos el valor real,
porque al fin y al cabo su puesto
es un punto de muestreo
y conocemos cuál era real, pero
también cómo estos valores
no los hemos utilizado para hacer
el modelo de interpretación
podremos utilizarlos.
Para estimar cuál es el estimado
por el modelo de receta.
Estimado por el modelo en este
punto que lo tendríamos aquí
conocemos el valor estimado.
Podemos tener una estimación
del error,
el error cometido, las estimaciones
del error,
podemos obtener diversos
estadísticos,
como el error, sea la medida
de los errores,
el error, que sería agradezco
a la suma de los errores,
pero la escuadra de los
errores o cuadrado
o el coeficiente de correlación
entre valores, reales
y estimados si utilizamos el mismo,
procede este mismo procedimiento
con diferentes métodos
de interpretación.
Podríamos quedarnos al final con
el que tuviera errores,
con el que tuviera un menor error de
estimación y lo consideraríamos
como el mejor modelo
de interpretación.
Para este conjunto de datos,
una precaución importante
es que los puntos del conjunto de
interpelación del conjunto
de la liquidación no deben
mezclarse nunca,
es decir, que si utilizamos,
por ejemplo este punto para validar
el modelo de interpelación
que con el que vayamos a hacer, la
estimación para este mismo punto
no debería incluir lógicamente
ese dato
entre esos puntos de muestreo.
El problema que tiene este método
es que si destinamos parte de los
puntos de interpretación,
el modelo de interpretación de
la calidad, del mismo modo
la estimación del error que hacemos
es validar, será más fiable,
cuantos más puntos tenemos,
con lo cual estamos ante
una dicotomía
aparentemente irresoluble.
La solución va a ser hacer
validación cruzada.
Esta variación cruzada en
cada uno de los puntos
de la muestra calculamos
el error de estimación
a partir del resto de los
puntos, en definitiva,
que consiste en estimar z para
cada punto de muestreo
a partir de un modelo que utilice
todos los demás puntos de muestreo.
De este modo utilizamos todos
los puntos para interponer,
pero, al mismo tiempo utilizamos
todos los puntos.
Para variar,
conseguiremos así una mejor muestra
de errores de estimación y de nuevo
buscaría la técnica de interpelación
con menor error.
De estimación es un poco
como se hace.
Tendríamos el conjunto de Interpol
de ciertos puntos de conjunto
de muestreo.
Todos nuestros puntos de muestreo y.
Tendríamos un único punto para
variar una vez que hemos seleccionado
este punto, este punto apartamos
de la muestra
y tenemos un modelo de población
con todo lo demás puntos,
y con ese modelo estimamos la
variable z en este punto.
De esta manera tendremos que
valorar el valor estimado.
En un segundo paso cambiaríamos
el punto de variación.
En vez de utilizar este
y hacemos lo mismo,
hemos un modelo de interpretación
con todos los puntos
y ese modelo lo utilizamos para
estimar el valor de la meta.
En este punto, con lo cual
tenemos de nuevo
una estimación del valor real,
con lo cual tenemos también
una estimación de esto lo vamos
haciendo con todos los puntos,
después de hacerlo con cada uno
de los puntos obtendría,
hemos dicho que quisiéramos tener
medio en medio del medio
de correlación, etc. El
inconveniente que tiene la variación cruzada
es que tenemos que hacer un modelo,
porque a punto de muestreo,
y si se trata de un modelo un
poco lento, por ejemplo,
que dado que puede ser
un poco más lento,
a lo mejor que la regresión
lineal o algún modelo
de aprendizaje automático
todavía más lento.
Modelo lento,
por todo el proceso se puede
hacer muy pesado.
La solución en este caso sería,
en lugar de uno a uno
los puntos de muestreo que
cada grupo de validación
y validar cada grupo por separado de
este modo solamente tendríamos
que a modelos diferentes.
Con esto termine el último vídeo
del tema de interpelación,
pues con las dudas
respecto a los métodos de
interpretación y la validación,
pues después otro tratando de
resolver esos problemas,
así que nada,
pero en la próxima sesión
de dudas y también,
como sabéis todos los que podéis
tener podréis mandar
un correo hasta luego, cuidarlos.