Deja de compartir al principio,
si quieres momento como dejó
ir arriba la opción negra
que aparecían las preguntas
participantes.
Ha dejado de compartir.
Si está muy bien,
pues no están entrando ahora
todos los asistentes,
vamos a esperar, pero yo no
puedo ver todo bien,
si se nos están viendo los
que van conectando.
Nos van viendo, pero están
entrando por muchos
y llevamos 711 702.
Lo vais a ir abajo, no en
participantes Anel,
cuando pasa el ratón.
Así si eres Roland participantes
que no se estrena hoy en día,
todavía ellos con nosotros nos
van conectando audio.
Van algunos sí y otros no.
Vamos a esperar a que estén un poco
el número de participantes.
Las ventajas e inconvenientes
de los 90.
Que tú puedes ver 800 personas,
claro, también a lo mejor
sí 40 no están haciendo
otra cosa bien,
un rato, los otros no habría
sido posible.
Si no presencia, sí claro.
Bueno, pues para no demorar
mucho el comienzo
vamos a iniciar ya bienvenidos;
bienvenidos a todos, a la
conferencia de la Facultad de Economía y Empresa
sobre titulada Beach de eta en
la economía y la empresa.
Hoy tenemos el placer de que
tener entre nosotros
a Daniel Peña Daniel Peña,
bienvenido es, una es un plan,
es un orgullo para nosotros
tener que tener aquí
una pena a no contar con tu
presencia el año pasado,
porque tuvimos que cancelar la
conferencia que estaba prevista,
y agradecemos mucho que haya aceptado
pues aplazarla estar con nosotros
pues este año Daniel Peña
yo no lo voy a presentar, lo
va a hacer el profesor
Máximo Macho que me acompaña,
pero sí que tengo que decir que
es un referente para nosotros
es catedrático de la Carlos
tercero, ha sido rector
de la Universidad Carlos
tercero, desde 2007,
2015 referente por las
contribuciones en el área
de los métodos cuantitativos
para economía,
la empresa Premio Jaume
primero de Economía
y, por lo tanto, un orgullo que
hoy esté entre nosotros.
La conferencia que nos ocupa
es de máxima actualidad
y es un complemento o fundamental
para nuestros estudiantes,
puesto que eta como se llama
pero que viene a ser la importancia
de los datos en cualquier fuente
o origen o naturaleza para
generar información,
para generar en definitiva
generar valor,
no generar una nueva fuente de valor,
esos datos hay que hay que
saber manejarnos.
Estamos ante unos nuevos paradigmas
de procesar datos de forma eficiente
por su volumen y por también lo lo
contemporáneo de los datos,
no es decir el momento en el
que están disponibles.
Por lo tanto, espero que todos
podáis aprovechar esta conferencia,
y yo sin más voy a dejar la palabra
al profesor Máximo Camacho,
agradeciendo una vez más la
disposición de Daniel
ayudarnos ofrecer esta conferencia
pues para todos los profesores
y todos los estudiantes de
la Facultad de Economía
y Empresa.
Muchas gracias.
Muchas gracias por tu introducción.
Yo quiero decir que sí
sí para vosotros.
Es un honor tener alguien empeño
para para mí como miembro
de un departamento del
método cuantitativo,
un poquito más éxito, más ya
aprovechando la terminología,
porque todos hemos disfrutado de la
lectura de las contribuciones
de Daniel Peña.
Tengo que reconocer que conocí entre
comillas el nombre de alguien;
peña, la primera vez, hace
más de 25 años,
cuando terminó dijo.
Hay un libro que se llama Estadística
que de un tal Daniel Peña y yo me
lo compré y aquí lo tengo,
y siguen mi estantería 25 años.
Así que pues es un placer y a
mí me han dicho que tenía
que afrontar tres apuntes técnicos
que se agravaron en el seminario,
con lo cual si alguien tiene
alguna pequeña duda,
tenga problema que no puede
ver en diferido.
La segunda es que a todos
los asistentes,
a hacer una encuesta final,
una encuesta de opinión
y que si alguien tiene alguna
pregunta utiliza el apartado
que tenéis trabajo, ponen
medio aproximadamente,
que se llama preguntas y respuestas.
Yo las órdenes y al final
de la charla
se sigue trasladando a eso.
Respecto a para lo que no sabe
quién es Daniel Peña,
pues es uno de los referentes
en estadística,
aplicada, la Economía y Empresa,
no solo a nivel español
sino a nivel mundial.
Para que os hagáis una idea,
pues Daniel Peña ha sido
Premio Nacional recientemente,
Premio Nacional de Estadística,
miembro de la Real Academia
de Ciencias de España,
pero ahora mismo tercero,
ha sido director del Instituto
Carlos tercero con Santander,
que se llama financiar de Lleida,
ha sido rector de la Universidad
Carlos tercero,
Premio Rey Jaime primero de Economía;
ha sido celo de América.
Se distinguió en matemáticas
estadística un fin,
o se ocurriría si tratas de
contar el currículum.
De hecho,
he bromeado con el decano para
contar el currículum de Daniel Peña.
Tendría que haber empezado
la semana pasada,
ha publicado en la revista
más prestigiosa
de de métodos cuantitativos con
economía norteamericana.
Biométrica y intentado ver cuántos
artículos había publicado
y la verdad es que me he parado
en el número 150,
estén incluidos.
Jr quiere más, pero ya no.
El 150 digo que me bien
el tiempo encima.
Bueno, pues se mantiene la acción,
porque estamos para escuchar,
cantina,
para escucharme a mí Daniel Peña.
Tienes el uso de la palabra
cuando quieras.
Pero muchísimas gracias.
Voy a empezar a compartir
pantalla y compartir.
Esto es el título de la
charla y quiero.
Eso y quiero empezar agradeciendo
desde luego máximo
su introducción máximo
es un buen amigo,
como estoy seguro que sabéis
especial por el cariño
con el que me ha sentado y quiero
agradecer a máximo que estoy
aquí el que se la iniciativa partió
de y para mí es un placer
por lo tanto estar hoy aquí y luego
quiero agradecer desde luego
Cano y también sus amables
palabras a Isa Martínez,
que ha organizado la conferencia
y por supuesto también
al director del departamento por
toda la organización charla
y a todos hoy a llamarnos tú porque
lo hace normalmente.
Algo así me resulta más fácil,
espero que nadie se siente ofendido,
pero a todos vosotros oyentes.
El índice de la charla tiene
la estructura que veáis
en la pantalla.
En primer lugar voy a hablar
bien conocido,
pero un rasgo de lo que llamamos eta
o los nuevos datos masivos.
Hablaré un poco de aplicaciones
empresariales y económicas,
algunos ejemplos luego trata de
forma sucinta y no técnica
contar un poco cuál es la metodología
y la herramienta para su análisis,
que se ha ido creando, que
se está creando hecho.
Actualmente estamos aprendiendo
cada día
y este es un campo en
continua evolución,
y luego brevemente se ilustra.
Haré todo lo anterior con
un ejemplo financiero,
analizando la red de clientes del
Banco Santander en España
y luego habrá bueno que llamamos,
que es lo que de nuevo, con
los datos masivos,
pues por primera vez en la historia
de la humanidad,
porque los datos más escasos
hecho muchos siglos
existido con la forma en que
nosotros llamamos datos,
hasta después del Renacimiento,
no hubo nada parecido a eso,
pero los datos, cuando yo estudiaba
pues era una cosa escasa,
difícil encontrar ejemplos
reales y aparte,
que normalmente costaba mucho
obtener y transmitir,
pero ahora cualquier actividad
que hacemos y esto
es algo relativamente reciente,
tiene unos poquitos años
prácticamente empezado,
lo cual casi cualquier
cosa que hacemos
los seres humanos, también
animales máquinas,
fenómenos sísmicos o
de cualquier tipo,
pues tendemos cada vez
más a controlarla.
Con sensores, teléfonos, móviles
de través de las tecnologías,
de la información, y que a
través de la red social
toda esta actividad genera
datos automáticos,
que se generan además con bajo coste.
Un coste marginal que
tiene que hacerlo
y no solamente somos capaces
de recogerlos,
sino que los avances en las
tecnologías de la información
ni las comunicaciones,
pues, nos permiten procesarlos y
enviarlos a través de Google.
De manera muy rápida, analizarlos
y almacenarlos.
De una manera que era inimaginable
hasta hace muy poco tiempo,
y con todos estos datos, esta
cantidad de datos y gente.
Pues, está cambiando todo.
Porque estamos aprendiendo de.
Está cambiando.
La forma en que trabajamos,
está cambiando,
la forma, en que nos divertimos,
nuestro ocio,
como cuidamos nuestra salud,
nuestra sociedad
y también la forma en la
cual es la democracia.
En particular y está estos datos
están creando datos,
están creando información muy
valiosa para las empresas
y que generalmente tienen
un lugar común
que los datos son el petróleo
del siglo xxi.
El fundamento de esta afirmación es
cómo ha cambiado el mundo empresarial
que tenéis en la transparencia?
Probablemente nos sabe muy bien.
Tenéis el ranking de las mayores
empresas del año
1995, pero bueno, no lo vi
muy bien, lo digo yo.
Lo que hay allí es coches
y petróleo básicamente,
pues está forestal, y en el motor,
si no hay grandes empresas como
las grandes empresas,
es decir,
que podíamos decir que el siglo
xxi, a finales del siglo XX,
pues las grandes empresas
donde estaba el valor
era sobre todo del petróleo,
y los automóviles será donde
teníamos las grandes empresas
tanto en valor como el número
de trabajadores,
no donde estaba acumulado, que es lo
que ha ocurrido recientemente,
que es lo que pasa ahora.
Pues parece que el año pasado
de la cotización
de las empresas más grandes del
mundo hay una empresa que realmente
es un país que sabía que
siendo petróleo,
pero el momento en que quitamos
este caso excepcional,
que es lo que hay detrás empresas
que se dedican a los datos de Apple,
Microsoft, alfabeto bajón físico,
y lo hago en el resto,
ya tenéis empresas y también
una parte importante
de la información,
y hay otras que algún banco, pero
vemos que las grandes empresas,
las grandes empresas
que han aparecido,
están todas relacionadas,
y es paradójico,
no está entre las grandes empresas,
pero por ejemplo, es paradójico que
además estas grandes empresas
de automóviles han sido superadas en
su propio sector por una empresa
Uber que no tiene un coche,
no tiene un solo coche,
es decir, que el valor de General
Motors Ford o Toyota,
etc, y consistía en las fábricas
que tenía material,
y en los coches que producía
el valor de Uber.
Es más grande ya que todas
ellas vale más en Bolsa
que General Motors Ford tenéis
las estimaciones iniciales
a la izquierda y a la derecha
el primer día.
En el año 2019, cuando empezó
a cotizar en Bolsa
ni su valor más grande que
General Motors y Ford,
esto naturalmente ha
seguido creciendo,
pero que es lo que tiene Uber, Uber,
lo que tienes tecnología,
información sobre todo información
y procesado automático de datos;
muchos datos y proceso automático
de los mismos para poder conectar
de manera eficiente
a los conductores, que son los
coches y los que trabajan,
y los usuarios, que son
los que necesitan,
y si miramos a una de las
empresas y saque
para muchos aspectos y de, y
la recogida de información
que cubren la historia de Google,
les apasionante,
y os animo a que lo diréis
como un estudiante
graduado con curiosidad, empieza
a indagar en el mundo
y empieza para eso; crea finalmente
un buscador etc.
Se ha convertido en una de las
empresas más grandes del mundo
y más pionera y Google tiene
en este momento
más de 1.000 millones de usuarios.
La población del mundo es
aproximadamente siete yo
como sabéis,
o si se calcula que casi la mitad
quizá sean usuarios de Internet,
aunque es difícil, pero de ese mitad,
3.500 tienen una.
Una parte muy importante no
son usuarios y sus datos
incluyen gigas de información
de muchos usuarios.
Si tenéis curiosidad, podéis
entrar en Google
y dar la información que tiene
vosotros total suele tener
información de los usuarios.
Es difícil de hacer simplemente
si lo diréis preguntarse
cómo hacerlo, ira y relativamente
fácil la información
y una vez entre y me quedé
impresionado, me hizo.
Recuerdan muchas cosas de mí mismo
que yo no sabía que estaba allí
a lo largo de más información
y además y estamos creando y Google
está aprovechando una
parte importante
de dicho cada vez más información
con todas nuestras actividades,
en gran parte a través de las redes
sociales a través de internet
y muchas veces usando el
saber si una idea
pues la unidad, una unidad
que empezamos a utilizar
ahora está hecha, vale, un
1.000.000 de la valla,
de la valla nos es familiar porque
ahora ya tenemos discos duros
que tienen ellos, que podéis llevar
hace poco uno pequeño
y allí puedo llevarlo
toda la historia,
todo lo que he hecho en la vida sino
prácticamente podéis llevar
toda la biblioteca de la Universidad
y como un poquito más grande
podíamos llevarlo
a la biblioteca, la Biblioteca del
Congreso de Estados Unidos
dentro de poco podremos llevar
sito toda la biblioteca,
todos los libros que Estados
Unidos y dentro de no
mucho más.
Bien, pues todas las películas
que han hecho historia.
De hecho, un examen
y esa información que se quiere en
el mundo, cada seis horas equivale
para que os hagáis una idea.
Lo que queríamos cada seis horas
equivale a todas las palabras
que se han pronunciado
y luego la capacidad
de todos los cerebros
de la humanidad.
Se calcula que son unos miles
de chaval, curiosidad,
sin poder ver cómo se ha calculado
que puede ser discutible,
pero dicho no creo que
sea muy diferente
de esa situación que podamos hacer,
y estamos almacenando,
ya información, y probablemente
dentro de muy
poco tiempo, la tendremos almacenado,
una capacidad mayor que contienen
todos los cerebros,
y esto seguirá creciendo bueno,
como son los nuevos datos
la parte de los datos nos tenemos
mucho mucho mucho mucho mucho más
si una parte los tenemos como eran
los datos hasta finales del siglo,
cuando yo di una importante carrera,
pues eran datos que eran
datos homogéneos,
cogidos mucho atención para cubrir
un objetivo específico
datos estructurados;
en tablas donde aparecían variables
y esas variables.
Típicamente tienen un alto
coste de recolección,
pocos casos, el caso serán
muchísimos y variables,
20 variables era normalmente, eran
datos agregados y poco accesible
y sabía si daba bastante la
privacidad de los niños,
mientras que ahora como todos sabéis,
es una experiencia que
todos compartimos.
Son heterogéneos y se recogen
automáticamente
son estructurados, poco más de esto,
prácticamente sin coste
incluyen muchas variables
y observaciones,
la mayoría los partir de
datos individuales
y cada vez más.
Esos datos son abiertos
y disponibles,
por lo menos una parte importante.
Cómo son estas estructura de estos
nuevos datos digitales?
Bueno, pues son datos mezclados,
que contienen muchas cosas;
contienen textos de la web
tenista de izquierda;
puede incluir sonidos
de manera digital
y, por supuesto, imágenes
y las imágenes.
Esto probablemente muchos de
vosotros lo conoceréis,
pero puedo decir por curiosidad
si a una medida
como es la información, que
se recoge en una imagen,
porque podíamos tratarla como
la información digital
porque podemos tratarlo
y electrónicamente,
y lo consideramos información,
bueno, pues una cámara,
una cámara móvil, cuando
hace un paisaje,
tenéis una foto de la Laguna
Negra, en Soria,
cuando hacemos foto.
La luminosidad de cada uno de
los puntos de los píxeles,
de cada uno de los puntos que
recogemos la imagen,
se descompone, en tres colores.
La intensidad de tres tipos de colon
o del espectro de la luz
en rojo, azul y verde,
y entonces se combina eso?
Todo se puede descomponer
en esas tres
con una proporción de
rojo azul y verde
y entonces el número o la intensidad
de ese píxel;
ese puntito, que son tres números.
La cantidad de rojo azul
y después se almacenan en matrices y
matrices en las representaciones,
recibe a una imagen que son números.
Al final, no hay imágenes un
conjunto de números, por lo tanto,
lo podemos tratar digitalmente;
exactamente igual
que el sonido de una voz
siempre presentados.
En una persona que está hablando
de una señal digital
tenemos la intensidad a lo
largo del tiempo; di.
Los datos muchas veces también los
recogemos automáticamente
con sensores, como he comentado,
y forman también conjuntos
de funciones.
Hablamos de datos funcionales,
porque los vamos recogiendo,
representan con una variable algo
de tiempo como una función
recogido en momentos muy
juntos en el tiempo.
Nos vamos, sería como
una serie temporal
continúa.
Si queréis no, por ejemplo, aquí
tenéis unos datos que representase,
pusieron unos unos sensores
en unas moscas
y ahí tenéis la vida de esas moscas.
Durante 40 días el tiempo que han
dedicado a comer a volar, a eta,
cada curva y cada color representa
una de las moscas.
Hay 62 me parecen y se han observado
durante 40 días
y como veis, allí tenemos
toda la vida;
de hecho, esto mismo se hace también,
por supuesto con animales
para protegerlos,
para seguir su evolución,
y tenemos toda la historia y algo
parecido estamos generando
todos los las personas que tenemos
un teléfono móvil
somos una proporción importante de
la humanidad, conectada a internet
y que tiene sistemas de
geolocalización,
y vamos dejando nuestro rastro.
Vamos haciendo nuestro movimiento.
Bueno, los datos además cada vez
más, son espacios temporales
o sea, no son datos estáticos,
y no son datos dinámicos en el
espacio y tiempo dinámico.
Entonces, por ejemplo, aquí tienes
y un estudio que se hizo
sobre sobre las oficinas
de Correos de Madrid,
la parte izquierda, cada punto
de que habéis hecho
una oficina de correos; si miramos
una oficina de correos,
tenéis representado y de
dónde salen los vídeos
a distintas partes del barrio, esto
es en un punto cualquiera,
la oficina, que es la que despeja
esos rayos amarillos
que se convierten cuando
llegan a su destino,
y eso genera montón de
series temporales,
series temporales,
espacio en tiempo que podemos
analizar para diseñar mejor resumen,
son datos masivos heterogéneos
en distintas frecuencias.
Acción aria diaria semanal,
pero típicamente los
más interesantes,
cada vez con una frecuencia alta
pueden representar mediciones
pero podéis estar gráficos imágenes
estos audios vídeos redes
información las redes sociales
como hablaremos en algún momento
después de distinta definición,
con varias, con información
estructurada,
distinta precisión, muchas veces.
Los cogemos los datos
con mucha precisión
y otras veces los cogemos
conciertos, etc.
Tiene una idea distinta y que
suenan muchas veces,
se caracterizan contra subes
ya velocidad y variedad
son datos muchos datos rápidamente
velocidad
y entonces, en particular,
estos datos están cambiando ya
la enseñanza, por ejemplo,
como esta clase.
Esta charla es un ejemplo de ello,
también el cuidado de la salud
y las decisiones que tomamos
con problemas económicos
y empresariales,
muy brevemente, los dos primeros
y luego están cambiando
la educación.
Esto empezó a producirse ya
desde hace varios años;
si vemos a la izquierda, ha
representado una clase de 1.308
tenéis después una foto
de una clase del año,
2019 no son muy distintas.
Aparentemente hay un profesor
que habla la pizarra,
normalmente ya no hay una tarima
alta si no lo hacía al mismo nivel
que los estudian.
Espero profesor que habla y
estudiantes que escuchan,
y Tomás.
Lo que cambiamos rotundamente es
el entorno a la izquierda.
En el siglo MMMMCC.
la única fuente de información los
que estaban allí escuchaban
y tomaba notas.
Probablemente no tenían libros,
echaba si tenían es una forma
de apuntar podría ser en papel,
como lo es actualmente,
pero escribía lo que el profesor
ahora alrededor del proceso
antes tienen muchísimas otras
formas de aprender,
sinceramente en conjunto y
globalmente muchos más importantes
que lo que podía hacer el profesor.
Información grabada como la
que fue pionera en esto
y que desconoce, viendo vídeos
e información de todo tipo,
y luego un sistema de conexión
también a través de la web,
información, etc. Buscador y
acceso directo e inmediato
a fuentes de información, es decir,
ha cambiado totalmente y esto hace
que la función de la clase
tenga que replantearse.
Parece que no, que por un lado
en este entorno tan distinto
sigamos con las clases.
Si cambiarlas, parece que
no es razonable,
que esto probablemente se puede
mejorar y, de hecho
desde hace varios años se acabe
Madrid de forma experimental,
usos incluso los cursos cero que
teníamos en Física de Matemáticas
a los estudiantes de ingeniería se
lo hicimos a través del agua
y empezamos a recoger información.
De qué es lo que hacían los
estudiantes y a la izquierda?
Tenéis una clase clase de física
y tenéis allí distintos estudiantes
daba color,
supongo que lo veáis.
Cada color es un estudiante
y allí veis cómo va progresando cada
estudiante a lo largo del tiempo
y los días que trabajan y
entonces aquí tenéis
las las actividades que
ha ido complicando.
Como veis cómo aprende
cada estudiante
es muy distinto al curvas.
Allí muy distintos.
Unos lineales nos hace mucho, al
principio tienen una experiencia,
se deprimen algunos,
lo puedan resolver
y al cabo de ciertos días, etc.
Bueno, pues cuando empezamos
con esto, nos dimos cuenta
de que lo más importante
era que estaba proporcionando
una información gigantesca
sobre el aprendizaje de los alumnos.
Es decir.
La información que podemos obtener
aquí de exactamente
qué dificultades se encuentran y
cómo la resuelve, naturalmente,
luego a partir de aquí
el camino digital,
la huella digital que van dejando
los estudiantes nosotros sabemos
que ante una pregunta
que responde mal,
qué es lo que hace el estudiante paga
y se supone que o empieza
a buscar en Google
en la web o busca un libro
por internet, etc,
es decir, que despierta además
genera una cantidad ingente de información
sobre cómo aprender.
Bueno, con toda esa información.
En un momento en que empezamos
a poner sistemas online,
pues está claro que podemos
hacer una clase mejor,
combinando aprendizaje online,
sin discusión en clase,
en discusión con el profesor en
clase, con sus compañeros
y que se va a ser el futuro
de la enseñanza,
y yo creo que, además, la pandemia
que nos ha obligado
a aprender a todas las universidades,
mucho más cómoda, parte
de las clases online,
algunas universidades
ya estaba haciendo,
pero otras no, y yo creo que esto va
a generar una enorme experiencia
como la mejor para lo que
muy probablemente
dentro de unos pocos años,
como damos clase
en una parte importante del
mundo y todas las partes,
obviamente las sociedades,
evolucionando la velocidad.
Pero va a cambiar mucho
y para empezar a ser reconocible
lo que hacemos,
esto va a cambiar las universidades
totalmente porque no tiene
mucho sentido.
Quizá con un sistema de aprendizaje
más flexible
que poner las asignaturas en cursos
y que haya que estudiar estas
cinco luego estas cinco
podemos crear un sistema mucho
más flexible y distinto
de aprendizaje y, por supuesto,
también cambiará las estructuras
y luego, claro, de la situación de
pandemia que nos encontramos,
pues hay que hacer alguna
referencia a la salud
y de hacerlo brevemente también.
Los datos digitales están cambiando
cómo vamos a encontrar
nuestra salud?
Dicho un teléfono pequeñito,
con unos pocos sensores,
tenéis arriba una banda para la
actividad cerebral lado,
y esto queda mucha información
sobre su actividad,
pero podemos controlar una parte ya
con pequeños sensores adicionales
que pueden añadirse,
pues podemos controlar bastantes
aspectos de nuestra salud,
por ejemplo, el pulso, la televisión,
la sangre, la respiración pulmonar
y otras muchas variables;
y, por supuesto,
y los datos que se han ido generando
para la pandemia
ha sido muy importantes y para
el desarrollo de vacunas
y para el aprendizaje tenéis,
por ejemplo,
el efecto que ha tenido
sobre las huesos.
He cogido algún artículo
que aparecía allí
porque es una fase que quizá
no es tan conocida,
pero digamos todos los datos
que podemos recoger
nos han ayudado y eficazmente.
La pandemia de hecho,
hubiera sido inimaginable sin la
las estupendas para compartir
información con datos que se han ido
estableciendo en los últimos años
entre hospitales, de manera
que la información
compartían otros muchos
a través de la red,
y eso ha hecho mucho más rápido la
adquisición de conocimiento
y los avances en nuestro época.
La pandemia.
Si hubiera esto hace un siglo
hubiera sido imposible tener una vacuna,
al tiempo que nosotros
hemos sido capaces
de generarla precisamente ahora
por los datos disponibles,
pero sobre todo donde no voy
a centrar en esta charla
es en los cambios que ha habido en
las aplicaciones empresariales
y económicas decir.
Poner algunos ejemplos
en los que tengáis
experiencia directa.
Yo he puesto un poquito
antes de la charla
abierto el teléfono y al país,
sino que he visto a partir de estas
informaciones que son.
Me ha salido inmediatamente un
anuncio que habla de la quincena.
Bueno, porque me sale.
Si ves la fecha,
que coincide precisamente con
estos días, del 25 al alza
y firme y quitado la empresa
que hace esa promoción,
pero que por qué hacen esto?
Bueno, yo hace unos pocos
días, no muchos,
pero con el teléfono y mire,
tengo problema con el aire
acondicionado y cada casas
para buscar que podía venir
a verla Ermelo,
y la conclusión es que continuamente
ahora o ya como ve,
y si a partir de otras muchas
cosas que recibo,
pues en la parte que todos
los teléfonos
que automáticamente deja
para anuncios,
me dan anuncios de por qué.
Pues el asunto es que el teléfono
recoge la información
de lo que hacemos, coge en la vía a
posibles interesados en anuncios,
que la envíe con nuestro
nombre y apellidos,
por supuesto, sin información
general,
pero entonces vende trozos
de publicidad,
y entonces hay una subasta
automática de ese espacio
donde se calcula la probabilidad de
que crear y se toma una decisión.
Es decir,
los anunciantes deciden cuánto
dinero están dispuestos a pagar en función
de la probabilidad de que su anuncio
y todo eso en segundos
un sistema automático decide si hace
una subasta que está dispuesto
a pagar cada uno el que pagaba se
llevarán aparece en un segundo
antes de que yo me doy
cuenta de todo.
Esto es análisis muy relacionado
con esto.
También es una experiencia que
vosotros tendréis probablemente
y que, además, probablemente,
la época de pandemia
que ha aumentado mucho de todos
los sistemas de escucha
y seguimiento de películas, series,
etc. Pues exactamente igual.
Cuando entramos en una página web
nuestra actividad se guarda
y se nos identifica con él,
y si lo hemos dado,
sino con la y nuestra actividad,
los grupos de usuarios
crean recomendaciones de productos,
como es todo importante,
pues abajo estima que un líder en
los sistemas de recomendación,
que el 30 por 100 de sus ventas
se generan por el sistema,
y lo mismo Spotify.
También ha publicado datos
sobre el éxito,
por ejemplo de nuevo,
y yo he entrado en Amazon
a pocos días
y he puesto un libro allí y
automáticamente me ha parecido
nuestra recomendación,
un libro excelente,
los elementos del libro de
aprendizaje estadístico de eta
o de esta materia,
y automáticamente montón de libros
recomendados de Machín
inéditas netflix, también
fue pionera en esto,
y entonces, de hecho, se gastó
un montón de dinero,
1.000.000 de dólares al año
2006 a 2009 en ver
quién era capaz de establecer un
buen sistema de recomendación,
de películas tenía unos datos
como los que no tenemos,
un usuario anónimo,
a que había visto estas películas
y había dado puntuaciones,
algunas entonces tenía los datos y
aleatoriamente algunas vascos
y desconocidos donde aparecen
interrogación y el objetivo
era estimar con el mínimo posible
y las recomendaciones
que hubieran dado los usuarios, pues
el mejor sistema premiado,
el año 2007 era una combinación
de 100 métodos distintos,
una idea se combinaba muchos
métodos de prevención
y fue el que tuvo el premio.
Pero después de publicarse
este método,
los investigadores se dieron cuenta
de que con la información pública
existía en el, de Amazon
o de Internet,
pues era fácil identificar
a los usuarios.
De hecho, es sorprendente lo fácil
que se puede identificar,
por supuesto, este ejemplo,
porque a otro nivel yo
tuve la experiencia
de los datos de geolocalización
de la Ciudad de México,
donde tenías lo que hacen
las personas,
y me di cuenta fácilmente, puedes
identificar la cosa
es que no debería ser capaz
de hacer, por supuesto,
donde una persona no,
porque una persona,
pues la mayor parte del tiempo
podéis ver con quién era situarme,
solo o acompañado y a que
las elevadas etc,
cuando va a trabajar.
Pero también puedes identificar
fácilmente si esa persona
tiene una enfermedad porque
va con frecuencia
al hospital, por ejemplo, te
puedes identificar incluso
la planta, etc. Con lo cual, si está
sometida a tratamiento, etc.
Y otras muchas cosas que
no voy a tener tiempo
de describir los que fácilmente
imaginar,
es decir la información
que estamos generando
extraordinariamente vulnerables
y el ejemplo de Flix,
pues parecía de información
bastante anónima,
que esto ya al principio.
Era mucho más preocupante.
Bueno, la información grande,
esta información que generan,
pues nos permite
y establecer estrategias para
usarlos en marketing
y pero abandonó entender poner
un ejemplo de trabajo
en el que participe con una
cadena de supermercados
que quería diseñar un sistema de
control para detectar cambios,
naturalmente era para gente
que pagaba con tarjeta
y estaba perfectamente identificable
en consecuencia de una tarjeta de la.
Además veremos si pagas
con caso es distinto.
Esto está para clientes fieles
que tienen tarjeta
y entonces el problema es de diseñar
un sistema de control para detectar,
cuando ese cliente parece que
podía abandonar la idea
y entonces hacer una oferta
y tratar de ver qué es lo
que está ocurriendo
y tomar acciones para continuar
con el cliente.
No teníamos datos de 7.000.000
de clientes
agrupados en compras mensuales
durante siete meses,
y lo llevamos.
Es la frecuencia de compra,
y los importes que teníamos del
orden de 7.000.000 de series de este tipo.
Lo quisiera gastado semanalmente
los clientes;
fieles quiere decir que todas
las semanas frecuentes,
no todas las semanas desaparece,
se ha comprado ese período
ocasionales,
que compran.
Desde entonces.
Toda esta información
se puede utilizar para crear
sistemas de fidelización,
y si estáis interesados y cómo
hacerlo, pues luego diría,
por supuesto, para la detección
de fraude y la tarjeta,
los sistemas perfeccionando
los últimos años también
para construir indicadores sociales
a partir de textos en la web
trataba de hacer y de utilizar
para prever la bolsa,
y ha habido algún artículo que
cuesta una pequeña ventaja
muy significativa, pero
una alguna ventaja.
Inquiere mental en la utilización
de este sentido sentimental.
Análisis para la cosa que sabéis
es bastante difícil de hacer
y pero en otros muchos casos para
para conocer la sensibilidad social
a determinar las más serias, esto
se está aplicando intensamente.
La idea es identificar palabras
positivas y negativas
y clasificar los textos como
positivos y negativos en función
de un vector de palabras,
y con esto podemos mezclar las
opiniones con indicadores
y entender mejor la actividad
o sentimiento social
y su repercusión económica
sobre precios,
sobre el ipc y también, por ejemplo,
podemos medir la economía
en tiempo real recogido los datos.
Esto es un trabajo reciente
que tenéis ahí referencia
que se ha hecho durante la pandemia,
las estadísticas oficiales
tienen bastante retraso y estos
autores han tenido acceso
a los datos de registros bancarios
de CaixaBank,
que tiene el 27 por 100 de
las nóminas de España
aproximadamente, y entonces han
hecho un análisis para ver
cómo y los gastos de las personas.
Cómo han cambiado las personas,
cómo ha cambiado aumentado,
que aumentaba lógicamente,
no como España,
y el dato de Midi de la economía
y prevista a partir de estos
datos estimados.
No voy a entrar en los datos,
pero aquí tenéis simplemente porque
me llamó la atención
de lo aparatoso que es.
Aquí tenéis los gastos.
Y cómo han ido cambiando con
relación a los gastos online
y servicios que lo veis?
Es la línea roja que llega
a la pandemia de marzo
del año pasado y empieza a crecer,
y, como los gastos tienen
las tiendas normales,
digamos de las habituales,
pues yo, naturalmente,
por el confinamiento
y luego hemos ido recuperando.
Bueno, estos son algunos ejemplos,
pero quisiera dar una pincelada
simplemente de las herramientas.
Cómo han cambiado las herramientas
para analizar cómo se relaciona
el análisis de estos datos,
con el visto bueno?
Pues estos datos se analizan,
digamos, con dos bloques
de técnicas que se están integrando
lo que se empieza a llamar.
La tasa por un lado están de
inteligencia artificial,
son algoritmos automáticos,
e informáticos de predicción
tomas de decisiones,
que se desarrollan en algunos casos
lógicas estadística, etc.
Pero son automáticos,
y, por otro lado estaba Estadística
e Investigación Operativa estudio
que buscan relaciones entre
las variables,
sobre todo bien concentrarme
en la estadística.
La economía e Investigación
Operativa también es muy útil,
no porque las imitaciones
y siempre queremos optimizar algo
cuando haces un modelo
y eso es fundamental,
pero y basándome en estadística.
Y sobre todo pues nos
enseñan cómo buscar
relaciones entre variables y cómo
generar más interpretables,
es decir, que tiene dispuesto latas
hallados un poco como la estadística
a ultimar y esta serie mi6,
y tan desde la ocupación en
paralela artificial,
inteligencia.
Todo esto al que llamamos
bueno y que este dato
es lo que es importante.
Esto es importante porque hay
mucha confusión con esto.
No se trata de hacer lo mismo
que hacíamos antes
con más datos al principio.
Muchas estadísticas son
muy buenas revistas
Estadística.
Y en otros hace pocos años 10 15 años
y ahora pues todavía hay
gente que lo defiende
especialmente mayores y bueno.
Más datos.
Pues bueno.
Si perdiera cuestión de
cantidad podrá más
o menos adaptar lo que tenemos, pero
eso no es interesante de hacer
lo mismo con más datos, porque eso
lo hacíamos bastante bien
y nos va a aportar mucho más.
Lo que se trata es hacer
cosas que antes
no podíamos hacer y que los
nuevos datos lo permite,
es decir, aprovechar los buenos datos
para estimar modelos más complejos
con mayor capacidad predictiva
y además con variables mucho
más, por ejemplo,
problemas que estamos sufriendo
y que podéis encontrar información
en la web.
No pueden uso de Twitter.
Cómo podemos usar Twitter para
predecir el empleo,
por ejemplo, el desempleo o cómo
influyen las decisiones
compras de las decisiones de
compra de una persona
lo que hacen las redes sociales o
cómo podemos estimar una persona
es ejemplo dicho estimación de
la renta con los gastos?
Es decir, son problemas nuevos que
antes no nos habíamos planteado.
Bueno, y para hacer esto necesitamos
métodos automáticos,
o supuesto sea el futuro.
Todo tiene que ser porque estamos
pensando vamos análisis con eta
siempre y los análisis de
un experimento concreto
que requiere pocos datos
y que tendré que hacer
un especialista con detalle,
pero yo me estoy refiriendo
sobre todo al análisis
cuando tenemos muchos.
Entonces muchos datos.
No podemos hacer nada manualmente,
digamos,
o conceptualmente poco a poco,
y tenemos que tener un ordenador
que nosotros queremos hacer,
y hay tres principios básicos en
Pasaia, que sería, primero,
que dimos una regla predictiva
eficaz, no un modelo óptimo causal,
que a lo mejor no existe, y
no sabemos muchas veces
incluso con bueno.
Esto es muy chocante,
porque durante mucho tiempo los
estadísticos y economistas
hemos querido buscar el mejor
modelo causal claro.
Nuestra insistencia en esto, que
era lo que sabíamos hacer
y es una cosa muy importante hacer
siempre que podamos hacerla,
hizo que no viéramos problemas donde
no había casuales analizar imágenes.
Cuál es la causalidad que podemos
encontrar entre los valores píxeles
de tres matrices y la respuesta
de una persona?
Eso es muy complicado y de hecho no.
Por eso los estadísticos no entramos
y los que entraron fueron.
Dije que por procedimientos
muy simples,
pero empezaron a tratar de ver cómo
poder utilizar esa información,
imágenes de vídeos de sonidos.
Es decir, queremos buscar
reglas más eficaz,
no necesariamente un modelo que
a lo mejor no tiene sentido,
porque está cambiando en el tiempo,
y no tiene mucho sentido.
Segundo, queremos elegir
la regla de prevención
por su capacidad predictiva,
fuera de los datos que tenemos otros
nuevos que van a aparecer.
Eso quiere decir que siempre que
tenga que dejar una cuestión
el modelo y otra parte y voy a
juzgar si bien el modelo funciona bien
cuando prevé bien fuera
o no con los datos,
es decir, eso quiere decir que la
actividad de los parámetros
de otras cosas, la importancia
pues empiezan
a tener mucho menos complicado
y luego, en tercer lugar,
no se trata de encontrar una regla,
sino un método de prohibición
que típicamente combina todas
las reglas de perdición
eficaces de prevención eficaces.
Puede haber muchos, es decir,
vamos a prever mezclando muchas
reglas distintas,
pues me voy a tratar de explicar
un poquito estas tres reglas
y son van en contra de la
filosofía tradicional
y admitiría que hemos utilizado
si las entendemos
y las damos vueltas bien y no
están en contradicción
con ellas, lógicamente,
sino la forma en que hay que
adaptarlo a nuevos datos
y viendo bueno de predicción.
En lugar de esto ya empezó a pasar
estadística como por ejemplo,
muchas series temporales.
Típicamente los años siglo
pasado siglo XX modelos
de ecuaciones plurales,
tratando de entender la relación
entre las variables económicas,
que era y por tanto podríamos
entender su relación
y utilizar modelos estructurales
o vales vectorial armas etc
esto sinceramente para muchos
cuando tengo muchos datos
y desalojados sutil y lo que
se empezó a desarrollar,
sería y se ha empezado a desarrollar
y es inútil,
con datos todavía son modelos,
factores que su modelo,
factores del modelo predictivo
de la causalidad,
nos olvidamos de guía y tratamos
de entender lo que es.
Un modelo dinámico
supone que la serie vector
de series que yo observo
se debe a unos factores que
no observó voy a ver
si no puedo, las pueden encontrar
entre los datos dentro de los datos,
pero que hay unos pocos, y son
ellos los que mueven.
Todas las series y bueno,
tenéis alguna referencia.
Una, bastante antigua.
Yo trabajé con esto hace
ya bastantes años,
es un genio de la estadística y
el cual yo he aprendido mucho
y he seguido trabajando
hasta recientemente,
como los artículos recientes sobre
este tipo de este modelo
quizá lo podéis entender mejor.
Si hacemos un gráfico.
Viéndolo gráficamente y aparte así
vemos cómo estos modos general
suponen los que yo tengo un conjunto
de varias variable, uno la variable,
que son las que quiero prever, pero
eso puede ser, pues puedo perder
ventas o puedo prohibir el consumo
de electricidad, etc,
en distintos puntos o dos países o
en distintos puntos geográficos,
pero estas son mis y naturalmente
las variables,
las tiempo,
si no tengo valores del mal
ocurre así sea bueno.
Entonces,
qué es lo que hace un modelo
factorías sumado a la factoría?
Lo que hace es hacer una
combinación lineal
de todas esas variables,
factores es decir,
aquí mis que aparece factor 1,
factor r, r, factores y apareció
en aquellos círculo hitos
y que pasa en uno de estos circuitos
más variables que se condenan
con ciertos coeficientes y salió
una variable de salida,
es una combinación lineal de entrada.
Es decir, que lo que hacemos
es que veamos factores,
opinando variables como si
tuviéramos unas nuevas;
es unos indicadores del conjunto
de datos compilación lineal
de esas variables.
Es y ahí tenemos la información común
de todas ellas y si quiero prever
una variable variable,
un tema lo puede hacer
para cualquiera,
pero lo he hecho para simplificar,
que me interesa.
La primera variable es la que
me interesa entonces,
la variable.
La predicción lo vamos a hacer
combinando esas nuevas variables
que crean los indicadores,
los factores que se generan
automáticamente los datos,
esos factores, con la información
histórica pasada,
avisa.
Variable y para generar.
Uno aparece un valor y su mundo
y viene de la historia de la
variedad de primera variable
y luego otra parte de estos
circuitos que aquí lo que hacen es ponderado.
Bueno, esto se puede generar
una generalización de esto
es una red mal o, y si
pongo muchas capas
lo que ahora se llama y o
aprendizaje profundo, que es lo que cambia,
podemos generalizar esto,
suponiendo que las relaciones
entre las variables
no tienen ese supuesto.
Todo eso es cierto, con datos
agregados, piezas de roca,
cuando empiece a hacerlo con datos
mucho más arraigados,
es decir, donde timidez, conexión
y casi una gran experiencia
para indicar que cuando agregó
datos tengo relaciones.
Sin embargo,
cuando mis datos individuales
es decir,
si el consumo de quiero ver
el consumo de perdón
el consumo de electricidad,
el consumo de electricidad
de una persona concreta,
entonces ya no tengo llaves
pudieran necesitarlo
y luego, aparte, porque me tengo
que quedar con unos factores,
unos indicadores.
Quizás los indicadores
se pueden combinar.
Los primeros tengo los puedo
combinar entre sí
para obtener otros,
y así sucesivamente utilizando
relaciones no lineales
y entonces es lo que hace
que lo que tenéis aquí
las variables de entrada esto
es igual que antes,
pero ahora eran más variables,
primero h,
y esas variables entran en las redes
donde generan unas variables
y luego, al final lo que cambia es
cómo, qué es lo que pasa en cada uno
de esos circuitos que antes era
una combinación lineal.
En una red neuronal pasa una
cosa más complicado,
un poquito más complicado, mucho más,
porque lo que hace es también
hace una combinación línea,
igual que en el modelo, factores,
pero luego aplica como bis,
hay una función no lineal, una
función de activación no libia,
de manera que hay una
relación no línea,
la salida y la entrada,
y lo demás es bastante parecido.
Pues aquí como veis aquí
tres variables menos;
se combinan linealmente,
y esa salida se somete a una función
muy frecuentemente,
es la función logística, se
transforma de manera no lineal,
y eso me da el permitir funciones
no lineales,
pues da una flexibilidad
enorme a estos métodos
y aparte, al permitirlo
en distintas etapas.
Al final puedo conseguir casi
funciones no lineales,
se puede demostrar que con la red.
Existen redes especializadas contado,
es la básica, pero existen
redes especializadas,
las series temporales, por supuesto,
pero es un ejemplo de
un modelo empírico,
un modelo empírico no para
series temporales,
sino para dar su visión y recogido
un trabajo de máximo hecho
en la Universidad de Máximo y sus
colaboradores con Salvador,
en donde ellos utilizan árboles de
decisión para prever el precio
de la vivienda, que es un
árbol de decisión,
pues es un árbol donde lo que vamos
haciendo vamos en función
de una variable, que en este
caso de la altitud
y la longitud de la localización
de la vivienda por la longitud
vamos dividiendo los datos en grupos
y vamos dividiendo sucesivamente
hasta que al final llegamos
a grupos a grupos
donde la predicción que
damos es la media,
el precio de la vivienda Madrid y
tenemos simplemente con una regla
tenemos un precio medio de 200.000
en el otro lado 600.800
1.000, que es lo que hacemos
estos cortes.
Así no se trata de explicar
a la derecha empíricas.
Vamos haciendo empírica.
Mantiene de forma automática los
datos, no es una relación causal
de lo que puede influir en el
precio de la vivienda,
es obviamente el tamaño y cómo
influye, y también el número
quizá de cuartos de baño,
la localización,
y esto lo determinamos a
partir de entonces.
Cada en cada nudo lo que hacemos.
Si se corte, que avisa y valores
de la relación entre ella
y para él se menor que
un cierto valor,
lo haremos por un lado y para ir
mayor que un cierto valor
lo hacemos así y con ese
tipo de divisiones
podemos aproximar cualquier función
aproximado una función que sube,
que baja y ha podido ir aproximando
haciendo divisiones
de ese tipo en función de los
valores de la panorámica
eso se hace con muchas variables,
pero es otro tipo de función empírica
y luego la actriz y el segundo
principio el principio.
Buscar reglas de prisión empíricas
basados en segundo
y utilice elegir las separando
y los datos en una parte,
la predicción y otra parte en la
cual si dividimos estimación
y validación en los parámetros parte
de si el cierre de parte
de los parámetros que mejor sirven.
Aparentemente.
Y comparó las reglas y las comparó.
Con los datos en la parte de
la división de los datos,
se puede hacer si son datos
independientes o Salazar,
y si tengo series temporales,
es más complicado,
hay que mantener la obviamente los
datos a lo largo del tiempo
y se podía hacer ya de hacerlo
que probablemente muchos conozcáis
mediante vamos moviendo
el origen a lo largo del
tiempo, una parte
y la siguiente esta vez sí y
luego tercer principio es
combina muchos modelos
y tipos de datos.
Es decir, si yo tengo datos.
Y tengo puedo generar distintas
reglas de prohibición
y las combinó, o, teniendo
en cuenta su precisión,
generalmente, en su eficacia,
en una única regla general.
Hay muchas formas de hacerlo, tienes
un procedimiento de ellos
que lo que hacemos es combinar
muchos modelos simples,
pero convivido muchos.
Voy a dar un poco porque voy
un poco mal de tiempo
y voy a saltar un poco esto, pero,
vamos con muchos tipos de
modelos globalmente,
dependiendo del tipo de modelo
o de una manera o de otra,
pero, en general, el objetivo es
construir muchos modelos,
distintos y combinarlos.
Vamos fuera claramente
mejor utilizaría,
pero no son caso y, aparte, con eso,
los modelos prevén mejorar
en una parte del espacio
y otros espacio.
Entonces, tengo mucha
más flexibilidad.
Ha dicho en un modelo al
final muy no lineal,
porque, como consecuencia de
la combinación de modelos
que típicamente además no lineal,
y luego también combinamos distintos
tipos de datos,
porque puedo obtener datos anuales,
a lo mejor trimestrales diarios,
para prever una misma cosa,
y todos tienen información
sobre un fenómeno.
Y cómo?
Como prever cómo mezclar esos datos.
Y para terminar, porque ya es puntual
y veo que ya estamos
llegando a la hora
y un poco rápidamente simplemente
general,
se quería ilustrar sin
ejemplo financiero
que si el análisis de una red de
clientes del Banco de España,
que es una red de clientes bueno,
sí tan personal como representar
mediante un punto de vista cliente,
que un banco y entonces sí
se ponga esa persona
si realiza una transacción
financiera con otros y conecta con otra persona
y tenemos una red las secciones
financieras transferencias
pagos etc que hacemos entregó y
luego también hay podemos construir
una red paralela a la de pagos
de las relaciones.
Por ejemplo, si aval un crédito
o una persona es que tengo relación
con él, no le doy dinero,
no nos intercambiamos dinero,
pero dio una manera
manifestando que tengo una relación
con él o si hago una transferencia
a una persona de más, y
le pido felicidades
por tu cumpleaños, pues además
de enviar dinero
quiere decir que tengo una relación
de amistad con él
y tenemos,
por lo tanto también una
red de relación.
Trabajamos con ambos tipos de
transacciones financieras
y ecuaciones para personas
y también por supuesto
personas jurídicas
no empresas entonces qué qué y
qué ventajas tiene analizar
los datos en forma de red?
Pues que podemos encontrar
clientes centrales,
identificar grupos de clientes
y también podemos generar variables
que sean útiles para otras cosas.
Por ejemplo, para la morosidad,
descubrimos cuando analizamos esta
red de clientes aquella
unos pocos años, que esta red nos
daba mucha información para,
para prever mejor la morosidad.
Es decir, que una persona
deje de pagar al banco,
una deuda que tiene el préstamo.
Tenemos 80.000.000 de sensaciones un
poco por el pueblo, por ejemplo,
para que nos sirven como smi, como
miden los bancos como día,
y ya están dejando de
hacerlo como media.
Los bancos.
La importancia por su situación
financiera
tenía muchos activos en el
banco era importante
y si no los tenían bueno, eso es una
posibilidad para informar mejor
y también es importante tener
en cuenta su actividad.
No es lo mismo un cliente y sus
conexiones no es lo mismo
un cliente que prácticamente
está aislado
y que tiene unos activos que valga
al 100 por 100 unidades monetarias,
lo que sea que otro cliente,
que tiene también 100.100
unidades monetarias,
pero que además está relacionado
con otros muchos clientes,
con actividad muchísimo mayor
dentro de lo que este cliente haga.
Este segundo cliente podría afectar
sus relaciones con otros clientes
a lo que hagan otros clientes y,
por lo tanto, es importante,
más que pensar en los activos
en pensar lo que perdemos,
que puede ser no solamente dinero
sino de otros clientes.
Si una persona, es decir,
tenemos que ver la importancia
estratégica
por su centralidad dentro
de su centralidad,
dentro por ejemplo tienes
un clan familiar,
estos son datos de verdad de
clanes y entonces veis,
por ejemplo cliente de color,
representa un tipo de cliente
y una característica, pero ahí
tenéis un cliente rojo,
alguien medio que está conectando
un montón de cría.
No es la persona clave para conectar
su grupo a la red,
aquí tenéis otro de otro cliente.
El cliente más azul está conectado
a unos poquitos y no conecta
dos bloques enormes de 500 por tanto,
este expediente es clave para
que la cliente desaparece,
pues el efecto puede ser.
Cuando encontramos estos datos
de que esta persona que
sea una señora mayor
y aquí tenemos parte de
sus descendientes
y las relaciones de sus postulados
que tenemos por allí,
dos familias enormes, con muchas
relaciones y las empresas
involucradas y esta persona que a lo
mejor no tenga muchos recursos
Nacional de Navidad que el banco
las está tratando mal,
no se puede tener un efecto enorme,
esa persona no tenga bueno, y
también descubrimos que las variables
no pueden ser muy importantes
para la morosidad
y los para se utilizaban típicamente
varias despectivas del cliente
los usos de que dispone describiendo
el cambio de hábitat, también, etc.
Pero lo que no se utilizaba la
aquí tenéis la variable más,
los dos más importantes para
la morosidad y beige
sistemáticamente aquí y
se está clasificado
para por tipos de clientes, etc.
Y la relación con el banco,
pero apareció una constante,
que es lo más importante.
Si ha tenido la variable
más importante
y si ha tenido antes o no un premio,
eso aumentaba muchísimo
la probabilidad,
pero el segundo punto era la
proporción de personas
a un paso dentro de la red
que habían tenido.
Es decir, que una persona
estuviera conectada
que digamos sus conexiones directas
no hubiera ninguna,
era casi una garantía de
que está presionando
mientras que la persona tenía
conexiones a un paso
con alguien que había tenido.
Eso aumentaba muchísimo.
De hecho, era la variable
más importante
para prever a parte de la premios
de esta persona,
es decir, que las variables
realmente a dos pasos,
a 3, etc. También tienen
importancia menor,
es decir, que las variables que
podíamos obtener solamente
a través de las importantes para
prever muchas acciones.
Entonces, en conclusión,
la red de clientes ha proporcionado
información nueva
tanto para la importación
de clientes,
para las comunidades, para las
comunidades existentes,
los grupos de clientes
y nos permitía,
además simular efectos; por ejemplo,
se obtiene a través de
la red de clientes;
el momento que tenemos,
una red podemos ver.
Supongamos que esta empresa
entra en problemas
y en un momento determinado
este grupo de personas
que cobran salarios de esta empresa
va a ser a este grupo,
y así sucesivamente podía haber
siendo estas personas
que tienen relaciones con estas,
tienen alquilada la casa, esta
persona para ver si aceptaban,
etc. Y podíamos prever antes
de que ocurriera el efecto
de que una empresa entra
en suspensión de pagos
y toda la cadena que podría
desencadenar
y finalmente algunas variables
de red como de morosos?
Persona?
Pues serán importantes para muchas
actividades del banco,
como prefiero.
Es decir,
que esta información, la información
estructura y forma de red,
permitía muchas cosas que sin esta
información no sería posible.
Por y para concluir, pues
si simplemente
lo que trata de ilustrar
es que los datos masivos son
una fuente fundamental
para serlo cada vez más
de conocimiento.
El mundo actual en la sociedad
y conocimiento
que pueda aportar un valor añadido
y por supuesto hay alguna pincelada
en la charla vivía casi
hay un riesgo enorme.
Si no tenemos que tener cuidado,
luego es cuidado y social
y los rasgos y los la huella
que vais dejando.
Las actividades se encuentra
a las urbanizaciones
y países de éxito en el siglo xxi va
a ser utilizar este vídeo de eta
y las empresas sean capaces
de hacer estrategias
como las empresas que se han
dado cuenta de estos.
Se han convertido en las más
importantes del mundo,
y, tercero, y esto es importante
para nuestro futuro
la capacidad cuantitativa,
para entender y analizar
los masivos es una de las actitudes
más demandadas.
De hecho, es la que más de acuerdo,
por la voz de mira algunas
encuestas, Estados Unidos,
Alemania e Inglaterra dicen la
que más está creciendo,
más rápida de mercado de trabajo,
porque hay una caricia enorme para
gente que sepa hacer esto,
y, además, va a seguir creciendo
en el futuro;
o si aquí se animó;
a que cuando ves que es trabajo,
primero que trata de aprender
de esto, el Estado,
solamente lo que podéis
hacer en la Facultad,
sino también podéis ver
cursos en la web;
podéis recoger el montón
de información,
y, si los formando, yo, recogiendo
el trabajo de mañana,
pues que tengáis en cuenta
que esta faceta
ayudar mucho y nada más en la
presentación está basada
en parte, en un libro que acabo
de terminar con Luisa
y de la Universidad de Chicago,
al igual que el mes que viene
Estadística dependen de esta
parte de la presentación,
y los ejemplos,
y que mirarlo con detalle están
descritos en este artículo.
Es al mismo artículo
invitado es el que tenéis al haber
hecho esta piscina de eta,
y, sobre todo, vamos.
Tiene una parte técnica que
se interesaba menos,
pero sobre todo tienen muy contados
con detalle varios de los ejemplos
que a los que he pasado
muy rápidamente.
Y luego también sale un libro de
nuevos métodos de datos masivos,
y yo soy uno de los editores donde
está el artículo de Máximo
y también otro sobre petición
el cual me ha apoyado,
y muchas veces,
y eso también, muchísimas gracias
a compartir pantalla.
Gracias a la prueba
de que no nos habríamos equivocado
cuando elegimos a ti
para que contarnos qué podemos
hacer los economistas
ante ante la ola de que
tenemos encima
es que nosotros tenemos un límite,
capacidad de 1.000 usuarios
y y se ha agotado y he
recibido mensajes
y correos de gente que no
ha podido conectarse,
porque hemos aceptado
los espectadores,
ha habido al menos -1.000 personas
que estaban interesadas en la charla,
que daba.
Así que enhorabuena por el éxito.
Para empezar,
si alguien quiere realizar
una pregunta,
esta podéis hacerlo preguntas y
respuestas que Daniel y bueno,
he querido hacer.
La primera, que estoy un poco
obligado a hacerla
no, que es claro.
Nosotros estamos en la Facultad
de Economía Empresa
y yo entiendo que esto no
es una moda pasajera,
que ha venido para quedarse,
y yo me atrevería a decir
que está empezando
y que estamos en las puertas de lo
que se nos viene porque lo veo
como una obra que nos lleva.
No podemos hacer nada
en contra también
al análisis de nada, pues
no se enfrenta a gente
de la economía la salud
urgente informáticos
y nosotros que somos economistas
no a tu juicio
y con la larguísima experiencia
que tú tienes Facultad de
Economía y Empresa.
Yo para mis alumnos tiene
dos preguntas.
Una es piensas que los planes
de estudios actuales
en la Facultad de Economía y Empresa
están preparados para el análisis
de lo que nos está dando el
mercado y si no es así
qué cosas podríamos también
nosotros como docentes?
No, porque al final tiene
que enseñar cosas que luego le
tengo un trabajo fuera,
cuando sale.
La segunda pregunta es
y si yo estoy acabando los
últimos cursos primero
la verdad es que no te damos cuenta?
No?
Pero cuando ya estás acabando
en cuartos y ves
que el mercado laboral tiene esta
guía a la vuelta de la esquina,
esto que les recomendarías a alumno,
que quiere formarse en este
tipo de análisis
de datos bueno yo muchas preguntas
me pareció muy pertinente
y desde el punto de vista
profesional lo que estamos diseñando había
que replantearse un poco todo
si es que no tiene sentido.
Me parece un.
Hoy un curso de Estadística
como dábamos 20 años
o inscritos sobre esto, escribía
de otra manera.
Espero que los principios
valgan, y sirva, pero,
pero yo creo que es muy importante
el segundo o el tercer día de clase
a un alumno hablarle
y no una variable,
sino de que tienes muchas y cultivar,
y yo creo que tenemos que eso,
que normalmente lo contamos al final,
porque antes era el Nadal,
había que hacer mucho.
Invertimos mucho en una variable
que tenemos que hablar siempre
de muchas variables, casi
desde el principio
y luego cómo se describe
una muchas variables.
Explicó columna y las demás igual,
pero inmediatamente, hablar
de la relación
entre y luego tenemos que tener un
enfoque bastante pragmático,
y sorprende el principio.
Segundo principio, que lo importante
no es el ajuste,
lo importante es tener un modelo,
que los datos y pone contento
y perder mucho tiempo
con contrastes de significación etc,
y luego ese modelo no
sirve para nada,
porque yo creo que la estadística
durante mucho tiempo
se desarrolló en el siglo pasado,
sobre todo el siglo XX
pero es una situación
mucho más estática.
Entonces, pensábamos que
hacíamos modelos
y quiso.
Si nos iban a servir para
cierto tiempo,
y eso es verdad, para descubrir
leyes físicas
o algunas leyes económicas pocas,
porque casi todas ya están
cambiando con el tiempo,
porque la sociedad es distinta y
las personas somos distintos.
Entonces casi todo está cambiado.
Eso quiere decir que no tengo claro
que me prevea y previa bien,
fuera de la muestra, es decir,
según un principio fundamental
convencer a los estudiantes,
menos dar vueltas, el modelo, etc,
y luego un enfoque mucho
más ecléctico.
Dado que la realidad
es muy complicada
porque es bueno ver la relación
entre y podréis la renta
y y la renta que una persona recibe
lo que se gasta en moción,
por ejemplo, pues es relativa fácil,
pero todas esas cosas ya saben lo
que tenemos que descubrir ahora
y no lo sabemos.
Cuál es el comportamiento
de determinados grupos
ante determinados estímulos
y además se llegó
a obstruir la relación a base
de datos individuales,
y eso es muy complicado.
No sabemos hacerlo con relaciones.
Entonces,
todo esto requiere un enfoque mucho
más pragmático y claro,
si aquello que la manera de
transmitir la información
a los estudiantes poco a poco
tampoco dio al tirar los libros
y empezará el día de mañana
con otra cosa
pero sí ponerlas en contacto
con datos reales
y aprovechar cada vez más en
contacto con datos reales,
económicos entre y al abuelo,
montones de datos accesibles de casi
cualquier cosa que los alumnos
pueden bajar para analizar
y yo creo que poner mucho énfasis
en el análisis de datos,
más que los de, etc. Eso yo creo que
va a tener menos importancia
en el futuro antes no tenía
mucho pero bueno entonces
para los estudiantes y les
digo muchas formas
de aprender a mí por ejemplo
la cara acabe.
Hace años que ha habido menos una
temporada con mucha atención
y le parecía una maravilla.
Existimos toda de información
en la web
y muchos casos gratuitos, además,
en los cuales podéis aprender
más sobre datos masivos,
y, y si hay montones de información,
siempre tenéis que buscarla hace
hecho muchos de vosotros,
supongo que habléis inglés o singles,
y si no, lo primero en
un mundo globalizado
como el que estamos y está la
información sobre esto
generalmente aparecen inglés, pero,
por ejemplo, de forma pionera,
con el uso de sus ases,
etc, libremente,
en la web hace ya varios años y
mejores universidades del mundo
está convirtiendo en universidades
de todo,
donde un estudiante de Guinea, pues
puede conectarse y aprender,
y eso está muy bien.
Eso es la organización,
la parte positiva.
Pues aprovecharla, vosotros también
estáis restringidos
a seguir en una facultad con
un profesor limitado,
y esa no es la única fuente
de conocimiento,
eso puede ser muy útil,
puede ayudar mucho,
puedes burlar os permite conectar
con otras personas.
Compañeros con nuestros intereses,
pero estoy en un mundo muy hambriento
muchísima información buscarla
buscarla buscarla y aprender
y sobre todo tener en cuenta que
este campo, este campo,
puede abrir muchas puertas
para el futuro.
Sea mucho, aquí gratis,
y aprender a utilizarlo, a formar
grupos de trabajo,
hablar con nuestros profesores
para que os ayuden,
y seguro que están en mucha
mejor situación.
Todavía no todas las pruebas,
desafortunadamente,
personas escuchando, escuchado
muchísimas preguntas
cogiendo que resultan un poco
más significativas.
Ahí.
Hay una gente que me están
preguntando qué bueno ha resaltado
muchas de las ventajas, que
obviamente tiene actuar,
pero también hay algunos
inconvenientes
que querría saber esta persona
desde tu punto de vista.
Cuál es el mayor inconveniente?
Vivir en un mundo tan globalizado
y con tan poca intimidad.
Bueno, pues yo creo que un problema
que tiene muchísima información
es que y situaciones que provocan
o que contribuyen a la
equidad social,
porque poco lo compartimos
entre todos,
pues, y tienden a desdibujarse
en el momento que hay
mucha más información.
Quiero decir que, por ejemplo,
una comunidad.
Pues antes a lo mejor se pagaban
los gastos comunes
como fuera no llegan.
Ahora es el momento en que podemos
medir lo que gasta.
Cada uno incluso puede
terminar midiendo
las veces que utiliza el ascenso,
pues podría haber una tendencia
a que gente exija,
y lo pongo.
Pongan este ejemplo, que es trivial,
pero yo os imagináis
que afecta a casi cualquier
cosa de actividad social,
pero en el caso de la comunidad
quizá parece más inofensivo
que pueda exigir que él paga.
Con relación a lo que entonces,
muchas veces usar más
los recursos públicos son
los que tienen menos,
porque para eso está la equidad,
tienen muchísimo dinero y muchas
posibilidades de moverse,
y tal probablemente no he
utilizado muchas cosas.
Están disponibles, pero
están disponibles
para que la gente que tiene
menos recursos
entonces eso crea problemas claros
y luego además inmediatamente
disponer de esa información,
disponer de toda la información
que hay en la bolsa,
por ejemplo, es peligrosísimo
los datos de localización.
Dicho y cualquier dato relacionado
con salud.
Eso puede hacer que los seguros
de salud, bueno,
y está empezando a pasar con
los coches en España
todavía poco, pero en algunos
países y haz
tu historial como conducción y
lo que has hecho determina
muchísimo lo que pagasen la
prima, y eso podía decir.
Bueno, eso puede estar.
Si uno es responsable,
que efectivamente tiene
muchos accidentes,
porque es mal conductor, está bien,
tiene su parte positiva,
pero también puede haber
tenido mala suerte
o simplemente tiene y, y
una deficiencia física
o un problema,
o viven una situación de
comunicación por la zona en la que vive etc
es más fácil que te cae accidentes
por ejemplo por nieve etc
por lluvia por malas carreteras etc
que le puede perjudicar Y eso
normalmente no se te cuenta
si se va a hacer de manera
automática,
es decir,
que se pueden producir muchos casos
de discriminación a gente
que tiene una situación más difícil,
típicamente claro,
la gente que tiene recursos
y buenas situaciones,
la menos afectada y, por lo tanto,
vamos a tener muchos problemas
de injusticia social,
es decir, que los contactos sociales
que tenemos en la sociedad
una sociedad mucho más ahora
por término medio
y repartimos un poco la Filosofía
La Filosofía,
conseguida a lo largo de muchos
siglos de historia
de la Humanidad entre todos, pues
que una información tan exacta
y tan detallada de lo
que podemos hacer,
pues crea todo tipo de incentivos
para que sí y personas se beneficie
y otra se penalice,
y yo creo que esto es
un problema grave
al que yo ahora me gustaría hacer
una última pregunta,
como para terminar con
un mensaje positivo
y ahora contando con un
mensaje positivo,
estoy detectando entre las
preguntas que hacen
y supongo que la mayoría son alumnos,
tienen un cierto temor no
enfrentarse a hasta a esta moda,
dictada quizá alguna de ellos.
Así que no se cree suficientemente
preparado
porque si detectan preguntas se
acaba tu charla con un mensaje positivo
y un ánimo para que para que vean
que cualquiera a mí me recuerda
la ratatouille,
ya que cualquier persona puede y no
se tiene que malinterpretar,
no cualquiera puede cuestionar
cualquiera, tiene interés,
puede aprender, y esto
un mensaje positivo,
y cualquiera que tenga un interés
en aprender técnicas
son perfectamente capaces en
tu juicio, que es así.
Si yo creo que los principios
generales
son los que ellos han apuntado,
los principios y lo que
tienen que aprender,
cómo implementar lo que ellos
han visto en la general.
Hay muchos datos, no
tipo de problemas,
y eso se aprende, no tiene ninguna
dificultad general.
No quiero decir que simplemente
tampoco tienen que convertirse
en grandes especialistas.
Los que terminan analizando,
digamos, datos con un ordenador, etc.
Será una proporción,
pero otros muchos van a ser usuarios
de esa información
que van a recibir gente más especial
de análisis y lo tienen que saber,
y eso sí que lo pueden aprender
perfectamente y se ha complicado,
y yo creo que es cuestión de
quitarle un poco de tiempo y atención.
Es que es lo que se puede hacer,
es lo que no se puede hacer.
Cuáles son las limitaciones de
los métodos existentes?
Porque, claro, fin se pueden
hacer muchas cosas,
pero todo tiene también
sus limitaciones,
como quiero ahora es mucho en eso,
pero simplemente es mostrar
interés, mostrar interés
y buscar la información y yo
les animo a que lo hagan.
Tienen muchas fuentes, no te
lo pueden hacer y yo creo
que eso que está perfectamente
preparados para hacerlo.
Pues muchísimo.
También siento que la conferencia
ha sido online,
porque yo soy una persona que
necesita mucho contacto físico.
Le ha gustado dar un paseo
por la ciudad
y una buena comida murciana,
pero que conste que esta invitación
se está grabando,
con lo cual ya no me puedo escapar.
A degustar la gastronomía
cuando tú quieras.
La relación
sobre cómo va disminuyendo el número
de participantes se va a descubrir,
cuando sí.