Idioma: Español
Fecha: Subida: 2021-02-25T00:00:00+01:00
Duración: 1h 23m 33s
Lugar: Espinardo - Facultad de Economía y Empresa - Salón de Actos
Lugar: Conferencia
Visitas: 4.446 visitas

El Big Data en la economía y la empresa..

Big Data

Descripción

Conferencia Big Data en la empresa y la economía.

Transcripción (generada automáticamente)

Deja de compartir al principio, si quieres momento como dejó ir arriba la opción negra que aparecían las preguntas participantes. Ha dejado de compartir. Si está muy bien, pues no están entrando ahora todos los asistentes, vamos a esperar, pero yo no puedo ver todo bien, si se nos están viendo los que van conectando. Nos van viendo, pero están entrando por muchos y llevamos 711 702. Lo vais a ir abajo, no en participantes Anel, cuando pasa el ratón. Así si eres Roland participantes que no se estrena hoy en día, todavía ellos con nosotros nos van conectando audio. Van algunos sí y otros no. Vamos a esperar a que estén un poco el número de participantes. Las ventajas e inconvenientes de los 90. Que tú puedes ver 800 personas, claro, también a lo mejor sí 40 no están haciendo otra cosa bien, un rato, los otros no habría sido posible. Si no presencia, sí claro. Bueno, pues para no demorar mucho el comienzo vamos a iniciar ya bienvenidos; bienvenidos a todos, a la conferencia de la Facultad de Economía y Empresa sobre titulada Beach de eta en la economía y la empresa. Hoy tenemos el placer de que tener entre nosotros a Daniel Peña Daniel Peña, bienvenido es, una es un plan, es un orgullo para nosotros tener que tener aquí una pena a no contar con tu presencia el año pasado, porque tuvimos que cancelar la conferencia que estaba prevista, y agradecemos mucho que haya aceptado pues aplazarla estar con nosotros pues este año Daniel Peña yo no lo voy a presentar, lo va a hacer el profesor Máximo Macho que me acompaña, pero sí que tengo que decir que es un referente para nosotros es catedrático de la Carlos tercero, ha sido rector de la Universidad Carlos tercero, desde 2007, 2015 referente por las contribuciones en el área de los métodos cuantitativos para economía, la empresa Premio Jaume primero de Economía y, por lo tanto, un orgullo que hoy esté entre nosotros. La conferencia que nos ocupa es de máxima actualidad y es un complemento o fundamental para nuestros estudiantes, puesto que eta como se llama pero que viene a ser la importancia de los datos en cualquier fuente o origen o naturaleza para generar información, para generar en definitiva generar valor, no generar una nueva fuente de valor, esos datos hay que hay que saber manejarnos. Estamos ante unos nuevos paradigmas de procesar datos de forma eficiente por su volumen y por también lo lo contemporáneo de los datos, no es decir el momento en el que están disponibles. Por lo tanto, espero que todos podáis aprovechar esta conferencia, y yo sin más voy a dejar la palabra al profesor Máximo Camacho, agradeciendo una vez más la disposición de Daniel ayudarnos ofrecer esta conferencia pues para todos los profesores y todos los estudiantes de la Facultad de Economía y Empresa. Muchas gracias. Muchas gracias por tu introducción. Yo quiero decir que sí sí para vosotros. Es un honor tener alguien empeño para para mí como miembro de un departamento del método cuantitativo, un poquito más éxito, más ya aprovechando la terminología, porque todos hemos disfrutado de la lectura de las contribuciones de Daniel Peña. Tengo que reconocer que conocí entre comillas el nombre de alguien; peña, la primera vez, hace más de 25 años, cuando terminó dijo. Hay un libro que se llama Estadística que de un tal Daniel Peña y yo me lo compré y aquí lo tengo, y siguen mi estantería 25 años. Así que pues es un placer y a mí me han dicho que tenía que afrontar tres apuntes técnicos que se agravaron en el seminario, con lo cual si alguien tiene alguna pequeña duda, tenga problema que no puede ver en diferido. La segunda es que a todos los asistentes, a hacer una encuesta final, una encuesta de opinión y que si alguien tiene alguna pregunta utiliza el apartado que tenéis trabajo, ponen medio aproximadamente, que se llama preguntas y respuestas. Yo las órdenes y al final de la charla se sigue trasladando a eso. Respecto a para lo que no sabe quién es Daniel Peña, pues es uno de los referentes en estadística, aplicada, la Economía y Empresa, no solo a nivel español sino a nivel mundial. Para que os hagáis una idea, pues Daniel Peña ha sido Premio Nacional recientemente, Premio Nacional de Estadística, miembro de la Real Academia de Ciencias de España, pero ahora mismo tercero, ha sido director del Instituto Carlos tercero con Santander, que se llama financiar de Lleida, ha sido rector de la Universidad Carlos tercero, Premio Rey Jaime primero de Economía; ha sido celo de América. Se distinguió en matemáticas estadística un fin, o se ocurriría si tratas de contar el currículum. De hecho, he bromeado con el decano para contar el currículum de Daniel Peña. Tendría que haber empezado la semana pasada, ha publicado en la revista más prestigiosa de de métodos cuantitativos con economía norteamericana. Biométrica y intentado ver cuántos artículos había publicado y la verdad es que me he parado en el número 150, estén incluidos. Jr quiere más, pero ya no. El 150 digo que me bien el tiempo encima. Bueno, pues se mantiene la acción, porque estamos para escuchar, cantina, para escucharme a mí Daniel Peña. Tienes el uso de la palabra cuando quieras. Pero muchísimas gracias. Voy a empezar a compartir pantalla y compartir. Esto es el título de la charla y quiero. Eso y quiero empezar agradeciendo desde luego máximo su introducción máximo es un buen amigo, como estoy seguro que sabéis especial por el cariño con el que me ha sentado y quiero agradecer a máximo que estoy aquí el que se la iniciativa partió de y para mí es un placer por lo tanto estar hoy aquí y luego quiero agradecer desde luego Cano y también sus amables palabras a Isa Martínez, que ha organizado la conferencia y por supuesto también al director del departamento por toda la organización charla y a todos hoy a llamarnos tú porque lo hace normalmente. Algo así me resulta más fácil, espero que nadie se siente ofendido, pero a todos vosotros oyentes. El índice de la charla tiene la estructura que veáis en la pantalla. En primer lugar voy a hablar bien conocido, pero un rasgo de lo que llamamos eta o los nuevos datos masivos. Hablaré un poco de aplicaciones empresariales y económicas, algunos ejemplos luego trata de forma sucinta y no técnica contar un poco cuál es la metodología y la herramienta para su análisis, que se ha ido creando, que se está creando hecho. Actualmente estamos aprendiendo cada día y este es un campo en continua evolución, y luego brevemente se ilustra. Haré todo lo anterior con un ejemplo financiero, analizando la red de clientes del Banco Santander en España y luego habrá bueno que llamamos, que es lo que de nuevo, con los datos masivos, pues por primera vez en la historia de la humanidad, porque los datos más escasos hecho muchos siglos existido con la forma en que nosotros llamamos datos, hasta después del Renacimiento, no hubo nada parecido a eso, pero los datos, cuando yo estudiaba pues era una cosa escasa, difícil encontrar ejemplos reales y aparte, que normalmente costaba mucho obtener y transmitir, pero ahora cualquier actividad que hacemos y esto es algo relativamente reciente, tiene unos poquitos años prácticamente empezado, lo cual casi cualquier cosa que hacemos los seres humanos, también animales máquinas, fenómenos sísmicos o de cualquier tipo, pues tendemos cada vez más a controlarla. Con sensores, teléfonos, móviles de través de las tecnologías, de la información, y que a través de la red social toda esta actividad genera datos automáticos, que se generan además con bajo coste. Un coste marginal que tiene que hacerlo y no solamente somos capaces de recogerlos, sino que los avances en las tecnologías de la información ni las comunicaciones, pues, nos permiten procesarlos y enviarlos a través de Google. De manera muy rápida, analizarlos y almacenarlos. De una manera que era inimaginable hasta hace muy poco tiempo, y con todos estos datos, esta cantidad de datos y gente. Pues, está cambiando todo. Porque estamos aprendiendo de. Está cambiando. La forma en que trabajamos, está cambiando, la forma, en que nos divertimos, nuestro ocio, como cuidamos nuestra salud, nuestra sociedad y también la forma en la cual es la democracia. En particular y está estos datos están creando datos, están creando información muy valiosa para las empresas y que generalmente tienen un lugar común que los datos son el petróleo del siglo xxi. El fundamento de esta afirmación es cómo ha cambiado el mundo empresarial que tenéis en la transparencia? Probablemente nos sabe muy bien. Tenéis el ranking de las mayores empresas del año 1995, pero bueno, no lo vi muy bien, lo digo yo. Lo que hay allí es coches y petróleo básicamente, pues está forestal, y en el motor, si no hay grandes empresas como las grandes empresas, es decir, que podíamos decir que el siglo xxi, a finales del siglo XX, pues las grandes empresas donde estaba el valor era sobre todo del petróleo, y los automóviles será donde teníamos las grandes empresas tanto en valor como el número de trabajadores, no donde estaba acumulado, que es lo que ha ocurrido recientemente, que es lo que pasa ahora. Pues parece que el año pasado de la cotización de las empresas más grandes del mundo hay una empresa que realmente es un país que sabía que siendo petróleo, pero el momento en que quitamos este caso excepcional, que es lo que hay detrás empresas que se dedican a los datos de Apple, Microsoft, alfabeto bajón físico, y lo hago en el resto, ya tenéis empresas y también una parte importante de la información, y hay otras que algún banco, pero vemos que las grandes empresas, las grandes empresas que han aparecido, están todas relacionadas, y es paradójico, no está entre las grandes empresas, pero por ejemplo, es paradójico que además estas grandes empresas de automóviles han sido superadas en su propio sector por una empresa Uber que no tiene un coche, no tiene un solo coche, es decir, que el valor de General Motors Ford o Toyota, etc, y consistía en las fábricas que tenía material, y en los coches que producía el valor de Uber. Es más grande ya que todas ellas vale más en Bolsa que General Motors Ford tenéis las estimaciones iniciales a la izquierda y a la derecha el primer día. En el año 2019, cuando empezó a cotizar en Bolsa ni su valor más grande que General Motors y Ford, esto naturalmente ha seguido creciendo, pero que es lo que tiene Uber, Uber, lo que tienes tecnología, información sobre todo información y procesado automático de datos; muchos datos y proceso automático de los mismos para poder conectar de manera eficiente a los conductores, que son los coches y los que trabajan, y los usuarios, que son los que necesitan, y si miramos a una de las empresas y saque para muchos aspectos y de, y la recogida de información que cubren la historia de Google, les apasionante, y os animo a que lo diréis como un estudiante graduado con curiosidad, empieza a indagar en el mundo y empieza para eso; crea finalmente un buscador etc. Se ha convertido en una de las empresas más grandes del mundo y más pionera y Google tiene en este momento más de 1.000 millones de usuarios. La población del mundo es aproximadamente siete yo como sabéis, o si se calcula que casi la mitad quizá sean usuarios de Internet, aunque es difícil, pero de ese mitad, 3.500 tienen una. Una parte muy importante no son usuarios y sus datos incluyen gigas de información de muchos usuarios. Si tenéis curiosidad, podéis entrar en Google y dar la información que tiene vosotros total suele tener información de los usuarios. Es difícil de hacer simplemente si lo diréis preguntarse cómo hacerlo, ira y relativamente fácil la información y una vez entre y me quedé impresionado, me hizo. Recuerdan muchas cosas de mí mismo que yo no sabía que estaba allí a lo largo de más información y además y estamos creando y Google está aprovechando una parte importante de dicho cada vez más información con todas nuestras actividades, en gran parte a través de las redes sociales a través de internet y muchas veces usando el saber si una idea pues la unidad, una unidad que empezamos a utilizar ahora está hecha, vale, un 1.000.000 de la valla, de la valla nos es familiar porque ahora ya tenemos discos duros que tienen ellos, que podéis llevar hace poco uno pequeño y allí puedo llevarlo toda la historia, todo lo que he hecho en la vida sino prácticamente podéis llevar toda la biblioteca de la Universidad y como un poquito más grande podíamos llevarlo a la biblioteca, la Biblioteca del Congreso de Estados Unidos dentro de poco podremos llevar sito toda la biblioteca, todos los libros que Estados Unidos y dentro de no mucho más. Bien, pues todas las películas que han hecho historia. De hecho, un examen y esa información que se quiere en el mundo, cada seis horas equivale para que os hagáis una idea. Lo que queríamos cada seis horas equivale a todas las palabras que se han pronunciado y luego la capacidad de todos los cerebros de la humanidad. Se calcula que son unos miles de chaval, curiosidad, sin poder ver cómo se ha calculado que puede ser discutible, pero dicho no creo que sea muy diferente de esa situación que podamos hacer, y estamos almacenando, ya información, y probablemente dentro de muy poco tiempo, la tendremos almacenado, una capacidad mayor que contienen todos los cerebros, y esto seguirá creciendo bueno, como son los nuevos datos la parte de los datos nos tenemos mucho mucho mucho mucho mucho más si una parte los tenemos como eran los datos hasta finales del siglo, cuando yo di una importante carrera, pues eran datos que eran datos homogéneos, cogidos mucho atención para cubrir un objetivo específico datos estructurados; en tablas donde aparecían variables y esas variables. Típicamente tienen un alto coste de recolección, pocos casos, el caso serán muchísimos y variables, 20 variables era normalmente, eran datos agregados y poco accesible y sabía si daba bastante la privacidad de los niños, mientras que ahora como todos sabéis, es una experiencia que todos compartimos. Son heterogéneos y se recogen automáticamente son estructurados, poco más de esto, prácticamente sin coste incluyen muchas variables y observaciones, la mayoría los partir de datos individuales y cada vez más. Esos datos son abiertos y disponibles, por lo menos una parte importante. Cómo son estas estructura de estos nuevos datos digitales? Bueno, pues son datos mezclados, que contienen muchas cosas; contienen textos de la web tenista de izquierda; puede incluir sonidos de manera digital y, por supuesto, imágenes y las imágenes. Esto probablemente muchos de vosotros lo conoceréis, pero puedo decir por curiosidad si a una medida como es la información, que se recoge en una imagen, porque podíamos tratarla como la información digital porque podemos tratarlo y electrónicamente, y lo consideramos información, bueno, pues una cámara, una cámara móvil, cuando hace un paisaje, tenéis una foto de la Laguna Negra, en Soria, cuando hacemos foto. La luminosidad de cada uno de los puntos de los píxeles, de cada uno de los puntos que recogemos la imagen, se descompone, en tres colores. La intensidad de tres tipos de colon o del espectro de la luz en rojo, azul y verde, y entonces se combina eso? Todo se puede descomponer en esas tres con una proporción de rojo azul y verde y entonces el número o la intensidad de ese píxel; ese puntito, que son tres números. La cantidad de rojo azul y después se almacenan en matrices y matrices en las representaciones, recibe a una imagen que son números. Al final, no hay imágenes un conjunto de números, por lo tanto, lo podemos tratar digitalmente; exactamente igual que el sonido de una voz siempre presentados. En una persona que está hablando de una señal digital tenemos la intensidad a lo largo del tiempo; di. Los datos muchas veces también los recogemos automáticamente con sensores, como he comentado, y forman también conjuntos de funciones. Hablamos de datos funcionales, porque los vamos recogiendo, representan con una variable algo de tiempo como una función recogido en momentos muy juntos en el tiempo. Nos vamos, sería como una serie temporal continúa. Si queréis no, por ejemplo, aquí tenéis unos datos que representase, pusieron unos unos sensores en unas moscas y ahí tenéis la vida de esas moscas. Durante 40 días el tiempo que han dedicado a comer a volar, a eta, cada curva y cada color representa una de las moscas. Hay 62 me parecen y se han observado durante 40 días y como veis, allí tenemos toda la vida; de hecho, esto mismo se hace también, por supuesto con animales para protegerlos, para seguir su evolución, y tenemos toda la historia y algo parecido estamos generando todos los las personas que tenemos un teléfono móvil somos una proporción importante de la humanidad, conectada a internet y que tiene sistemas de geolocalización, y vamos dejando nuestro rastro. Vamos haciendo nuestro movimiento. Bueno, los datos además cada vez más, son espacios temporales o sea, no son datos estáticos, y no son datos dinámicos en el espacio y tiempo dinámico. Entonces, por ejemplo, aquí tienes y un estudio que se hizo sobre sobre las oficinas de Correos de Madrid, la parte izquierda, cada punto de que habéis hecho una oficina de correos; si miramos una oficina de correos, tenéis representado y de dónde salen los vídeos a distintas partes del barrio, esto es en un punto cualquiera, la oficina, que es la que despeja esos rayos amarillos que se convierten cuando llegan a su destino, y eso genera montón de series temporales, series temporales, espacio en tiempo que podemos analizar para diseñar mejor resumen, son datos masivos heterogéneos en distintas frecuencias. Acción aria diaria semanal, pero típicamente los más interesantes, cada vez con una frecuencia alta pueden representar mediciones pero podéis estar gráficos imágenes estos audios vídeos redes información las redes sociales como hablaremos en algún momento después de distinta definición, con varias, con información estructurada, distinta precisión, muchas veces. Los cogemos los datos con mucha precisión y otras veces los cogemos conciertos, etc. Tiene una idea distinta y que suenan muchas veces, se caracterizan contra subes ya velocidad y variedad son datos muchos datos rápidamente velocidad y entonces, en particular, estos datos están cambiando ya la enseñanza, por ejemplo, como esta clase. Esta charla es un ejemplo de ello, también el cuidado de la salud y las decisiones que tomamos con problemas económicos y empresariales, muy brevemente, los dos primeros y luego están cambiando la educación. Esto empezó a producirse ya desde hace varios años; si vemos a la izquierda, ha representado una clase de 1.308 tenéis después una foto de una clase del año, 2019 no son muy distintas. Aparentemente hay un profesor que habla la pizarra, normalmente ya no hay una tarima alta si no lo hacía al mismo nivel que los estudian. Espero profesor que habla y estudiantes que escuchan, y Tomás. Lo que cambiamos rotundamente es el entorno a la izquierda. En el siglo MMMMCC. la única fuente de información los que estaban allí escuchaban y tomaba notas. Probablemente no tenían libros, echaba si tenían es una forma de apuntar podría ser en papel, como lo es actualmente, pero escribía lo que el profesor ahora alrededor del proceso antes tienen muchísimas otras formas de aprender, sinceramente en conjunto y globalmente muchos más importantes que lo que podía hacer el profesor. Información grabada como la que fue pionera en esto y que desconoce, viendo vídeos e información de todo tipo, y luego un sistema de conexión también a través de la web, información, etc. Buscador y acceso directo e inmediato a fuentes de información, es decir, ha cambiado totalmente y esto hace que la función de la clase tenga que replantearse. Parece que no, que por un lado en este entorno tan distinto sigamos con las clases. Si cambiarlas, parece que no es razonable, que esto probablemente se puede mejorar y, de hecho desde hace varios años se acabe Madrid de forma experimental, usos incluso los cursos cero que teníamos en Física de Matemáticas a los estudiantes de ingeniería se lo hicimos a través del agua y empezamos a recoger información. De qué es lo que hacían los estudiantes y a la izquierda? Tenéis una clase clase de física y tenéis allí distintos estudiantes daba color, supongo que lo veáis. Cada color es un estudiante y allí veis cómo va progresando cada estudiante a lo largo del tiempo y los días que trabajan y entonces aquí tenéis las las actividades que ha ido complicando. Como veis cómo aprende cada estudiante es muy distinto al curvas. Allí muy distintos. Unos lineales nos hace mucho, al principio tienen una experiencia, se deprimen algunos, lo puedan resolver y al cabo de ciertos días, etc. Bueno, pues cuando empezamos con esto, nos dimos cuenta de que lo más importante era que estaba proporcionando una información gigantesca sobre el aprendizaje de los alumnos. Es decir. La información que podemos obtener aquí de exactamente qué dificultades se encuentran y cómo la resuelve, naturalmente, luego a partir de aquí el camino digital, la huella digital que van dejando los estudiantes nosotros sabemos que ante una pregunta que responde mal, qué es lo que hace el estudiante paga y se supone que o empieza a buscar en Google en la web o busca un libro por internet, etc, es decir, que despierta además genera una cantidad ingente de información sobre cómo aprender. Bueno, con toda esa información. En un momento en que empezamos a poner sistemas online, pues está claro que podemos hacer una clase mejor, combinando aprendizaje online, sin discusión en clase, en discusión con el profesor en clase, con sus compañeros y que se va a ser el futuro de la enseñanza, y yo creo que, además, la pandemia que nos ha obligado a aprender a todas las universidades, mucho más cómoda, parte de las clases online, algunas universidades ya estaba haciendo, pero otras no, y yo creo que esto va a generar una enorme experiencia como la mejor para lo que muy probablemente dentro de unos pocos años, como damos clase en una parte importante del mundo y todas las partes, obviamente las sociedades, evolucionando la velocidad. Pero va a cambiar mucho y para empezar a ser reconocible lo que hacemos, esto va a cambiar las universidades totalmente porque no tiene mucho sentido. Quizá con un sistema de aprendizaje más flexible que poner las asignaturas en cursos y que haya que estudiar estas cinco luego estas cinco podemos crear un sistema mucho más flexible y distinto de aprendizaje y, por supuesto, también cambiará las estructuras y luego, claro, de la situación de pandemia que nos encontramos, pues hay que hacer alguna referencia a la salud y de hacerlo brevemente también. Los datos digitales están cambiando cómo vamos a encontrar nuestra salud? Dicho un teléfono pequeñito, con unos pocos sensores, tenéis arriba una banda para la actividad cerebral lado, y esto queda mucha información sobre su actividad, pero podemos controlar una parte ya con pequeños sensores adicionales que pueden añadirse, pues podemos controlar bastantes aspectos de nuestra salud, por ejemplo, el pulso, la televisión, la sangre, la respiración pulmonar y otras muchas variables; y, por supuesto, y los datos que se han ido generando para la pandemia ha sido muy importantes y para el desarrollo de vacunas y para el aprendizaje tenéis, por ejemplo, el efecto que ha tenido sobre las huesos. He cogido algún artículo que aparecía allí porque es una fase que quizá no es tan conocida, pero digamos todos los datos que podemos recoger nos han ayudado y eficazmente. La pandemia de hecho, hubiera sido inimaginable sin la las estupendas para compartir información con datos que se han ido estableciendo en los últimos años entre hospitales, de manera que la información compartían otros muchos a través de la red, y eso ha hecho mucho más rápido la adquisición de conocimiento y los avances en nuestro época. La pandemia. Si hubiera esto hace un siglo hubiera sido imposible tener una vacuna, al tiempo que nosotros hemos sido capaces de generarla precisamente ahora por los datos disponibles, pero sobre todo donde no voy a centrar en esta charla es en los cambios que ha habido en las aplicaciones empresariales y económicas decir. Poner algunos ejemplos en los que tengáis experiencia directa. Yo he puesto un poquito antes de la charla abierto el teléfono y al país, sino que he visto a partir de estas informaciones que son. Me ha salido inmediatamente un anuncio que habla de la quincena. Bueno, porque me sale. Si ves la fecha, que coincide precisamente con estos días, del 25 al alza y firme y quitado la empresa que hace esa promoción, pero que por qué hacen esto? Bueno, yo hace unos pocos días, no muchos, pero con el teléfono y mire, tengo problema con el aire acondicionado y cada casas para buscar que podía venir a verla Ermelo, y la conclusión es que continuamente ahora o ya como ve, y si a partir de otras muchas cosas que recibo, pues en la parte que todos los teléfonos que automáticamente deja para anuncios, me dan anuncios de por qué. Pues el asunto es que el teléfono recoge la información de lo que hacemos, coge en la vía a posibles interesados en anuncios, que la envíe con nuestro nombre y apellidos, por supuesto, sin información general, pero entonces vende trozos de publicidad, y entonces hay una subasta automática de ese espacio donde se calcula la probabilidad de que crear y se toma una decisión. Es decir, los anunciantes deciden cuánto dinero están dispuestos a pagar en función de la probabilidad de que su anuncio y todo eso en segundos un sistema automático decide si hace una subasta que está dispuesto a pagar cada uno el que pagaba se llevarán aparece en un segundo antes de que yo me doy cuenta de todo. Esto es análisis muy relacionado con esto. También es una experiencia que vosotros tendréis probablemente y que, además, probablemente, la época de pandemia que ha aumentado mucho de todos los sistemas de escucha y seguimiento de películas, series, etc. Pues exactamente igual. Cuando entramos en una página web nuestra actividad se guarda y se nos identifica con él, y si lo hemos dado, sino con la y nuestra actividad, los grupos de usuarios crean recomendaciones de productos, como es todo importante, pues abajo estima que un líder en los sistemas de recomendación, que el 30 por 100 de sus ventas se generan por el sistema, y lo mismo Spotify. También ha publicado datos sobre el éxito, por ejemplo de nuevo, y yo he entrado en Amazon a pocos días y he puesto un libro allí y automáticamente me ha parecido nuestra recomendación, un libro excelente, los elementos del libro de aprendizaje estadístico de eta o de esta materia, y automáticamente montón de libros recomendados de Machín inéditas netflix, también fue pionera en esto, y entonces, de hecho, se gastó un montón de dinero, 1.000.000 de dólares al año 2006 a 2009 en ver quién era capaz de establecer un buen sistema de recomendación, de películas tenía unos datos como los que no tenemos, un usuario anónimo, a que había visto estas películas y había dado puntuaciones, algunas entonces tenía los datos y aleatoriamente algunas vascos y desconocidos donde aparecen interrogación y el objetivo era estimar con el mínimo posible y las recomendaciones que hubieran dado los usuarios, pues el mejor sistema premiado, el año 2007 era una combinación de 100 métodos distintos, una idea se combinaba muchos métodos de prevención y fue el que tuvo el premio. Pero después de publicarse este método, los investigadores se dieron cuenta de que con la información pública existía en el, de Amazon o de Internet, pues era fácil identificar a los usuarios. De hecho, es sorprendente lo fácil que se puede identificar, por supuesto, este ejemplo, porque a otro nivel yo tuve la experiencia de los datos de geolocalización de la Ciudad de México, donde tenías lo que hacen las personas, y me di cuenta fácilmente, puedes identificar la cosa es que no debería ser capaz de hacer, por supuesto, donde una persona no, porque una persona, pues la mayor parte del tiempo podéis ver con quién era situarme, solo o acompañado y a que las elevadas etc, cuando va a trabajar. Pero también puedes identificar fácilmente si esa persona tiene una enfermedad porque va con frecuencia al hospital, por ejemplo, te puedes identificar incluso la planta, etc. Con lo cual, si está sometida a tratamiento, etc. Y otras muchas cosas que no voy a tener tiempo de describir los que fácilmente imaginar, es decir la información que estamos generando extraordinariamente vulnerables y el ejemplo de Flix, pues parecía de información bastante anónima, que esto ya al principio. Era mucho más preocupante. Bueno, la información grande, esta información que generan, pues nos permite y establecer estrategias para usarlos en marketing y pero abandonó entender poner un ejemplo de trabajo en el que participe con una cadena de supermercados que quería diseñar un sistema de control para detectar cambios, naturalmente era para gente que pagaba con tarjeta y estaba perfectamente identificable en consecuencia de una tarjeta de la. Además veremos si pagas con caso es distinto. Esto está para clientes fieles que tienen tarjeta y entonces el problema es de diseñar un sistema de control para detectar, cuando ese cliente parece que podía abandonar la idea y entonces hacer una oferta y tratar de ver qué es lo que está ocurriendo y tomar acciones para continuar con el cliente. No teníamos datos de 7.000.000 de clientes agrupados en compras mensuales durante siete meses, y lo llevamos. Es la frecuencia de compra, y los importes que teníamos del orden de 7.000.000 de series de este tipo. Lo quisiera gastado semanalmente los clientes; fieles quiere decir que todas las semanas frecuentes, no todas las semanas desaparece, se ha comprado ese período ocasionales, que compran. Desde entonces. Toda esta información se puede utilizar para crear sistemas de fidelización, y si estáis interesados y cómo hacerlo, pues luego diría, por supuesto, para la detección de fraude y la tarjeta, los sistemas perfeccionando los últimos años también para construir indicadores sociales a partir de textos en la web trataba de hacer y de utilizar para prever la bolsa, y ha habido algún artículo que cuesta una pequeña ventaja muy significativa, pero una alguna ventaja. Inquiere mental en la utilización de este sentido sentimental. Análisis para la cosa que sabéis es bastante difícil de hacer y pero en otros muchos casos para para conocer la sensibilidad social a determinar las más serias, esto se está aplicando intensamente. La idea es identificar palabras positivas y negativas y clasificar los textos como positivos y negativos en función de un vector de palabras, y con esto podemos mezclar las opiniones con indicadores y entender mejor la actividad o sentimiento social y su repercusión económica sobre precios, sobre el ipc y también, por ejemplo, podemos medir la economía en tiempo real recogido los datos. Esto es un trabajo reciente que tenéis ahí referencia que se ha hecho durante la pandemia, las estadísticas oficiales tienen bastante retraso y estos autores han tenido acceso a los datos de registros bancarios de CaixaBank, que tiene el 27 por 100 de las nóminas de España aproximadamente, y entonces han hecho un análisis para ver cómo y los gastos de las personas. Cómo han cambiado las personas, cómo ha cambiado aumentado, que aumentaba lógicamente, no como España, y el dato de Midi de la economía y prevista a partir de estos datos estimados. No voy a entrar en los datos, pero aquí tenéis simplemente porque me llamó la atención de lo aparatoso que es. Aquí tenéis los gastos. Y cómo han ido cambiando con relación a los gastos online y servicios que lo veis? Es la línea roja que llega a la pandemia de marzo del año pasado y empieza a crecer, y, como los gastos tienen las tiendas normales, digamos de las habituales, pues yo, naturalmente, por el confinamiento y luego hemos ido recuperando. Bueno, estos son algunos ejemplos, pero quisiera dar una pincelada simplemente de las herramientas. Cómo han cambiado las herramientas para analizar cómo se relaciona el análisis de estos datos, con el visto bueno? Pues estos datos se analizan, digamos, con dos bloques de técnicas que se están integrando lo que se empieza a llamar. La tasa por un lado están de inteligencia artificial, son algoritmos automáticos, e informáticos de predicción tomas de decisiones, que se desarrollan en algunos casos lógicas estadística, etc. Pero son automáticos, y, por otro lado estaba Estadística e Investigación Operativa estudio que buscan relaciones entre las variables, sobre todo bien concentrarme en la estadística. La economía e Investigación Operativa también es muy útil, no porque las imitaciones y siempre queremos optimizar algo cuando haces un modelo y eso es fundamental, pero y basándome en estadística. Y sobre todo pues nos enseñan cómo buscar relaciones entre variables y cómo generar más interpretables, es decir, que tiene dispuesto latas hallados un poco como la estadística a ultimar y esta serie mi6, y tan desde la ocupación en paralela artificial, inteligencia. Todo esto al que llamamos bueno y que este dato es lo que es importante. Esto es importante porque hay mucha confusión con esto. No se trata de hacer lo mismo que hacíamos antes con más datos al principio. Muchas estadísticas son muy buenas revistas Estadística. Y en otros hace pocos años 10 15 años y ahora pues todavía hay gente que lo defiende especialmente mayores y bueno. Más datos. Pues bueno. Si perdiera cuestión de cantidad podrá más o menos adaptar lo que tenemos, pero eso no es interesante de hacer lo mismo con más datos, porque eso lo hacíamos bastante bien y nos va a aportar mucho más. Lo que se trata es hacer cosas que antes no podíamos hacer y que los nuevos datos lo permite, es decir, aprovechar los buenos datos para estimar modelos más complejos con mayor capacidad predictiva y además con variables mucho más, por ejemplo, problemas que estamos sufriendo y que podéis encontrar información en la web. No pueden uso de Twitter. Cómo podemos usar Twitter para predecir el empleo, por ejemplo, el desempleo o cómo influyen las decisiones compras de las decisiones de compra de una persona lo que hacen las redes sociales o cómo podemos estimar una persona es ejemplo dicho estimación de la renta con los gastos? Es decir, son problemas nuevos que antes no nos habíamos planteado. Bueno, y para hacer esto necesitamos métodos automáticos, o supuesto sea el futuro. Todo tiene que ser porque estamos pensando vamos análisis con eta siempre y los análisis de un experimento concreto que requiere pocos datos y que tendré que hacer un especialista con detalle, pero yo me estoy refiriendo sobre todo al análisis cuando tenemos muchos. Entonces muchos datos. No podemos hacer nada manualmente, digamos, o conceptualmente poco a poco, y tenemos que tener un ordenador que nosotros queremos hacer, y hay tres principios básicos en Pasaia, que sería, primero, que dimos una regla predictiva eficaz, no un modelo óptimo causal, que a lo mejor no existe, y no sabemos muchas veces incluso con bueno. Esto es muy chocante, porque durante mucho tiempo los estadísticos y economistas hemos querido buscar el mejor modelo causal claro. Nuestra insistencia en esto, que era lo que sabíamos hacer y es una cosa muy importante hacer siempre que podamos hacerla, hizo que no viéramos problemas donde no había casuales analizar imágenes. Cuál es la causalidad que podemos encontrar entre los valores píxeles de tres matrices y la respuesta de una persona? Eso es muy complicado y de hecho no. Por eso los estadísticos no entramos y los que entraron fueron. Dije que por procedimientos muy simples, pero empezaron a tratar de ver cómo poder utilizar esa información, imágenes de vídeos de sonidos. Es decir, queremos buscar reglas más eficaz, no necesariamente un modelo que a lo mejor no tiene sentido, porque está cambiando en el tiempo, y no tiene mucho sentido. Segundo, queremos elegir la regla de prevención por su capacidad predictiva, fuera de los datos que tenemos otros nuevos que van a aparecer. Eso quiere decir que siempre que tenga que dejar una cuestión el modelo y otra parte y voy a juzgar si bien el modelo funciona bien cuando prevé bien fuera o no con los datos, es decir, eso quiere decir que la actividad de los parámetros de otras cosas, la importancia pues empiezan a tener mucho menos complicado y luego, en tercer lugar, no se trata de encontrar una regla, sino un método de prohibición que típicamente combina todas las reglas de perdición eficaces de prevención eficaces. Puede haber muchos, es decir, vamos a prever mezclando muchas reglas distintas, pues me voy a tratar de explicar un poquito estas tres reglas y son van en contra de la filosofía tradicional y admitiría que hemos utilizado si las entendemos y las damos vueltas bien y no están en contradicción con ellas, lógicamente, sino la forma en que hay que adaptarlo a nuevos datos y viendo bueno de predicción. En lugar de esto ya empezó a pasar estadística como por ejemplo, muchas series temporales. Típicamente los años siglo pasado siglo XX modelos de ecuaciones plurales, tratando de entender la relación entre las variables económicas, que era y por tanto podríamos entender su relación y utilizar modelos estructurales o vales vectorial armas etc esto sinceramente para muchos cuando tengo muchos datos y desalojados sutil y lo que se empezó a desarrollar, sería y se ha empezado a desarrollar y es inútil, con datos todavía son modelos, factores que su modelo, factores del modelo predictivo de la causalidad, nos olvidamos de guía y tratamos de entender lo que es. Un modelo dinámico supone que la serie vector de series que yo observo se debe a unos factores que no observó voy a ver si no puedo, las pueden encontrar entre los datos dentro de los datos, pero que hay unos pocos, y son ellos los que mueven. Todas las series y bueno, tenéis alguna referencia. Una, bastante antigua. Yo trabajé con esto hace ya bastantes años, es un genio de la estadística y el cual yo he aprendido mucho y he seguido trabajando hasta recientemente, como los artículos recientes sobre este tipo de este modelo quizá lo podéis entender mejor. Si hacemos un gráfico. Viéndolo gráficamente y aparte así vemos cómo estos modos general suponen los que yo tengo un conjunto de varias variable, uno la variable, que son las que quiero prever, pero eso puede ser, pues puedo perder ventas o puedo prohibir el consumo de electricidad, etc, en distintos puntos o dos países o en distintos puntos geográficos, pero estas son mis y naturalmente las variables, las tiempo, si no tengo valores del mal ocurre así sea bueno. Entonces, qué es lo que hace un modelo factorías sumado a la factoría? Lo que hace es hacer una combinación lineal de todas esas variables, factores es decir, aquí mis que aparece factor 1, factor r, r, factores y apareció en aquellos círculo hitos y que pasa en uno de estos circuitos más variables que se condenan con ciertos coeficientes y salió una variable de salida, es una combinación lineal de entrada. Es decir, que lo que hacemos es que veamos factores, opinando variables como si tuviéramos unas nuevas; es unos indicadores del conjunto de datos compilación lineal de esas variables. Es y ahí tenemos la información común de todas ellas y si quiero prever una variable variable, un tema lo puede hacer para cualquiera, pero lo he hecho para simplificar, que me interesa. La primera variable es la que me interesa entonces, la variable. La predicción lo vamos a hacer combinando esas nuevas variables que crean los indicadores, los factores que se generan automáticamente los datos, esos factores, con la información histórica pasada, avisa. Variable y para generar. Uno aparece un valor y su mundo y viene de la historia de la variedad de primera variable y luego otra parte de estos circuitos que aquí lo que hacen es ponderado. Bueno, esto se puede generar una generalización de esto es una red mal o, y si pongo muchas capas lo que ahora se llama y o aprendizaje profundo, que es lo que cambia, podemos generalizar esto, suponiendo que las relaciones entre las variables no tienen ese supuesto. Todo eso es cierto, con datos agregados, piezas de roca, cuando empiece a hacerlo con datos mucho más arraigados, es decir, donde timidez, conexión y casi una gran experiencia para indicar que cuando agregó datos tengo relaciones. Sin embargo, cuando mis datos individuales es decir, si el consumo de quiero ver el consumo de perdón el consumo de electricidad, el consumo de electricidad de una persona concreta, entonces ya no tengo llaves pudieran necesitarlo y luego, aparte, porque me tengo que quedar con unos factores, unos indicadores. Quizás los indicadores se pueden combinar. Los primeros tengo los puedo combinar entre sí para obtener otros, y así sucesivamente utilizando relaciones no lineales y entonces es lo que hace que lo que tenéis aquí las variables de entrada esto es igual que antes, pero ahora eran más variables, primero h, y esas variables entran en las redes donde generan unas variables y luego, al final lo que cambia es cómo, qué es lo que pasa en cada uno de esos circuitos que antes era una combinación lineal. En una red neuronal pasa una cosa más complicado, un poquito más complicado, mucho más, porque lo que hace es también hace una combinación línea, igual que en el modelo, factores, pero luego aplica como bis, hay una función no lineal, una función de activación no libia, de manera que hay una relación no línea, la salida y la entrada, y lo demás es bastante parecido. Pues aquí como veis aquí tres variables menos; se combinan linealmente, y esa salida se somete a una función muy frecuentemente, es la función logística, se transforma de manera no lineal, y eso me da el permitir funciones no lineales, pues da una flexibilidad enorme a estos métodos y aparte, al permitirlo en distintas etapas. Al final puedo conseguir casi funciones no lineales, se puede demostrar que con la red. Existen redes especializadas contado, es la básica, pero existen redes especializadas, las series temporales, por supuesto, pero es un ejemplo de un modelo empírico, un modelo empírico no para series temporales, sino para dar su visión y recogido un trabajo de máximo hecho en la Universidad de Máximo y sus colaboradores con Salvador, en donde ellos utilizan árboles de decisión para prever el precio de la vivienda, que es un árbol de decisión, pues es un árbol donde lo que vamos haciendo vamos en función de una variable, que en este caso de la altitud y la longitud de la localización de la vivienda por la longitud vamos dividiendo los datos en grupos y vamos dividiendo sucesivamente hasta que al final llegamos a grupos a grupos donde la predicción que damos es la media, el precio de la vivienda Madrid y tenemos simplemente con una regla tenemos un precio medio de 200.000 en el otro lado 600.800 1.000, que es lo que hacemos estos cortes. Así no se trata de explicar a la derecha empíricas. Vamos haciendo empírica. Mantiene de forma automática los datos, no es una relación causal de lo que puede influir en el precio de la vivienda, es obviamente el tamaño y cómo influye, y también el número quizá de cuartos de baño, la localización, y esto lo determinamos a partir de entonces. Cada en cada nudo lo que hacemos. Si se corte, que avisa y valores de la relación entre ella y para él se menor que un cierto valor, lo haremos por un lado y para ir mayor que un cierto valor lo hacemos así y con ese tipo de divisiones podemos aproximar cualquier función aproximado una función que sube, que baja y ha podido ir aproximando haciendo divisiones de ese tipo en función de los valores de la panorámica eso se hace con muchas variables, pero es otro tipo de función empírica y luego la actriz y el segundo principio el principio. Buscar reglas de prisión empíricas basados en segundo y utilice elegir las separando y los datos en una parte, la predicción y otra parte en la cual si dividimos estimación y validación en los parámetros parte de si el cierre de parte de los parámetros que mejor sirven. Aparentemente. Y comparó las reglas y las comparó. Con los datos en la parte de la división de los datos, se puede hacer si son datos independientes o Salazar, y si tengo series temporales, es más complicado, hay que mantener la obviamente los datos a lo largo del tiempo y se podía hacer ya de hacerlo que probablemente muchos conozcáis mediante vamos moviendo el origen a lo largo del tiempo, una parte y la siguiente esta vez sí y luego tercer principio es combina muchos modelos y tipos de datos. Es decir, si yo tengo datos. Y tengo puedo generar distintas reglas de prohibición y las combinó, o, teniendo en cuenta su precisión, generalmente, en su eficacia, en una única regla general. Hay muchas formas de hacerlo, tienes un procedimiento de ellos que lo que hacemos es combinar muchos modelos simples, pero convivido muchos. Voy a dar un poco porque voy un poco mal de tiempo y voy a saltar un poco esto, pero, vamos con muchos tipos de modelos globalmente, dependiendo del tipo de modelo o de una manera o de otra, pero, en general, el objetivo es construir muchos modelos, distintos y combinarlos. Vamos fuera claramente mejor utilizaría, pero no son caso y, aparte, con eso, los modelos prevén mejorar en una parte del espacio y otros espacio. Entonces, tengo mucha más flexibilidad. Ha dicho en un modelo al final muy no lineal, porque, como consecuencia de la combinación de modelos que típicamente además no lineal, y luego también combinamos distintos tipos de datos, porque puedo obtener datos anuales, a lo mejor trimestrales diarios, para prever una misma cosa, y todos tienen información sobre un fenómeno. Y cómo? Como prever cómo mezclar esos datos. Y para terminar, porque ya es puntual y veo que ya estamos llegando a la hora y un poco rápidamente simplemente general, se quería ilustrar sin ejemplo financiero que si el análisis de una red de clientes del Banco de España, que es una red de clientes bueno, sí tan personal como representar mediante un punto de vista cliente, que un banco y entonces sí se ponga esa persona si realiza una transacción financiera con otros y conecta con otra persona y tenemos una red las secciones financieras transferencias pagos etc que hacemos entregó y luego también hay podemos construir una red paralela a la de pagos de las relaciones. Por ejemplo, si aval un crédito o una persona es que tengo relación con él, no le doy dinero, no nos intercambiamos dinero, pero dio una manera manifestando que tengo una relación con él o si hago una transferencia a una persona de más, y le pido felicidades por tu cumpleaños, pues además de enviar dinero quiere decir que tengo una relación de amistad con él y tenemos, por lo tanto también una red de relación. Trabajamos con ambos tipos de transacciones financieras y ecuaciones para personas y también por supuesto personas jurídicas no empresas entonces qué qué y qué ventajas tiene analizar los datos en forma de red? Pues que podemos encontrar clientes centrales, identificar grupos de clientes y también podemos generar variables que sean útiles para otras cosas. Por ejemplo, para la morosidad, descubrimos cuando analizamos esta red de clientes aquella unos pocos años, que esta red nos daba mucha información para, para prever mejor la morosidad. Es decir, que una persona deje de pagar al banco, una deuda que tiene el préstamo. Tenemos 80.000.000 de sensaciones un poco por el pueblo, por ejemplo, para que nos sirven como smi, como miden los bancos como día, y ya están dejando de hacerlo como media. Los bancos. La importancia por su situación financiera tenía muchos activos en el banco era importante y si no los tenían bueno, eso es una posibilidad para informar mejor y también es importante tener en cuenta su actividad. No es lo mismo un cliente y sus conexiones no es lo mismo un cliente que prácticamente está aislado y que tiene unos activos que valga al 100 por 100 unidades monetarias, lo que sea que otro cliente, que tiene también 100.100 unidades monetarias, pero que además está relacionado con otros muchos clientes, con actividad muchísimo mayor dentro de lo que este cliente haga. Este segundo cliente podría afectar sus relaciones con otros clientes a lo que hagan otros clientes y, por lo tanto, es importante, más que pensar en los activos en pensar lo que perdemos, que puede ser no solamente dinero sino de otros clientes. Si una persona, es decir, tenemos que ver la importancia estratégica por su centralidad dentro de su centralidad, dentro por ejemplo tienes un clan familiar, estos son datos de verdad de clanes y entonces veis, por ejemplo cliente de color, representa un tipo de cliente y una característica, pero ahí tenéis un cliente rojo, alguien medio que está conectando un montón de cría. No es la persona clave para conectar su grupo a la red, aquí tenéis otro de otro cliente. El cliente más azul está conectado a unos poquitos y no conecta dos bloques enormes de 500 por tanto, este expediente es clave para que la cliente desaparece, pues el efecto puede ser. Cuando encontramos estos datos de que esta persona que sea una señora mayor y aquí tenemos parte de sus descendientes y las relaciones de sus postulados que tenemos por allí, dos familias enormes, con muchas relaciones y las empresas involucradas y esta persona que a lo mejor no tenga muchos recursos Nacional de Navidad que el banco las está tratando mal, no se puede tener un efecto enorme, esa persona no tenga bueno, y también descubrimos que las variables no pueden ser muy importantes para la morosidad y los para se utilizaban típicamente varias despectivas del cliente los usos de que dispone describiendo el cambio de hábitat, también, etc. Pero lo que no se utilizaba la aquí tenéis la variable más, los dos más importantes para la morosidad y beige sistemáticamente aquí y se está clasificado para por tipos de clientes, etc. Y la relación con el banco, pero apareció una constante, que es lo más importante. Si ha tenido la variable más importante y si ha tenido antes o no un premio, eso aumentaba muchísimo la probabilidad, pero el segundo punto era la proporción de personas a un paso dentro de la red que habían tenido. Es decir, que una persona estuviera conectada que digamos sus conexiones directas no hubiera ninguna, era casi una garantía de que está presionando mientras que la persona tenía conexiones a un paso con alguien que había tenido. Eso aumentaba muchísimo. De hecho, era la variable más importante para prever a parte de la premios de esta persona, es decir, que las variables realmente a dos pasos, a 3, etc. También tienen importancia menor, es decir, que las variables que podíamos obtener solamente a través de las importantes para prever muchas acciones. Entonces, en conclusión, la red de clientes ha proporcionado información nueva tanto para la importación de clientes, para las comunidades, para las comunidades existentes, los grupos de clientes y nos permitía, además simular efectos; por ejemplo, se obtiene a través de la red de clientes; el momento que tenemos, una red podemos ver. Supongamos que esta empresa entra en problemas y en un momento determinado este grupo de personas que cobran salarios de esta empresa va a ser a este grupo, y así sucesivamente podía haber siendo estas personas que tienen relaciones con estas, tienen alquilada la casa, esta persona para ver si aceptaban, etc. Y podíamos prever antes de que ocurriera el efecto de que una empresa entra en suspensión de pagos y toda la cadena que podría desencadenar y finalmente algunas variables de red como de morosos? Persona? Pues serán importantes para muchas actividades del banco, como prefiero. Es decir, que esta información, la información estructura y forma de red, permitía muchas cosas que sin esta información no sería posible. Por y para concluir, pues si simplemente lo que trata de ilustrar es que los datos masivos son una fuente fundamental para serlo cada vez más de conocimiento. El mundo actual en la sociedad y conocimiento que pueda aportar un valor añadido y por supuesto hay alguna pincelada en la charla vivía casi hay un riesgo enorme. Si no tenemos que tener cuidado, luego es cuidado y social y los rasgos y los la huella que vais dejando. Las actividades se encuentra a las urbanizaciones y países de éxito en el siglo xxi va a ser utilizar este vídeo de eta y las empresas sean capaces de hacer estrategias como las empresas que se han dado cuenta de estos. Se han convertido en las más importantes del mundo, y, tercero, y esto es importante para nuestro futuro la capacidad cuantitativa, para entender y analizar los masivos es una de las actitudes más demandadas. De hecho, es la que más de acuerdo, por la voz de mira algunas encuestas, Estados Unidos, Alemania e Inglaterra dicen la que más está creciendo, más rápida de mercado de trabajo, porque hay una caricia enorme para gente que sepa hacer esto, y, además, va a seguir creciendo en el futuro; o si aquí se animó; a que cuando ves que es trabajo, primero que trata de aprender de esto, el Estado, solamente lo que podéis hacer en la Facultad, sino también podéis ver cursos en la web; podéis recoger el montón de información, y, si los formando, yo, recogiendo el trabajo de mañana, pues que tengáis en cuenta que esta faceta ayudar mucho y nada más en la presentación está basada en parte, en un libro que acabo de terminar con Luisa y de la Universidad de Chicago, al igual que el mes que viene Estadística dependen de esta parte de la presentación, y los ejemplos, y que mirarlo con detalle están descritos en este artículo. Es al mismo artículo invitado es el que tenéis al haber hecho esta piscina de eta, y, sobre todo, vamos. Tiene una parte técnica que se interesaba menos, pero sobre todo tienen muy contados con detalle varios de los ejemplos que a los que he pasado muy rápidamente. Y luego también sale un libro de nuevos métodos de datos masivos, y yo soy uno de los editores donde está el artículo de Máximo y también otro sobre petición el cual me ha apoyado, y muchas veces, y eso también, muchísimas gracias a compartir pantalla. Gracias a la prueba de que no nos habríamos equivocado cuando elegimos a ti para que contarnos qué podemos hacer los economistas ante ante la ola de que tenemos encima es que nosotros tenemos un límite, capacidad de 1.000 usuarios y y se ha agotado y he recibido mensajes y correos de gente que no ha podido conectarse, porque hemos aceptado los espectadores, ha habido al menos -1.000 personas que estaban interesadas en la charla, que daba. Así que enhorabuena por el éxito. Para empezar, si alguien quiere realizar una pregunta, esta podéis hacerlo preguntas y respuestas que Daniel y bueno, he querido hacer. La primera, que estoy un poco obligado a hacerla no, que es claro. Nosotros estamos en la Facultad de Economía Empresa y yo entiendo que esto no es una moda pasajera, que ha venido para quedarse, y yo me atrevería a decir que está empezando y que estamos en las puertas de lo que se nos viene porque lo veo como una obra que nos lleva. No podemos hacer nada en contra también al análisis de nada, pues no se enfrenta a gente de la economía la salud urgente informáticos y nosotros que somos economistas no a tu juicio y con la larguísima experiencia que tú tienes Facultad de Economía y Empresa. Yo para mis alumnos tiene dos preguntas. Una es piensas que los planes de estudios actuales en la Facultad de Economía y Empresa están preparados para el análisis de lo que nos está dando el mercado y si no es así qué cosas podríamos también nosotros como docentes? No, porque al final tiene que enseñar cosas que luego le tengo un trabajo fuera, cuando sale. La segunda pregunta es y si yo estoy acabando los últimos cursos primero la verdad es que no te damos cuenta? No? Pero cuando ya estás acabando en cuartos y ves que el mercado laboral tiene esta guía a la vuelta de la esquina, esto que les recomendarías a alumno, que quiere formarse en este tipo de análisis de datos bueno yo muchas preguntas me pareció muy pertinente y desde el punto de vista profesional lo que estamos diseñando había que replantearse un poco todo si es que no tiene sentido. Me parece un. Hoy un curso de Estadística como dábamos 20 años o inscritos sobre esto, escribía de otra manera. Espero que los principios valgan, y sirva, pero, pero yo creo que es muy importante el segundo o el tercer día de clase a un alumno hablarle y no una variable, sino de que tienes muchas y cultivar, y yo creo que tenemos que eso, que normalmente lo contamos al final, porque antes era el Nadal, había que hacer mucho. Invertimos mucho en una variable que tenemos que hablar siempre de muchas variables, casi desde el principio y luego cómo se describe una muchas variables. Explicó columna y las demás igual, pero inmediatamente, hablar de la relación entre y luego tenemos que tener un enfoque bastante pragmático, y sorprende el principio. Segundo principio, que lo importante no es el ajuste, lo importante es tener un modelo, que los datos y pone contento y perder mucho tiempo con contrastes de significación etc, y luego ese modelo no sirve para nada, porque yo creo que la estadística durante mucho tiempo se desarrolló en el siglo pasado, sobre todo el siglo XX pero es una situación mucho más estática. Entonces, pensábamos que hacíamos modelos y quiso. Si nos iban a servir para cierto tiempo, y eso es verdad, para descubrir leyes físicas o algunas leyes económicas pocas, porque casi todas ya están cambiando con el tiempo, porque la sociedad es distinta y las personas somos distintos. Entonces casi todo está cambiado. Eso quiere decir que no tengo claro que me prevea y previa bien, fuera de la muestra, es decir, según un principio fundamental convencer a los estudiantes, menos dar vueltas, el modelo, etc, y luego un enfoque mucho más ecléctico. Dado que la realidad es muy complicada porque es bueno ver la relación entre y podréis la renta y y la renta que una persona recibe lo que se gasta en moción, por ejemplo, pues es relativa fácil, pero todas esas cosas ya saben lo que tenemos que descubrir ahora y no lo sabemos. Cuál es el comportamiento de determinados grupos ante determinados estímulos y además se llegó a obstruir la relación a base de datos individuales, y eso es muy complicado. No sabemos hacerlo con relaciones. Entonces, todo esto requiere un enfoque mucho más pragmático y claro, si aquello que la manera de transmitir la información a los estudiantes poco a poco tampoco dio al tirar los libros y empezará el día de mañana con otra cosa pero sí ponerlas en contacto con datos reales y aprovechar cada vez más en contacto con datos reales, económicos entre y al abuelo, montones de datos accesibles de casi cualquier cosa que los alumnos pueden bajar para analizar y yo creo que poner mucho énfasis en el análisis de datos, más que los de, etc. Eso yo creo que va a tener menos importancia en el futuro antes no tenía mucho pero bueno entonces para los estudiantes y les digo muchas formas de aprender a mí por ejemplo la cara acabe. Hace años que ha habido menos una temporada con mucha atención y le parecía una maravilla. Existimos toda de información en la web y muchos casos gratuitos, además, en los cuales podéis aprender más sobre datos masivos, y, y si hay montones de información, siempre tenéis que buscarla hace hecho muchos de vosotros, supongo que habléis inglés o singles, y si no, lo primero en un mundo globalizado como el que estamos y está la información sobre esto generalmente aparecen inglés, pero, por ejemplo, de forma pionera, con el uso de sus ases, etc, libremente, en la web hace ya varios años y mejores universidades del mundo está convirtiendo en universidades de todo, donde un estudiante de Guinea, pues puede conectarse y aprender, y eso está muy bien. Eso es la organización, la parte positiva. Pues aprovecharla, vosotros también estáis restringidos a seguir en una facultad con un profesor limitado, y esa no es la única fuente de conocimiento, eso puede ser muy útil, puede ayudar mucho, puedes burlar os permite conectar con otras personas. Compañeros con nuestros intereses, pero estoy en un mundo muy hambriento muchísima información buscarla buscarla buscarla y aprender y sobre todo tener en cuenta que este campo, este campo, puede abrir muchas puertas para el futuro. Sea mucho, aquí gratis, y aprender a utilizarlo, a formar grupos de trabajo, hablar con nuestros profesores para que os ayuden, y seguro que están en mucha mejor situación. Todavía no todas las pruebas, desafortunadamente, personas escuchando, escuchado muchísimas preguntas cogiendo que resultan un poco más significativas. Ahí. Hay una gente que me están preguntando qué bueno ha resaltado muchas de las ventajas, que obviamente tiene actuar, pero también hay algunos inconvenientes que querría saber esta persona desde tu punto de vista. Cuál es el mayor inconveniente? Vivir en un mundo tan globalizado y con tan poca intimidad. Bueno, pues yo creo que un problema que tiene muchísima información es que y situaciones que provocan o que contribuyen a la equidad social, porque poco lo compartimos entre todos, pues, y tienden a desdibujarse en el momento que hay mucha más información. Quiero decir que, por ejemplo, una comunidad. Pues antes a lo mejor se pagaban los gastos comunes como fuera no llegan. Ahora es el momento en que podemos medir lo que gasta. Cada uno incluso puede terminar midiendo las veces que utiliza el ascenso, pues podría haber una tendencia a que gente exija, y lo pongo. Pongan este ejemplo, que es trivial, pero yo os imagináis que afecta a casi cualquier cosa de actividad social, pero en el caso de la comunidad quizá parece más inofensivo que pueda exigir que él paga. Con relación a lo que entonces, muchas veces usar más los recursos públicos son los que tienen menos, porque para eso está la equidad, tienen muchísimo dinero y muchas posibilidades de moverse, y tal probablemente no he utilizado muchas cosas. Están disponibles, pero están disponibles para que la gente que tiene menos recursos entonces eso crea problemas claros y luego además inmediatamente disponer de esa información, disponer de toda la información que hay en la bolsa, por ejemplo, es peligrosísimo los datos de localización. Dicho y cualquier dato relacionado con salud. Eso puede hacer que los seguros de salud, bueno, y está empezando a pasar con los coches en España todavía poco, pero en algunos países y haz tu historial como conducción y lo que has hecho determina muchísimo lo que pagasen la prima, y eso podía decir. Bueno, eso puede estar. Si uno es responsable, que efectivamente tiene muchos accidentes, porque es mal conductor, está bien, tiene su parte positiva, pero también puede haber tenido mala suerte o simplemente tiene y, y una deficiencia física o un problema, o viven una situación de comunicación por la zona en la que vive etc es más fácil que te cae accidentes por ejemplo por nieve etc por lluvia por malas carreteras etc que le puede perjudicar Y eso normalmente no se te cuenta si se va a hacer de manera automática, es decir, que se pueden producir muchos casos de discriminación a gente que tiene una situación más difícil, típicamente claro, la gente que tiene recursos y buenas situaciones, la menos afectada y, por lo tanto, vamos a tener muchos problemas de injusticia social, es decir, que los contactos sociales que tenemos en la sociedad una sociedad mucho más ahora por término medio y repartimos un poco la Filosofía La Filosofía, conseguida a lo largo de muchos siglos de historia de la Humanidad entre todos, pues que una información tan exacta y tan detallada de lo que podemos hacer, pues crea todo tipo de incentivos para que sí y personas se beneficie y otra se penalice, y yo creo que esto es un problema grave al que yo ahora me gustaría hacer una última pregunta, como para terminar con un mensaje positivo y ahora contando con un mensaje positivo, estoy detectando entre las preguntas que hacen y supongo que la mayoría son alumnos, tienen un cierto temor no enfrentarse a hasta a esta moda, dictada quizá alguna de ellos. Así que no se cree suficientemente preparado porque si detectan preguntas se acaba tu charla con un mensaje positivo y un ánimo para que para que vean que cualquiera a mí me recuerda la ratatouille, ya que cualquier persona puede y no se tiene que malinterpretar, no cualquiera puede cuestionar cualquiera, tiene interés, puede aprender, y esto un mensaje positivo, y cualquiera que tenga un interés en aprender técnicas son perfectamente capaces en tu juicio, que es así. Si yo creo que los principios generales son los que ellos han apuntado, los principios y lo que tienen que aprender, cómo implementar lo que ellos han visto en la general. Hay muchos datos, no tipo de problemas, y eso se aprende, no tiene ninguna dificultad general. No quiero decir que simplemente tampoco tienen que convertirse en grandes especialistas. Los que terminan analizando, digamos, datos con un ordenador, etc. Será una proporción, pero otros muchos van a ser usuarios de esa información que van a recibir gente más especial de análisis y lo tienen que saber, y eso sí que lo pueden aprender perfectamente y se ha complicado, y yo creo que es cuestión de quitarle un poco de tiempo y atención. Es que es lo que se puede hacer, es lo que no se puede hacer. Cuáles son las limitaciones de los métodos existentes? Porque, claro, fin se pueden hacer muchas cosas, pero todo tiene también sus limitaciones, como quiero ahora es mucho en eso, pero simplemente es mostrar interés, mostrar interés y buscar la información y yo les animo a que lo hagan. Tienen muchas fuentes, no te lo pueden hacer y yo creo que eso que está perfectamente preparados para hacerlo. Pues muchísimo. También siento que la conferencia ha sido online, porque yo soy una persona que necesita mucho contacto físico. Le ha gustado dar un paseo por la ciudad y una buena comida murciana, pero que conste que esta invitación se está grabando, con lo cual ya no me puedo escapar. A degustar la gastronomía cuando tú quieras. La relación sobre cómo va disminuyendo el número de participantes se va a descubrir, cuando sí.

Propietarios

feetvdecanal@um.es

Publicadores

feetvdecanal@um.es

Comentarios

Nuevo comentario

Relaccionados