Idioma: Espa帽ol
Fecha: Subida: 2021-02-09T00:00:00+01:00
Duraci贸n: 17m
Lugar: Curso
Visitas: 1.690 visitas

02_Entrada de datos en el sistema

Transcripci贸n

Una vez no hubi茅semos visto una visi贸n general de alto nivel de lo que es arquitectura ciertas decisiones de diferentes elementos del de la misma. Es un poco de meternos ya un poco m谩s abajo en diferentes m贸dulos para, para ir viendo qu茅 es lo que es lo que incluye, que mis servicios tienen y definitiva como c贸mo se ha ido llevando. Se ha ido llevando a cabo cada uno de cada una de ellas, si bien es cierto que, como se hac铆a al principio de las sesiones posteriores, seguir谩 profundizando a煤n m谩s a mucha m谩s nivel tambi茅n de nivel programaci贸n, y me permitir谩 para para ir viendo cada uno de ellos, pero bueno, en el. La reuni贸n de hoy, la presi贸n de la idea es verlos conceptualmente, que es lo que es lo que es lo que tienen y c贸mo, c贸mo funciona. Entonces? Un poco meti茅ndonos en la parte de la entrada de datos, que ser铆a el primero de los bloques o, o por donde fluye la La 2, nos proponen toda la informaci贸n. Ver茅is que lo vamos a ir viendo todos estos m贸dulos a medida que va fluyendo la informaci贸n en el sistema para establecer un orden en el primero es la, como dec铆a, la entrada de la entrada de los datos, y digamos que esto esta gesti贸n abarca desde la opci贸n de datos de diferentes fuentes hasta la generaci贸n de los datos en formato, formato. Entonces, digamos que lo primero que tenemos que hacer es eso, leer los datos de diferentes or铆genes de informaci贸n. Gracias a estos or铆genes de informaci贸n evidentemente son distintos, cada uno de ellos tendr谩 diferentes caracter铆sticas, por lo tanto, son fuentes heterog茅neos. Tambi茅n fueron diferentes protocolos, por un lado, de diferentes formatos, diferentes protocolos que se van a obtener por tener cotizar para obtener esa informaci贸n, por ejemplo en servicios o a un v铆deo, una base de datos o, etc, etc. No se podr铆a dar soporte a cualquier protocolo entre los que puedan estar previstos para este proyecto, pues podr铆amos incluir. Etc. Habr铆a habr铆a varios, varios de ellos, entonces, un poco para para dar, para darle cabida, todo a todo esto. Pues viendo otra vez el esquema de la de la del modelo de importaci贸n pues pues tendr铆amos pues diferentes diferentes importadores de datos uno por cada una de las cuentas externas, como vimos hace un momento, son fuentes heterog茅neas, y lo hemos adem谩s. Pues vamos a tener una vez los importadores. Cojan esos datos, lo metan en el sistema, pues digamos que van a estar ya en un formato que reconocible por la aplicaci贸n, formato, ya m谩s estandarizado que va a poder ser trabajado por los diferentes servicios. El siguiente de ellos es el procesador de datos que es el que se va a encargar de transformar los datos centrada en datos, formato, formato, ayud谩ndose. Para ello en ventaja, en una tele vamos a inventar la nata. Entonces, digamos que va a ser necesario hacer esa esa, esa labor. De unificaci贸n de transformaci贸n para para poder llevar a sacar esa informaci贸n en el formato que espera la que definen la antolog铆a entonces, para para ello, tambi茅n vamos a necesitar de hacer una labor de an谩lisis, esos datos de integraci贸n, de agregaci贸n o incluso, muchas veces, por ejemplo, para componer un 煤nico, un 煤nico dato de los que espera la teolog铆a. Es posible que necesitamos utilizar varios datos de los que nos viene de la entrada, incluso varios de diferentes fuentes. Seguramente, a lo mejor para para poder componer lo por por completo. Entonces ah铆 tambi茅n un poco un poco por por eso tambi茅n. Por un lado, se evite ese procesador que meter los datos en una base de intermedio y luego hay una tve que trabaja contra contra esa base de datos intermedio en base a una serie de consultas que le van a permitir hacer esa esa, esa uni贸n de datos y otras formaciones, todo lo que vaya, todo lo que vaya necesitando. Por 煤ltimo, envi谩ndolo al gusto de servicio de Kafka para poderlo ya ser le铆do desde desde desde los siguientes m贸dulos. En cuanto a, en cuanto a los importadores, como, como dec铆amos, vamos a tener diferentes fuentes de forma de forma heterog茅nea. Entonces, la la, la idea para poder lidiar con todo eso es tener un micro servicio por cada una de las fuentes de datos. Es decir, va a existir un importador diferente por cada una de las de las fuentes de datos que vayamos a tener uno para y otro para su vez otro etc etc no entonces cada uno de estos importadores va a ser una especie de adaptador, por decirlo de alguna manera, de esas fuentes de datos tiro entonces ellos saben c贸mo c贸mo leer c贸mo trabajar c贸mo comunicarse en definitiva con esa fuente de datos o coger los datos, obtener esa informaci贸n y pasarlos a un formato entendible por el resto de servicios, y ese va a ser simplemente su su cometido, es decir, leer茅is a estar los datos en el sistema? Entonces, bueno, un poco un poco para, para lidiar con ello decir al final para ayudarnos en todo este proceso al que vamos a tener una ingesta masiva de informaci贸n y es posible que los siguientes servicios tengan un procesamiento m谩s m谩s elevado y y y que tard茅 m谩s tiempo en procesar cada uno de los de los eventos, pues para ello vamos a ayudarnos de un sistema como, como ya hemos visto anteriormente, que va a haber unas buses, unas colas generales o principales, pero por ello no quita que pueda haber otras otras de ayuda a otras intermedias que hagamos uso de ello. Si volvemos aqu铆 atr谩s, vemos c贸mo los importadores, adem谩s de leer los datos de ah铆 y transformado su formato, entendible para el resto de servicios, lo que van a hacer es importarlo, dentro de ese servilismo del m贸dulo de entrada, donde el procesador va consumirlos. Vale, pero lo va a consumir, a su ritmo, que es un poco el objetivo que queremos que queremos conseguir con este tipo de aproximaci贸n, que estamos, que estamos planteando. Entonces, gan贸 una vez, una vez transformados perd贸n, una vez le铆dos los los datos y metidos a la cola de entrar铆a en la funci贸n el procesador de datos que el procesador va a meter esa informaci贸n, como dec铆amos, en una base de datos intermedia, que, que va a ser sobre la cual van a trabajar bajo la atenta agresi贸n, que va a ser nuestro motor de transformaci贸n, de datos o nuestra nuestra. Para hacer esas traducciones entre los datos de los datos de entrada y los datos en formato definido por la oncolog铆a o lo que hicimos antes, que tambi茅n lo conoc铆amos como como los ojos. En este caso entonces, un poco lo que tenemos que hacer es. Eso. Nos hace diferentes fuentes de datos con distinta informaci贸n y vamos a tener que hacerse tras una acci贸n, aplicar una serie de c谩lculos script un mapping infiltrado pivotado, etc. Etc. Unas cuantas acciones que vamos a necesitar ah铆 mediante, mediante ese motor de el cual se va a encargar de hacer toda, toda la toda la transformaci贸n en base a una serie de reglas a paso a un hu茅rfano, que este, que estoy definido iba a ir justo debajo. Vemos una especie de The Guard Flo un poco de ejemplo, no tiene nada que ver con ninguno de los que ayudan a la aplicaci贸n, pero bueno, para que para que hagamos un poco lo que podr铆a estar haciendo, pues en este caso est谩 leyendo datos de dos de dos fuentes por un caso, pues hace un filtrado en otro caso, pues a帽ade los ciertos datos que falta o los va buscando, hacer una preparaci贸n, luego los los todos los unifica en unos objetos es bueno. Al final acaba escribiendo una, en una base de datos, el dato transformada al final, un poco la idea. La idea ser铆a un poco un poco esa de lo que queremos conseguir con la que es una una. Entonces bueno, la al final lo que vamos a tener por un lado, pues pues el proceso de post ser铆a un poco, un poco. Al final todo esto. Por un lado, tendr铆amos que extraer los datos de unas entidades principales, como tambi茅n en Santander y las propiedades, como las, como las relaciones entre entre ellos, despu茅s habr铆a que que hacer una especie de transformaci贸n mal eliminando los caracteres extra帽os. Entonces aquellos campos que los precisen. Si se ten铆an solamente los datos que fuesen necesarios y se a帽aden campos constantes y si procede, o realizando tambi茅n ordenaci贸n es sobre diferentes campos de identificaci贸n o uniones, alegaciones necesarias. Realmente es seria, ser铆a se har铆an todo aquellas cosas necesarias para analizar la transformaci贸n de esos datos para amoldar a las necesidades del sistema. Desde los datos, como tenga un origen hasta tenerlo lo que queramos tener hacia hacia el destino, hacia donde tengamos que ir, al formato que quedamos, disponer esa informaci贸n, pues es un poco todo lo que se har铆a en esta fase de transformaci贸n y ya, en 煤ltimo lugar, una vez detenido esos datos ya formados, en un formato adecuado, pues lo tendr铆amos que cargar al final en la cola, en la cola de Kafka, que nos va a permitir comunicar con 茅l, con el sistema de gesti贸n y el procesamiento de eventos. Acuerdo. Hay una. Hay un tema tambi茅n importante en este este proceso de transformaci贸n, de acuerdo que tambi茅n hay que hay que ver, no porque aqu铆 est谩 ahora mismo estamos hablando un poco de forma de forma general todo est茅 todo este proceso, pero en el proceso al que iba a incluir tanto los datos como las relaciones entre ellos como como hemos visto, pero aqu铆 hay un inconveniente que tenemos que tenemos que ver, no podemos mandar los datos y las relaciones a la vez. No nos podemos mandar por una forma sencilla raz贸n, porque si lo mandamos a la vez que un dato est谩 relacionado con otro recurso est谩 relacionado con otro. Es posible. Es muy posible de que ese otro recurso el recurso relacionado no exista todav铆a se puede que s铆 o puede, que no vale, pero si es que no tenemos un problema porque no vamos a poder grabar esa esa relaci贸n ser铆a. Tendr铆amos que seguir diferentes estrategias para poder liderarlo como crear recursos vac铆os y luego luego cuando nos llegue rellenarlo pero bueno tambi茅n tendr铆amos ah铆 cierto es cierto problem谩tica para poder identificar cuando nos lleg贸 un recurso, si ya existe un recurso vac铆o. Adem谩s de que requerir铆a comprobar en el sistema es meter much铆sima m谩s carga, sea comprobar cada vez que haya un recurso, si existe un dato vac铆o para para rellenarlo, etc, etc. Entonces, un poco para lidiar con con todo esto, lo que vamos a hacer es tener dos dividirlo en 2, no. Por un lado. Generar los datos sin relaciones, es decir solamente los recursos, los ojos con los con los capos de tipo literal, por decirlo de alguna manera. Eso va a ir a trav茅s de una cola de caza o quiz谩s lo vemos aqu铆 aqu铆 mejor. Por un lado ir铆a a trav茅s del despu茅s de la tele. Saldr铆an los datos, en formato poco quer铆an ser muy general y luego una vez estos datos ya est谩n generadas. Por otro lado, vamos a generar las relaciones que tienen entre entre los diferentes elementos para que se traten posteriormente. De esta manera vamos a asegurar que cuando tenemos una relaci贸n entre entre dos entidades, entre los recursos existan las dos entonces ya se va a poder crear una forma de una forma adecuada y adem谩s que no vamos a requerir de una gran sobrecarga en el sistema para estar todo el rato buscando si existe, si no existe para poder hacer la relaci贸n correctamente despu茅s en el sistema de almacenamiento. Entonces, un poco por ese motivo lo hemos, lo hemos dividido en dos en dos este proceso de transformaci贸n, por un lado, los los objetos planos y, por otro lado, van los los enlaces entre-entre ellos se van a procesar en ese orden. Bueno, eso toda esta parte en cuanto a la parte del m贸dulo. De entrada, si quer茅is aprovechar para preguntar alguna cosa, alguna duda que teng谩is antes de pasar al siguiente. M贸dulo. A m铆 me sugiere a profundizar m谩s en algunos apartados, pero en el proceso de cargo. Se encarga de configurar toda la parte de la ventaja. Adem谩s, eso recae en alg煤n usuario. Y si la parte de la tele forma parte del desarrollo del proyecto, no tanto, adem谩s del c贸digo fuente de la aplicaci贸n que requerir铆a todos los servicios, tambi茅n estamos desarrollando toda todo. Todo. Todo. Todo la configuraci贸n, como se compon铆a, simplemente habr铆a que cargar dicha dicha configuraci贸n, pero digamos que la confederaci贸n ya est谩 hecha, coloc贸 con lo cual recaer铆a en el equipo de desarrollo la parte de la tele. No s茅 si eso responde a la pregunta de otras maneras. En la sesi贸n de ma帽ana no es en la noche del jueves una del viernes ya se va a explicar un poco de por parte de la gente que desarrolla la tele c贸mo se montar铆a un entorno de desarrollo, en caso de que fuese necesario y y dem谩s. Pero ya os digo que en principio eso requer铆a de la parte de desarrollo el tener esa, esa configuraci贸n ya hecha, bale.

Propietarios

Proyecto Hércules

Comentarios

Nuevo comentario

Serie: Formaci贸n martes 2 de Febrero ASIO Izertis (+informaci贸n)

Descripci贸n

Videos