Idioma: Español
Fecha: Subida: 2022-09-27T00:00:00+02:00
Duración: 1h 06m 15s
Lugar: Videotutoriales
Visitas: 1.026 visitas

Hércules. Formación. DESARROLLADORES. Duplicación de ítems

Descripción


2:00 Gestión de duplicidades del CV
2:50 Flujo
14:30 Motor de desambiguación
21:40 Editor de CV. Autores de publicaciones
48:50 Carga de fuentes externas

Transcripción (generada automáticamente)

Ya está ve en la pantalla no. Primero, bueno, Buenos días, yo soy Álvaro Palacios, voy a dar esta formación junto a Manuel Boix, que está también conectado en esta formación, dirigida a desarrolladores. Veremos, cosas diferentes a la configuración de duplicación de cosas referentes en el sistema. No se no tengamos duplicados y evitar en la medida de lo posible que esto, que esto suceda, los apartados vamos a ver son los siguientes. Vamos a ver. La gestión de duplicidades del CMB, es decir, dentro del cómo se pueden gestionar estas duplicidades y el flujo dentro del de la edición, y luego hablaremos también del motor de la ambigua acción, que es un una librería que utilizamos en varios servicios para detectar estas posibles duplicidades o comparar 2 internos para comprobar si se trata del mismo y que en el sistema no acaben, no acaben. En el sistema y duplicados en particular veremos cómo afecta al editor, en el caso de las de los autores, de las publicaciones y en la carga de publicaciones de fuentes externas, con el cual se cargan las las publicaciones de los de los investigadores, junto con los con los autores acuerdo para dar paso a Manuel que se encarga de esta primera parte de la gestión de duplicidades, del CMB, Manuel. Cuando quieras. Todo. En la primera parte, la gestión de duplicidades es simplemente una herramienta para que los investigadores, desde el propio curriculum vitae puedan gestionar los posibles duplicados, ya que pueden surgir varios al importar datos de diversos lugares, como pueden ser la carga de fuentes externas, la carga inicial del sistema, la carga propia del usuario de currículum para actualizarlo, por ejemplo, o la carga de por parte de otros investigadores en los que nosotros estemos referenciados como autor y, por lo tanto, se nos carguen en el interior cuestión en nuestro currículum. También. En el servicio de edición de Google se puede configurar los elementos sobre los que se quiere comprobar la propia duplicidad. Para ello se añade un campo llamado Chen, duplique que le con un valor True que ese dictamen lo queremos comprobar al lanzar el proceso. La gestión puede darse en varios casos. Al entrar en la edición del CB, se lanza directamente la gestión de duplicados o también desde el propio editor de Google al seleccionar el botón de gestionar duplicados, se pueden. Obviamente, en este buscaron los duplicados más dudosos. Al finalizar la la, la búsqueda de todos, o al enviar al tema producción científica, también se lanza el proceso, pero en este caso sobre un papel específico. En la gestión de implicados lo que hacemos es una llamada al servicio de duplicados en el editor. Cb pasaremos el identificador del currículum, un porcentaje de singularidad y luego, pues, en el caso de la producción científica, se hizo el identificador del propio. Aquello directamente se ha lanzado. La gestión de duplicados al cargar el servicio de edición de este jueves lo que nos va a llegar va a ser el identificador del usuario que comprobaremos con Josep si es el mismo usuario el que está haciendo la petición y el del currículum, que es enviado. El porcentaje de que detectó va a ser el 9 luego que en este caso va a ser nulo, al no ser identificadas donde se llama. Al iniciar vamos a buscar los sistemas que estén marcados como duplicados, porque Podemos, dentro de la dirección, marcar, como quedó si se ha encontrado una duplicidad errónea. Entonces, lo primero que haremos será buscar estos sistemas, y guardarlos en un diccionario. En este caso vamos a tener 2 que se han marcado como los duplicados. Lo único que va a acordar aquí son los identificadores de estos sistemas para, posteriormente eliminarlo si se vuelven a encontrar. Aquí recorreremos cada que van a ser, en este caso, las 8 pestañas que tenemos en la edición y por cada 1 miraremos los sistemas que son marcados como búsqueda de similares y cuáles de ellos están. Son contados como similares. Aquí veremos todos los sistemas que están marcados como complicado, como posibles duplicados para buscarlos en esta sección y una 1. Iremos recorriendo el Them y el resto de pruebas para comprobar si el ítem inicial sobre el que se busca es similar al secundario. Dentro de este parámetro, de disimular, encontraremos. El método, que realmente es el que comprueba si 2 en este caso son iguales en caso de que un título sea muy largo y en otro sea muy pequeño y no llegue al umbral mínimo marcado. Vamos a devolver un 0 porque no pueden ser similares y en el caso de que alguno de ellos sean iguales. Aquí no ha habido ninguno. Salvo, si alguno de los 2 entran los guardaremos en este similar. Posteriormente utilizaremos para, para igualarlos y comprobar si alguno de los 2 es evitable para ordenarlos y mostrarlos al usuario. En este caso, primero, los validados evitables para en caso de que alguno de los temas sean validados y no validados, los validados estén por encima. Posteriormente. También eliminaremos, si los si están implicados o si alguno de los internos. Al final nos hemos marcado como duplicados en esta listado de aquí los eliminaremos para no tener otra vez necesidad de marcarnos como duplicados o diferentes. Por ejemplo, podemos ver que la similitud que encuentra está por encima, pero 9, por lo tanto, lo añadiremos tendremos en este caso. Un listado común. El valor False que se encuentra en el diccionario. Lo que nos va a marcar y si está validado, o si no, estaba liderazgo para ordenarlos. En este caso, lo que haremos es una lista de similares. Eliminaremos aquellos que, con la lista de elementos que se han marcado anteriormente, como los similares, eliminar aquel que está marcado como algo similar. Eso es lo que en este caso el tema, que es el que se va a comprobar. En esta lista ya tendremos y posteriormente todas las entradas que solo va a tener un solo y se van a eliminar si alguna entrada cual aparecen varias veces. También se elimina. Y devolveremos un listado de objetos y militar similar, que es básicamente los temas que se han detectado como similares. Luego indicándoles también la sección que forman parte y el RDC que son parte de ETA para poder mostrarlos en el listado. Esto lo haríamos con cada una de las secciones y, finalmente, obtendríamos un listado de iTunes. Va a ser el que vamos a devolver a la web para mostrarlos aquí por ejemplo. Es de otra sección que serían las conferencias, mientras que el principal va a ser. El primero va a ser de publicaciones. Esto es lo que este es el listado, que serían de 15 elementos que lo que le mostraremos al usuario veríamos que hay 2 etapas en este caso 1 que está bloqueado, y el otro, que es, por ejemplo, el de arriba, habrá sido asignado por fuentes externas, y el otro lo ha podido subir, lo ha podido adjuntar el usuario o algún o algún coautor, si es que estuviera en este caso. Como hay un algo aquí podríamos marcarlo como duplicado, si vemos que son diferentes, lo podríamos eliminar porque éste estamos completo. O podríamos fusionar para qué algunos de los datos que tenga el segundo ítem pasen a formar parte del, primero en caso de que se puedan ser esté bloqueado, posibilidades para ello le y siguiente van a aplicar siguiente dependiendo de si queremos realizar alguna acción. Podríamos eliminarlo y pasaremos al siguiente y en este caso también se puede dar la opción de cambiar la principal. Pero no me he nada, por un lado, por esta parte. Y yo continuaría si eso, Álvaro con el motor de esa averiguación. Ola ahora voy a continuar. Yo. Hasta ahora lo ha explicado Manuel tenía que ver con la herramienta que pueden usar los usuarios para gestionar las duplicidades de su CEO. Una vez que tenga que estén ya cargados los datos, por si por el motivo que fuese hubiese que estuviesen duplicados y ahora vamos a hablar del motor de. Es una herramienta, bueno, es una librería. Esta láctea vale, que se utilizan diferentes; implementaciones dentro de su función es la de comparar diferentes sistemas para detectar en base a sus características si se trata del mismo y es decir, si estamos cargar una publicación, una persona, tendremos que comprobar si en el sistema existe ya esa publicación o esa persona. Por ejemplo, para que no se carguen personas o publicaciones duplicadas, este motor es ambigua. Podemos ver aquí en el mes de se ocupa de reconocer y dependencia de un conjunto de datos a aquellos que sean iguales. Este proceso tiene ventajas, como tienen el tiempo y el espacio de almacenamiento, información más cuestionable y la generación de un sistema centralizado de información. Esto último se debe a que los intereses estén centralizados, en el sentido de que una persona exista sólo una vez del sistema o una publicación, exista una una sola vez en el sistema y, por lo tanto, no tengamos personas duplicadas o publicaciones duplicadas. Esta librería tiene 3, 3 métodos dentro de la clase de ambigüedad y luego veremos las aplicaciones prácticas que básicamente tienen como como parámetros de entradas por un lado. Bueno, sí dentro de esta librería hay una clase es ambiguo hable en ti, que sería una clase abstracta, la cual tendrían que heredar aquellos elementos que queramos que queramos compara a través de este motor de la ambigua acción y para cada para cada una de estas clases que creemos a la hora de comparar tenemos que establecer qué propiedades queremos que se comparen, y de qué tipo son, por ejemplo, cómo lo veremos. En la parte más práctica pero tendríamos este bueno aquí la gente tiene que utilizar las propiedades que se consideran representativas de la entidad, por ejemplo, en una persona pues habría que considerar, por ejemplo, el nombre o sus publicaciones. En una publicación podríamos considerar el título doy los autores o todo aquello que se nos ocurra y habría que configurar para cada una de estas propiedades. Pesos, positivos y negativos, que nos servirán para, para, para establecer aquellas, para dar pesos a las propiedades. Queremos que nos que sumen similares o que nos la resten para cada una de estas propiedades. Aparte de establecer un peso positivo y un peso negativo, hay que establecer un un tipo. Tenemos estos diferentes 5 diferentes tiempos vale, por ejemplo este cual es idéntico al que utilizaría para las propiedades de tipo identificador. Es todo lo que quiere decir, que es si tenemos una propiedad configurada como identificador, como por ejemplo el caso de una publicación, y tenemos 2 publicaciones a comparar que comparten. Se va a tratar directamente de la misma publicación, del mismo modo que si tenemos 2 publicaciones y ambas tienen doy y los 2 son diferentes no se podría tratar de la misma publicación. Luego tenemos la del tipo. Esta duda serviría para compararlos los títulos de los elementos en los que queremos buscarlas similares edades, y aquí lo que se va, lo que se va a hacer es comparar el campo, título de ambos elementos pasándolo toda minúscula. Si eliminando caracteres alfanuméricos para comprobar si tienen un mismo un mismo título en su momento valoramos que pudiese haber aparte de eliminamos, los cometimos todas menos pruebas en su momento para; no valoramos que pudiesen tener algún carácter diferente, pero lo descartamos porque se nos da el caso en múltiples comprobaciones que hemos hecho que para una publicación por ejemplo una persona puede tener una publicación, que sea análisis, no se quede la vitamina A y puede tener otra publicación, que sea alguien de la vitamina B o que trate temas muy similares con una pequeña diferencia en el título y lo que tenga los mismos autores obtengan el resto de datos igual. Por lo tanto, para considerar de partida que otras publicaciones sean la misma, dentro, la tienen que tener el mismo título, excluyendo todo el tema de mayúsculas, minúsculas, que caracteres alfanuméricos pediremos la propiedad e igual que ésta se utilizaría para comprar propiedades normales, entre comillas, por ejemplo. Si tuviésemos que un autor tiene estas determinadas 3 publicaciones y tenemos que otra autor que, bueno, nos por ejemplo, serviría para para la fecha, se dé un si tenemos la pensa y tenemos que decir la misma fecha. Se sabía este caso, luego tenemos el cual sería igual la anterior, pero para valorar múltiples tenemos una publicación que tiene 5 autores y no tenemos otra publicación, que tiene otros 5 autores. Se podría configurar una dentro del del objeto. Publicación que daría ambiguo hable, tendríamos una propiedad de la historia, los autores para poder compararlas entre ellos y, por último, tenemos la de tipo algoritmo de nombres que se utilizaría para comparar los nombres de las personas. Esto no quería por detrás. Se utiliza únicamente en el caso de las personas. Es compara, por ejemplo, si tenemos una persona que se llama Álvaro Palacios, y otra que se llama Álvaro Palacios Marie cual sí que tendría, o, por ejemplo, para Mari Marijuán, con a digamos que se se crea un un nombre, luego lo veremos en directo, se crea un un, un String con con estos nombres y se comprueba que tengan los mismos nombres, aunque puedan tener diferente orden, con pueda ser un nombre más completo, pero, por ejemplo, si en determinados casos si tenemos que 1 es Álvaro, para que Torres, Álvaro Ortiz, pues no se consideraría la misma persona y de, digamos que este, esta librería tiene estos 3 métodos, ahora, lo que vamos a verles en directo diferentes aplicaciones de este motor de volvemos a traer aquí, vale, por ejemplo este montón sea utilizado dentro del editor de UP a la hora de añadir los autores de las publicaciones. El objetivo de esta implementación es que cuando un usuario dé de alta dentro de su CEO una publicación a la publicación, tiene que meterle autores, y el objetivo de esta implementación es que cuando le pongan los autores de la publicación no se creen en el sistema autores, duplicados, y sí tiene un autor que es Álvaro Palacios. El sistema y un Álvaro Palacios que se le proponga al usuario que está cumplimentando la publicación, los posibles Álvaro Palacios que tuviesen el sistema, para que lo para que las eleccione, el flujo, es el siguiente. El usuario entre desde la de los autores separados por un diploma, impulsado sobre buscar si vamos a quien por ejemplo, si quisiéramos crear una nueva publicación. Pero bueno, vamos a quedar a la sección de autores. Vale, por defecto, no se incluye siempre el nombre del propietario del CMB, porque de hecho es tiene que ser 1 de los autores de la publicación, sigue entre los autores de la publicación no se encuentra el propietario del en el último paso a la hora de guardar la publicación. No nos dejaría, nos daría un mensaje de error y nos diría, le diría al usuario que tiene que incluirse a sí mismo como autor, porque una persona no puede tener dentro de su CMB una publicación de las que no sea de la que no sea autor. Puedes añadir, por ejemplo, los autores. Por último, aprender para quién estaríamos sobre buscar. Estaríamos en este punto y ahora ya dentro del Código Penal vamos a ver, a Madonna seguirían estos pasos. En primer lugar. Vale, a este servicio, perdona a éste, a este método vanidad asignaturas. Dentro del controlador de edición CB nos llegarían. Las mismas introducidas por el usuario. Pronto aprendí cómo interponer el identificador del CMB la persona propietaria del euro y el sistema de navegación, y dentro de éste, dentro de este método, vale? En primer lugar, más poblada, que él lo que venga, no sea un vacío. Obtenemos los datos de la persona de la cual estamos cargando su CB, es decir. Aquí obtendríamos aquellas personas que están cargadas en el sistema, que son colaboradoras de esta persona en base a que tengan que sean coautores dentro de las publicaciones. Entonces tendríamos esta lista de personas junto con el número de publicaciones en las cuales son coautores con el dueño de Google; lo mismo, con los proyectos; aquellas personas que pertenecen a proyectos en común, junto con el propietario del club, y el número de proyectos que tienen en común y por último temo, se tendrían aquellas personas que pertenezcan al mismo departamento de la persona propietaria del club, y para ello en todos estos casos lo que hacemos son usa la base de datos de de virtuoso. Para obtener estos datos continuamos. Lugar troceamos. Troceamos el nombre, los nombres introducidos separados por punto y dentro de este Signature en el cual tendríamos el los aquellos nombres separados por un coma procesamos 1 a 1 por ejemplo, aquí partirían la primera firma que tenemos aquí a José Tomás Méndez, vale lo que propone que posteriormente para cada 1 de los nombres introducidos vamos a buscar a todos aquellos candidatos que existan dentro del sistema a través de este método construiremos un objeto de tipo personal en el que encargaremos estas personas. Es decir. Dentro de este método, obtener personas, firmas le vamos a pasar esta firma. Vamos a pasar a minúsculas y a eliminar carácter acentos y demás si los hubiese y vamos a trocearlo en los diferentes nombres. Vale, vamos a realizar con esto, vamos a construir una, una para virtuoso, para la base de datos es que tengamos montada dentro del sistema, en la cual. Obtendremos en este caso 274 kilos que se corresponderían con 274 personas y para todas ellas. Obtendríamos el nombre de la persona en el sistema. En primer lugar, esta cuenta y lo que va a hacer es hacer una, un acuerdo con unión con los diferentes nombres que están dentro de la firma. En este caso, tenemos 4 palabras dentro de la, dentro de la firma. Teníamos estas 4 palabras. Se va a hacer un acuerdo con cada una de las palabras por separado y la respuesta nos va a devolver un las personas que se han encontrado en el sistema junto con un peso en función de las palabras que tengan entonces su nombre. Si, por ejemplo en el sistema hubiese una una palabra, sea una persona que se llamase José Tomás Ortiz. No sé qué vale que coincidirían 2 palabras, y por cada una de las palabras tendríamos un, en este caso tendríamos un escote de 10, en el caso de que se trate de una inicial y coincidiesen tendríamos un peso, por ejemplo, una vez ejecutada esta acuerdo. Vale, hemos obtenido 274 personas, vale, por ejemplo. Bueno, esta se llama directamente, como la persona que tenemos es José Tomás. En persona, digamos, de las que hemos obtenido una persona más diferente, por ejemplo, sería día que solamente tienen común nombre, José. Una vez obtenido estos datos. Vale, vamos a cargar, una vez manteniéndose estos datos que tenemos, los objetos personales con los datos de todas las personas que se hayan recuperado del sistema, y con estos datos vamos a realizar una petición al método del motor de desarrollo y coacción a este método simule, similar y bebe desde Skone, es con los siguientes parámetros en ese parámetro, lo que vamos a pasarle lo sabe que mejor. En este parámetro, este primer parámetro, le vamos a pasar, la, la, la persona que hemos construido, digamos, con la firma, que simplemente tiene la firma, en este caso, sería José Tomás y entidades, bebe de lo que le vamos a pasar, son todas esas entidades candidatas que hemos obtenido con la que hemos hecho antes, para la cual está próximo el propio José Tomás Méndez y otras personas que tienen nombres similares. Le vamos a pasar como parámetro. También. El umbral en este caso por 106,8 en este caso no hemos pasado como un ratero, porque queremos que nos proponga todas aquellas personas que se parezcan, aunque sea solo un poco, porque luego el usuario, tan, la decisión de elegir si se trata o no de esa persona persona y en esta intolerancia nombres le pasamos a tener este tolerancia, nombres por defecto valenciano es el que se utilizaría en otras. En otros casos, tolerancia, nombres no sirve para pacificar la la tolerancia de la diferencia de los nombres, es decir si fuese, pero si hubiese una persona que se llama Álvaro Palacios Irene, pasando como parámetro de entrada, Álvaro Ortiz directamente, no podría tratarse de la misma persona, porque en 1 no tiene palacios y otro tiene Ortiz, y no y no coinciden. Pero sí por ejemplo, según Álvaro Palacios y el otro fuese a punto Palacios Ortiz sí que se podrían considerar la misma persona porque contienen, digamos las mismas. No hay nada que nos diga que no puede ser, que en este caso se le pasa a 5 lo que hacemos es que permitimos que hasta el 50 por 100 de las palabras que forman el nombre puedan ser diferentes. Es decir, si si yo le introduciendo Álvaro Palacios, el sistema y una parte me lo va a proponer, por ejemplo, este método, lo que hace es se le pasa este método Betis ambiguo. Lo que va a hacer es obtener los datos de estas personas, en este caso. Tendríamos únicamente tenemos configurado el nombre, nombre es la que le hemos metido una propiedad llamada nombre y la configuración de estas criminalidad es a través del algoritmo de nombres. Si continuamos vas a hacer lo mismo con los 7, con el del usuario y aquellos sistemas propuestas de la base de datos. Cuando se termine esta ejecución, posición, nos devuelve un diccionario como resultado. Tenemos un diccionario con los identificadores de todos los candidatos, punto con una puntuación en función de la similitud de los nombres. Esto es lo que va a hacer es compara en este punto de aquí comparar 1 a 1 todos los que todos candidatos digamos con él, con elite inicial, y en este caso. Tendríamos esta función en la que se le pasa el nombre inicial, expuesto Tomás. En este caso el candidato tiene este mismo valor y esto no nos va a devolver un número en este caso para enseñar cómo se puede este número un coma 96 o en este otro. Por ejemplo, tendríamos el siempre se va a comprar, sobre todo queda en otro caso. Tenemos otra persona que se llama Tomás Martínez Garre y aquí vamos a tener una edad inferior. Este método lo que hace es. Ambos nombres. Pasarlos a minúsculas y eliminar caracteres especiales. Y lo hago. Comparar 1 por 1, todas las palabras que hayan sido coincidentes, en este caso teníamos 2 palabras. Incidentes eran José Tomás, si no me equivoco, usted más José Tomás y a cada una de estas palabras se le asigna un skone es desconecte, vais aquí? Se calcula. Este es desconecte, aquí se calcula en función de los de la frecuencia de los nombres que llegan al sistema, es decir, por ejemplo, las iniciales van a tener un peso de 0,1, son palabras sueltas y luego los nombres, en función de en función del volumen de nombres que haya en el sistema, tendrán un peso que oscilará. En este caso está puesto entre los coma 4 cerró con 6. Esto lo que quiere decir es que en el sistema, por ejemplo, tenemos a 29 personas que se queman María García. Esto va descendiendo. Hasta, por ejemplo, tenemos solamente una persona que se llama Gregorio. Entonces este es para lo que nos va a decir, es el peso entre 0 entre sí pero con 4,6. Digamos que cuanto más alto sea ese. Ese valor es que hay menos personas en el sistema y es más probable que se requiere a la misma persona. En la práctica, cuando terminemos de ejecutar este método. Tenemos este este diccionario con estos 274 valores, con todas las personas que hemos encontrado en el sistema. Punto, con esta puntuación que nos ha dado este algoritmo que tenemos de nombres. Entonces, a seguir. Recorremos todas las personas que hemos obtenido antes. Eres asignamos el expolio obtenido, tendríamos, pues pone cargado la las en función del nombre para cada 1 de ellos. Y en último lugar, eliminamos aquellas SA y nos quedamos con estas 49 personas ordenadas descendentes en función de la de las similares edades? . 511 00:37:45,520 --> 00:37:49,480 Va para cada una de estas personas, vamos a considerar inicialmente este escollo y les vamos a asignar un escollo máximo a través de a través de este método. Vale? Con lo que vamos a ir luego vamos. Esta estas singularidades no pueden aumentar en función de las publicaciones que tengan en común o de si pertenecen a publicaciones y proyectos que tengan en común o si pertenecen al mismo departamento, pero podríamos tener en el caso de que una persona se parezca muy poquito, porque eso ya me agarró a la espalda y otra se llame Álvaro Ortiz, Pepe, decir algo. Entonces, el peso máximo que puede tener esa persona, aunque coincida en en otras en otras publicaciones, va haber determinado, está por esta función, que básicamente es que si el coma 9 el peso máximo va a ser, o sea, tiene que ser entre 0 1, pues era tercero, con 9 más, el más entero, con 9 de los restantes. Es decir, sería el máximo lo máximo que podría tener este ese día, pero con 99, si fuese el inicial, pero con 8 el peso máximo podría ser, pero con 8, pero con 2. Ponerse como les quedarían 1,96, aplicamos esto a cada una de las personas que en este caso tendríamos la primera persona que partíamos de este peso, su peso máximo va a ser este, y luego vamos a ver los colaboradores de documentos que tengan en común de proyectos y de departamentos y leeremos un mando que finalmente los ordenamos en base a este escollo, y se lo devolvemos al usuario. El usuario deberá. No puedo decir 3 puntos. El usuario deberá será para cada una de estas firmas una una propuesta similar. Tenemos 4 vale a quienes tengan resultados. Se pueden ver todas aquellas personas que sean ordenadas en base a estas. En este caso tenemos este José Tomás Palma Méndez, que es el propio autor con una evidencia del 100 por 100. En otros casos, por ejemplo, le haya metido Manuel Campos y hay un tal Manuel Campos Martínez tiene esta coincidencia porque seguramente tengan varias publicaciones en común, con Antonio Skármeta y cualquier metido solamente el nombre. Me está proponiendo tal cual Antonio, porque habla ya, aunque solamente coinciden el nombre de Juan. Se debe a que tenemos algunos pecados de algunas pruebas que hemos hecho, pero se debe a que tendrá muchas publicaciones en común con ésta, con esta persona, y si quisiéramos ver en particular es los datos de esta persona, por ejemplo, para saber si se trata de la persona que estamos buscando. Si pasamos en ella, nos iremos hasta la fecha de este Manuel Campos, y podríamos comprobar en función de su descripción y sus publicaciones. Si se trata del Manuel Campos que estamos buscando. Un. Vale. Una vez que hayamos terminado este proceso el usuario podrá seleccionar textos José Tomás. El que me interesa es este, por ejemplo, o podría darse el caso de que la la, los que proponga el sistema no nos convencen o consideramos que no se trata de ninguna de ellas. Es una persona nueva en el sistema. Tenemos esta opción de buscar en la podemos introducir el del usuario. Si lo conocemos, por ejemplo, una prueba con una persona más aleatoria. Mismamente estén por coger algo, te conoces emocional de la persona, mientras que en este variedad nos entraría dentro del de este servicio, tenemos un método. Dentro de este controlador va a hacer una petición, en primer lugar, con pruebas. Un segUndo. Creo que se nos ha caído un segundo disculpa. Señor Hidalgo, Manuel, puede mirar a ver qué es lo que ha pasado y yo continuo. Continúo con esto a ver si no voy explicando que no lo pueda enseñar, porque ha habido algún algún fallo y parece que no funciona ahora la web para echarle un ojo, Manuel sí pueden pagar. Vale, pues en este caso, lo que si hubiera funcionado esto, haremos una consulta para ver si dentro de las personas cargadas en el sistema, existiese alguna conexión que, en caso de que exista una con el esta persona, y en caso de que no existiese ninguna conexión ninguna persona con este Orkest haríamos una una petición a la piedra de qué? Pero un segundo tiempo ya segunda disculpa, viene de compartir un segundo. Vale, espera que. Antes estaba en contra el entorno del candidato, un entorno para ver si. En este entorno no puedo enseñar. Por delante habíamos metido esto es inventa Por ejemplo. Vale, que es el punto en el que estábamos antes, por ejemplo, podríamos tener este existe y supongamos que no nos convence sin ninguna de estas personas perdón, podemos coger el tren, será para los enfermos, vale, y aquí lo que hacemos es obtener, en el caso de que exista una persona con este. Por qué? Si existiese esa persona y como no existe lo que vamos a hacer va a ser atacar el lápiz de orquesta. Este arte y nos ha devuelto esta persona, pues yo, a mi línea Inés Frazetta su nombre. Es Álvaro recuperado. Aquí he cogido de forma aleatoria. Finalmente, construiremos la una persona con estos datos recuperado junto con los en el sistema. Vale aquella tendríamos este. Este Álvaro queríamos metido con hemos seleccionado de lo que tendríamos aquí nos habría cargado este Álvaro Ferreira sería el dueño de este que habíamos seleccionado una vez que terminemos de seleccionar aquellas personas que son los autores teníamos aquí añade que ya tendríamos, cargadas las a los autores de esta publicación. Vale, en este punto ya habríamos terminado con, con todo lo referente a la duplicidad de los autores dentro de las publicaciones de Google. Ahora vamos a ver otro ejemplo de este motor de aplicado a la carga de fuentes externas a los investigadores del sistema. Se les van a cargar publicaciones provenientes de fuentes externas, como Scopus, y Open Aire, para lo cual tenemos diferentes servicios también creados, que habrá una próxima formación. No recuerdo. Pedía que atacan los artistas, estos textos, sistemas para recuperar las publicaciones de los autores, y tenemos un servicio que se espera que este publicación, que sería un servicio más genérico, que por detrás ataca estos otros servicios para recuperar los datos de una persona. Entonces insiste que esto se verá en otra formación que hay que posterior. Esto, como como resultado acaba generando un JA, son. Como este, por ejemplo, este sería el un, un j son obtenido a través de este arte, con las publicaciones de José Tomás, en este caso reducido para hacer la la demo de puesto. Solamente había más interés, pero he cogido las 3 últimas publicaciones. Adicionalmente para hacer la prueba. He metido yo aquí una mano, quedó llamado Prueba, de publicación para EMBO y le he puesto como autor me he puesto a mí mismo, aunque yo realmente no soy, no soy autor de esta publicación, vale? . 665 00:50:30,520 --> 00:50:34,500 Entonces, el programa de la descarga de fuentes externas existe aquí; el servicio de carga de datos obtenidos de fuentes externas es este; se había mostrado en depuración; vale? Que se encarga de leer. Estos cuotas son en el sistema; el flujo de este servicio es el siguiente. En primer lugar, los cuentos son ya mostrarlo en qué posición. Quería estar aquí. Para este programa lo que va a hacer es, en primer lugar, las cuotas, son que se encuentran en el directorio de lectura. Sería este fichero, sería el fichero, que se acabó de enseñar. Lo primero que hacemos tenemos una serie de clases que luego utilizaremos. Y aquí comenzaría la carga de los datos de este paso. Lo primero que hacemos es obtener el. El autor de este está dentro del nombre del de votación, que se va a cerrar. La primera parte se correspondería con el identificador de la persona propietaria de este. Tenemos los datos de esta persona, podría ser el departamento al que pertenece. Pp, obtener la pensión y demás datos se van a utilizar posteriormente para realizar las tareas de esa ambigua acción. Dentro del motor de dentro de este botón. Leemos este J son ya, tendríamos cargado entonces estas publicaciones, que estas 4 publicaciones que contienen JA son, esta primera sería la que he creado yo de pruebas y prueba de explicación para tengo. Estas otras 3 serían publicaciones reales de la persona que de hecho, ya están cargadas previamente en el sistema y ahora vamos a ver cómo el motor va a reconocer que estas publicaciones están ya en el sistema y los autores de estas publicaciones también estarán en el sistema para que no cree duplicidades y no se carguen por segunda vez estas publicaciones, sino que lo que haga sea sustituir los datos de estas publicaciones con los datos que hayamos obtenido. Ahora? Recorremos cada una de estas 4 publicaciones. Y creamos un un objeto llamado publicación, que hereda la clase, que hemos visto antes que era ambigua, y que, en este caso, las las publicaciones. Vamos a considerar estos datos para considerar que otras publicaciones puedan ser iguales. Vamos a considerar su título, va a ser, pero el título está configurado por tipo de interés. Con este skone vamos a considerar el Loy el, el doy de West y el Opus que van a ser de tipo identificadores. Vamos a considerar también los autores de las publicaciones que van a ser del tipo. Este tipo que hemos visto antes vale, en el caso de que coincidan el doy el hueso, el identificador, descompuso, la publicación en el caso de que el título sea sea igual o similar. Tendrá un peso de partida que sería este aquí que luego irá creciendo o creciendo en función de los de otros datos, como los autores. En este punto. Lo primero que vamos hacer es obtener los candidatos para todas las publicaciones de las cuotas. Son los autores que vamos a hacer algunas consultas a la base de datos para obtener todas aquellas publicaciones por las que podamos intentar machacar estas publicaciones que tenemos y con los autores lo mismo, y vamos a quedar dentro de la clase instalación, patio, personal y pública con las propiedades necesarias para realizar esta averiguación. Es decir, por ejemplo, para la casa de vamos a crear estas clases vale de partida. Vamos a tener cargados en estas, en este lista de no estaba igual en estos? Estos serán los datos de las publicaciones que tenemos ahora mismo en cuotas. Contar con los datos de verdes ambiguas que aquí tendríamos, tendríamos las los autores. Lo primero que hacemos para obtener aquellos documentos contra los que intentar hacer el Machín. Vamos a obtener todas las publicaciones en las en las que este autor figure como como autor obtendremos 57 publicaciones que hay en el sistema y en el caso de las personas vamos a hacer una ley similar a la que hemos hecho antes para tener las personas, para obtener todos aquellos candidatos con los que realizan la averiguación. Por ejemplo, en el caso de las personas. 4 publicaciones tienen diferentes autores. Por ejemplo, los autores tienen un un nombre, vamos a tener son aquellas personas de la de la base de datos que tienen, que pueden ser candidatas. Para otras publicaciones, por ejemplo, esta persona se llama Luis Sánchez González, la hemos obtenido porque alguno de los nombres, dentro de todas las pública, de los autores, de todas las publicaciones, pues será similar. Entonces aquí tendríamos en este punto cargadas todos aquellos candidatos, tanto en las publicaciones como los autores. Y ahora llevamos una petición a este método de qué le vamos a pasar estos? Estas estos 24 objetos que se trataría de los objetos que representan los elementos del cuota, son el cual hay una publicación, 2, 3 4, el resto serían personas, está ya creadas por los nombres de los autores. Esta lista es ambiguo a base de datos según el cual estarían todas las publicaciones y personas candidatas en la base de datos. Si ejecutamos esto. Vale, este esté lista de equivalentes, nos va a devolver la como clave. Votamos esto como resultado tenemos un diccionario, cuyas claves son los identificadores de las publicaciones de la base de datos. Y cuyos valores son las publicaciones y personas que quizá deberíamos, por ejemplo, que esta persona que teníamos en bases de datos se corresponde con estas 4 cosas. Qué había dentro de esto? Serían los identificadores que anteriormente se habían asignado a los elementos del votación y tendríamos, por ejemplo, estos otros 2 casos de abajo. Se trataría de es una publicación, es una persona que se corresponderían con la publicación, que me he inventado, y la persona que me he inventado porque dentro del sistema no ha encontrado ninguna persona o ni ninguna publicación que se corresponda con con estos datos. Y como siguiente paso. Vale, a a continuación cargamos las personas que no existan en el sistema o actualizamos de los que corresponda? Es decir, en este caso nos ha entrado, por ejemplo, por aquí porque vamos a crear la persona que me he inventado. Esto nos va a crear esta esta persona es que soy yo, es la persona que me he inventado y lo que va a hacer es dejar lo que cuento vale? Meter dentro de este lista personas a cargar va a dejar aquí cargado el recurso que se creará posteriormente con esta persona. Aquí hacemos lo propio con las, con las publicaciones. Vale, entonces, una vez que se han creado los los objetos para tanto, para las publicaciones como para las personas. Ya se les ha asignado internamente un 1 por el que se van a cargar cada 1 de ellos, y entonces, nos vamos a recorrer los documentos que se van a cargar para asignarle a los autores, los identificadores de las personas que vamos a perder en el sistema? . 815 01:01:11,520 --> 01:01:14,480 Pues ya tendríamos ya tendríamos que estar preparados para cargar en el sistema o modificar. En este punto se van a crear también notificaciones, porque a todos aquellos coautores de las publicaciones de este autor le llegarán unas notificaciones que indicaran que se ha creado. Una publicación en la cual ellos son autores. Luego hace lo propio con los, en este caso eran publicaciones, pero podrían haber sido otros tipos de objetos, personal pública. En última instancia se cargan los datos de estos objetos que tenemos preparados, que serían las tanto las personas como las publicaciones. Ahora se estarían cargando el retrato de estas personas y publicaciones y claro. Vale, se cargan y se modifican aquellas otras publicaciones que ya se habían encontrado en el sistema. También puede ejecutarse. Madrid estaría encargadas estas esta publicación y estas personas en el sistema para que luego haya otras tareas para insertar en colas de otros servicios de datos por detrás atamos se cargan el sistema, lo que sigan las notificaciones. Finalmente. Y finalmente se crea, con el Jhonson que hemos pagado comprimido, se guarda un y eliminamos de la carpeta pendientes de procesar para que no se vuelva a procesar ahora, entrásemos dentro de CEO de la persona que le hemos cargado los datos aquí en la actividad. Tenemos esta publicación es la que acabó la prueba de publicación para que estaría bloqueada porque viene de fuentes externas. Con estos autores. Pero se vamos a ver al buscador de. Publica, Mundo. Buscamos esta publica. Un segundo, el que creo que. Antes se había caído esta práctica. Hay un servicio que estará bien. Esta sería la publicación que sabía que se habría creado y aquí tendríamos los diferentes autores con los que se ha creado accedemos a cualquiera de las de estas fechas. Vale, veremos cómo se toma es el autor de esta publicación, es el autor de las 58 publicaciones, que era el propietario del exceso y que es lo que se acaba de crear, y luego para que tenemos otros autores ya habíamos seleccionado que se han reconocido dentro de dentro del JH, y con esto ya quedaría. Quedaría cerrado nada. Está esta presentación. Voy a pausar la grabación vale, y luego la volveré a realizar. Para que hagáis preguntas, voy a parar la grabación.

Propietarios

Proyecto Hércules

Comentarios

Nuevo comentario

Serie: FORMACION EDMA Desarrolladores (+información)

EDMA Desarrollo

Relaccionados