Bueno, pues muchos buenos
días a todos.
Estamos aquí en familia.
Había cuatro personas,
quizás poco a poco se irá
incorporando más gente,
os voy a hacer una introducción
a quienes el concepto de Hita
a sus manifestaciones más
importantes y sobre todo
pues os voy a contar la relevancia
que tiene en el sector público
el sector bueno, de las
universidades,
también entre el mundo académico,
y la razón
por la cual pues hoy somos introduce
en ese término no es algo esencial,
dentro de las pilares o libres
fundacionales de Hércules,
entonces bueno prestado un conjunto
de transparencias
de una presentación oficial ofrecida
por el hielo por el portal de datos
abiertos europeo.
Por eso esto explica que muchas
de las carencias
que vais a ver hoy están
escritas en inglés.
Vale, confío que no sea un problema
para ninguno de nosotros,
y esto es el índice de lo que
hubiera una haber lugar.
Vamos a definir datos enlazados.
En segundo lugar, vamos
a intentar distinguir
entre datos abiertos
y datos enlazados.
Veremos que desearíamos que los
datos fueran abiertos y enlazados,
pero hay estaciones.
Hay situaciones en las cuales, pues
no se dan esos dos atributos
asociados.
Luego, pues veremos las cinco
maneras de publicitar,
de publicar información en la
web y que hay un esquema
o un enfoque para clasificar como
debía estás abriendo tus datos,
y finalmente acabaré dando
unas pinceladas
sobre por qué es necesario,
importante para la sociedad,
para los sectores industriales.
El compartir datos de manera bien.
Un contexto breve de por
qué estamos hablando,
estamos hablando del inédito, porque
esto es una tendencia
a la evolución del agua,
inicialmente,
como he dicho en otras tutoriales o
en otras formaciones anteriores;
a esta solamente había un
árbol de documentos,
los documentos tienen una estructura
que es idónea
y adecuada para que un navegador
pueda usar esos datos;
sin embargo, un agente software,
difícilmente entiende lo
que está ahí modelado
como etiquetas de marcado,
como lenguaje html.
Es necesario.
Salió a hacer programas,
software sofisticados usando
técnicas de procesamiento
del lenguaje o técnicas de
inteligencia artificial;
son capaces de destilar
la información.
Por eso veremos trabajando algunos
desde hace ya una década más
de una década en la idea
de la semántica
y, por tanto, de la web de
datos, donde soñábamos,
con que los datos estén conectados
unos con otros,
y esos datos vengan acompañados
de metadatos,
para que sea muchísimo más sencillo
entender lo que hay detrás.
La realidad actual es que la
web tenemos contenidos
tremendamente heterogéneos en
cuanto a su contenido,
en cuanto a su estructura, en cuanto
e incluso a la codificación
de los caracteres que conforman
tales documentos.
También una en cuenta que hay
diferentes alfabetos
y que los sistemas de codificación
de la información han sufrido
o han experimentado diferentes
evoluciones
en los últimos.
Entonces el futuro requiere una
integración más inteligente
y en esa desgravación
no desea evolución.
El concepto del inédita aparece.
Podemos entender que el
inédita es esta idea
de intentar pasar de una
web habilitada,
documentos a una web de
datos enlazados,
entre lanzados, unos con otros.
Veréis como la izquierda pues
tenemos documentos
de marcado escritos en
html que tienen
ni vínculos el grandísimo invento
o innovación de la web,
o el hecho de que era posible
navegar de unos documentos a otro.
El tema de los vínculos que
hoy lo pensamos pensamos
que es algo bueno, tremendamente
sencillo y no
una innovación demasiado grande,
pero, pero realmente lo que
ha marcado la diferencia
en el enfoque de publicar
información,
bueno, pues queremos transitar hacia
una web donde haya datos,
y sus datos estén localizados en
diferentes grapos conocimiento
o en diferentes ficheros.
Claro, es que eta
es como si dijéramos una
versión más blanda,
una versión notan estricta
de la web semántica
se queda simplemente con la esencia.
Con lo más importante, para
fomentar el intercambio
y el entrelazado la conexión
entre diferentes datos,
cuando hablamos de no sabiamente
estamos hablando
de web semántica,
aunque si hacemos con cinco
estrellas a lo grande bien hecho,
también estaremos usando
web semántica.
Entonces, esta es una importante
distinción
para alcanzar esta quimera
de la web de los datos
lo mejor sería adoptar en toda
su esencia la semántica,
pero en su defecto, al menos ir
adoptando los conceptos de ley
bale entonces,
donde empezó todo empezó con una
colección de documentos
publicados en diferentes portales,
podemos acceder a observar
en la parte izquierda,
a esos documentos, usando un
concepto importante que son las vr.
es universal.
Eso es lo que hay.
2.
Inicialmente, estos documentos
escritos,
en un lenguaje que se llama html son
gracias a una pieza de software,
son los navegadores, entendibles
por las personas,
pero lo una vez más incidido
difícilmente comprensibles
por las máquinas.
Por tanto, reiteró la web de Data
intenta facilitar el acceso
a esos datos.
También a las máquinas quiere
que sea una web,
tanto para personas como
para procesos,
eso, acuerdo y que aparecen
por aquí conceptos
como la psoriasis, una vez más,
una hora y.
Atención, es un súper conjunto
de una uva rl,
es decir, es un identificador
único no es necesariamente,
y es si cuando tu introduces
esa Wehrlein un navegador
no es absolutamente obligatorio
que llegues a un recurso
a través de esa hoy,
aunque obviamente es la práctica,
más vale entonces,
con la voz de datos que nos producen
hacia datos entendibles
por las máquinas que
están aderezados,
con un montón de metadatos,
o sea que a partir, aparte de
los datos en sí mismo,
por ejemplo, es una fila de
un recibo donde tenemos
el nombre del producto,
el precio o la fecha.
Hay una serie de metadatos que
informan sobre especifican cosas,
como que la fecha tiene un formato,
dado que el código de la factura
también sigue en formato,
dado que el código aparece
antes de la descripción
del elemento comprado,
este tipo de reglas
o de vocabulario son los metadatos,
que aderezan los que luego
se representa,
y así vamos a conseguir.
Estos datos, que son, qué tienen?
Qué tienen lo bueno de
las dos partes.
Ya vimos en otro módulo anterior que
hay ciertas extensiones del agua,
semántica que intentan combinar
lo mejor de ambos mundos.
El hecho de que el contenido pueda
ser a través de un navegador, web,
y el hecho de que un programa
pueda extraer fácilmente la esencia
de lo que está siendo representado.
Ese estándar se llama y
luego, pues bueno,
por supuesto también podemos tener
dos versiones de las páginas html
o de los documentos html, que
es la que va al navegador,
web y otra en otros formatos, como
pueden ser rbs, XML y Jay-Z,
y si conocéis un poquito el
funcionamiento del protocolo
http.
Os daréis cuenta o comentó
el protocolo?
Http.
De hecho, está diseñado para negociar
qué contenidos se sirven a
diferentes clientes o agentes,
solicitando información
de un servidor web.
El protocolo.
Http.
Es el protocolo que permite
negociar a un cliente
con un servidor en ese proceso
de negociación claros.
Un cliente a veces es
un navegador web;
el navegador web;
cuando se conecta con
el servidor web.
Indica cuál es su preferencia
de contenidos,
que tipo de contenidos
quiere recibir.
Su navegador, web;
lo que dice.
Yo deseo que acepto contenidos.
En html, mientras que un programa,
software, por ejemplo, hecho
en la actuación,
puede decir que su preferencia es
que se le sirvan contenidos
en formato XML.
Algo interesante a entender es que
cuando tú públicas datos,
si quieres que tus datos no
solamente sirvan para la web tradicional
sino también subirte al tren del
debe es permitir que los clientes, htc,
negocie con tu servidor de
contenidos las diferentes versiones
de un recurso.
Esta transparencia a aquellos
que se inste
es mi tutorial inicial a la
web semántica agradece,
y aol ya lo habéis visto en este
transparencias de modo
muy rápido.
Simplemente quiero resaltar el hecho
de que es posible mezcla datos,
semánticos o datos, también
enlazados,
he dicho que los datos semánticos
en esas redes,
que al fin y al cabo son
la quinta esencia,
la mejor de datos enlazados,
y hay diferentes mecanismos para
mezclar html con metadatos,
una de las formas más apreciadas
es la que acabo de comentar,
a ahí tenéis un enlace.
Básicamente nos dirige a una página
que explica un poquillo
qué es esto de reaccionar.
Pero esencialmente, si explorará
dice este enlace,
lo que vais a descubrir,
lo que vais a descubrir es que
se enriquecen los elementos,
html.
Por ejemplo, esto es una etiqueta
que para describir una imagen,
pero en este caso fijaron, estamos
enriqueciendo esa imagen
indicando que esa imagen
es de hecho libre,
que tiene detrás una licencia.
Creative Commons tres puntos,
pero vale, y bueno,
pues básicamente usa una serie
de atributos adicionales,
y los elementos html para poder ir
los anotando con sentencias
de tipo se mantiene.
Si tenéis curiosidad, repito, saber
cómo se hace os invito
a que leáis este artículo que
está ahí pero vinculada
antes de que surgiera este estándar
desarrollado por la Web Consortium,
que básicamente es la organización
que regula todos los estándares,
alrededor de aguar, pues ya existían
un conjunto de convenciones
de facto las que habían acordado
una importante número
de desarrolladores de contenidos web
que permitían crear gays atributos
tales como los que aparecen
a quienes grita.
Esto no es estandarizado, vale, pero
hay muchos micros, formatos,
definidos para describir cosas como
eventos, como geolocalización,
como relaciones de parentesco
entre personas.
Vale aquí qué tonterías tenemos?
Aquí?
No estamos diciendo que el
autor de esta página,
imaginaros que estar,
escribir una página, existe
menos de un tal equipo
ni por vinculó a una tal y de paso
dice que es una chica dulce,
que la conocido y que le gustaría
tener una cita
con no esa es una manera
también de enriquecer,
de anotar contenía el sistema,
y este es el formato recomendado
hoy en día,
dentro del estándar para
crear páginas html,
que se denomina html5 bale, y aquí
véis cómo podemos describir
un texto?
Era detalles sobre los Juegos angry,
ver para su versión Android como
lo podemos enriquecer,
con esas cositas en grito
en negrita indicando.
Básicamente que esto que
estamos describiendo
es de tipo software aplique
tiene una tributo nombre
tiene otro atributo sistema operativo
y también tiene una esto sería una.
Aquellos de vosotros que habéis
estudiado, agradece conmigo
y esto sería una obvia, es compartir,
porque a su vez está diciendo
que una aplicación,
o sea que está especializado
como gay,
que no solamente es una aplicación
solo bueno,
sino que encima es un juego bien.
Entonces, pasando aquí
esa transparencia.
En resumen,
para acabar hay por aquí un conjunto
de tecnologías críticas
que nos permiten mezclar
ambos mundos.
El mundo en la rueda de documentos
con el mundo
de la vida y último apunte y
recordatorio para aquellos
que ya visteis esto conmigo
es que se ha ido más allá
y si bien sabemos que la semántica
es complicada,
de ser adoptada por todas
las organizaciones
y que requiere una inversión
de esfuerzo ingente bueno,
al menos sí que podemos
anotar, partes partes
de nuestros documentos, las
partes más importantes
y se han puesto de acuerdo un
conjunto de buscadores
de Internet, los más famosos los
que veis aquí listados,
bien, Google, Yahoo, para que
se han puesto de acuerdo
para crear un conjunto
de vocabulario,
los comunes, tal manera
que esos buscadores,
una página que describa información
de eventos
o sea capaz de interpretarlo de.
Igual manera porque esas páginas Man
adoptar una serie de atributos
Comunes para describirlo bale,
si tenéis curiosidad,
invito a que visite esta página
donde están descritos minuciosamente
todos estos esquemas.
Pero, bueno, hoy estábamos
aquí para hablar de eta,
o sea, vamos a profundizar.
Vamos a adentrarnos en entender
los principios del inédita
y vamos a estudiar qué retos hemos
de resolver para hacer realidad
esta idea de élite, comencemos
por una definición
dada por en este caso un
informe importante
que creó la Comisión
Europea titulado.
Como los datos enlazados,
están transformando el Gobierno
electrónico hoy saber
qué que los mejores representantes
del mundo de Linde y eta
son las administraciones públicas a
través de sus portales abiertos.
Lo que pretendemos con
asiduidad Hércules
es poder crear también un portal
de datos abiertos y enlazados
de la información académica del
mundo universitario español.
Entonces, vayamos a la definición,
datos enlazados.
Es un conjunto de principios del
diseño sabe cómo hacer cosas
para que para compartir información
legible por máquinas en la web
y que suele ser utilizada por
administraciones públicas,
por negocios y por ciudadanía, vale.
Que el propósito es poner
a disposición
de todos estos agentes importantes
de nuestra sociedad,
contenidos sobre los cuales ellos
luego puedan trabajar,
puedan hacer cálculos estadísticos,
puedan transformar esos datos,
puedan agregar, los puedan crear
gráficas de visualización;
y nuestro amigo Tim muy
bien conocido.
Confío por todos los otros,
es el creador de la web, es el
precursor de la web semántica
es el precursor incluso el
agua descentralizada.
Esa es su última.
Su última propuesta de
evolución de la uer
nos dio cuatro principios esenciales
que deben de cumplir los datos.
Para decir etiquetar como primero
vamos a usar un gris
para nombrar aquellos conceptos
que queramos describir,
ese es el paso, el paso 2, vamos
a tratar que esas de hecho
apunten a algo que podamos extraer
información una vez que viajamos
a esa sur bale,
una vez que hemos viajado
extraemos de ellas,
o podremos introducir a través
de sus puntos de acceso,
pues consultas o le contenidos,
derivados de.
F. Podríamos interpretar
y algo muy importante.
Ese es el principio de hecho,
más importante de los dados en las 2,
por eso se llama Lin.
Nuestros datos ganan en usabilidad;
ganan en interés,
ganan en valor.
Si están enlazados a los
datos de otros,
sí yo estoy describiendo por
ejemplo un concepto.
La Universidad de Deusto,
cuando yo, es que Bolonia sale hurto,
debería hacer la Universidad
de Deusto
con otro concepto que, por ejemplo,
describe el barrio de Deusto,
con otro concepto que describe
la ciudad de Bilbao
con otro concepto que la Comunidad
Autónoma del País Vasco
con otro concepto que describe
el país España etc etc
etc tenemos que permitir
la navegación
por todos estos conceptos
de eso vale de eta.
Otra definición alternativa muy
similar es una buena práctica
recomendada para exponer compartir,
conectar, piezas de información
y conocimiento, la web semántica
usando y r una vez más incidido.
Esta es una definición estricta.
Es posible que nos encontramos
manifestaciones de Linde
y que no sigan los principios de
semana de manera escrúpulos,
no vamos a ver, hay un especie de red
o de clasificación en los
datos enlazados,
pues aquellos que no cumplan
con la semántica web
y con sus estándares como rsf para
tener una calificación de 3,
este ya es máximo frente a las
cinco posibles estrellas
que pueden.
Gracias al él vamos a poder
descubrir conectar,
describir y reutilizar datos.
El sueño sueño es concebir
este garaje de Gracia
donde haya algunos que, por ejemplo,
describen información del adn,
otros grapos describen información,
por ejemplo del censo
de Estados Unidos,
otros pueden describir información
sobre publicaciones
o sobre también artículos
acm y la idea
es que eso es gracias a las
instancias de fotógrafos,
estén en las a través de híper
vínculos con otros instancias
de esos años.
Bien es lo que queremos
conseguir, son cosas
como las que veáis en pantalla que
es lo que teníamos en pantalla
aparecen diferentes colores.
Esos colores representan
diferentes conceptos.
Por un lado, el dominio azul
representa un libro,
el dominio.
Este gris oscuro representa
una revisión de un libro
y este dominio verde que veis aquí
me presenta a unas personas,
mientras que esta otra representa
una entrada
en la media correspondiente
a una ciudad.
Entonces, en este caso estamos
consiguiendo links
de porque estamos diciendo que esta
perdonar este autor de una revisión,
este autor de una revisión es
de hecho la misma persona.
A ahora ver este y de que representa
un libro disculpa
es exactamente hace referencia
al mismo libro,
podría ser que en el dominio en
el grifo de las revisiones,
los tres puntos que veis aquí haya
un paz o ruta un poquito diferente
a la que nos encontramos
aquí imaginemos, Nóos,
que éste tuviera aquí vivió
ese punto o barra y ese
ver en lo que sea y éste tenga
aquí libros, punto, Old,
barra y nos conectamos
con una propiedad
o si hay más de esa manera
decimos que este libro es referencia
en este gráfico gris oscuro,
es el mismo que este libro
referenciado en este otro
párrafo de libros,
con otro aire aparentemente distinto,
pero que apuntan al mismo concepto.
Esto mismo se repite.
Aquí aquí tenemos el correspondiente
a un revisor,
a la persona que hace la revisión,
y aquí tenemos salir
de correspondiente
a alguien que tiene una
página web vale,
y donde Bueno ha descrito
sus metadatos,
por ejemplo, usando un bocado.
Lo que vemos aquí es que otra
vez estamos más peleando,
estamos enlazando, estamos diciendo
que este concepto en es
el mismo que este,
otro concepto y así sucesivamente.
Confío que con esto de manera
gráfica entendéis,
que es esto de Linde,
y para qué queremos estudiar.
Al final lo que queremos es hacer.
Aplicar útiles que explotan
esos datos, Javier.
Lo que veis aquí
fue un esfuerzo que hicimos en
mi grupo de investigación
para intentar cruzar datos
correspondientes a los residuos
generados en diferentes municipios
de la provincia de Vizcaya,
y de una manera un poquito más
accesible a los seres humanos.
Creamos un mapa de calor indicando
cual es bueno.
Pues,
qué municipios generan más
residuos que otros.
Si hiciéramos y pudiéramos hacer
este análisis a nivel de barrio.
Esos datos podrían ayudarnos
a tomar decisiones
como si es necesario colocar
más contenedores,
si es necesario, lanzar campañas
entre la ciudadanía
para que reciclen más para eso
es para lo que queremos.
Open o p, podría ayudar a la
empresa que se encarga
de recoger los residuos generados en
los contenedores de una ciudad
a optimizar sus rutas a preveer,
cuando debería acercarse
a los contenedores,
basado en históricos de los datos.
Bale bien.
Por tanto, no solamente es
pertinente hablar de eta,
sino también del Lens Open
Government de eta.
Qué es, sin duda alguna, la
manifestación más clara
de dónde está utilizando
esta idea de élite
y cuáles son los objetivos detrás
de hacer que los gobiernos,
las administraciones públicas,
publiquen datos avión.
Bueno, queremos potenciar
la integración flexible
de los datos a leer.
Queremos facilitar la interconexión
entre diferentes sistemas
de información de un Gobierno.
Queremos facilitar nuevos empresas
que ofrecen servicios innovadores
a las administraciones públicas,
tengan más fácil
conectarse a su información.
Además, se quiere incrementar
la calidad de los datos,
dado que esos datos se
hacen públicos,
están sujetos al escrutinio público,
están sujetos a los innovadores
que trabajan sobre sus datos.
Y que detectan problemas
fallos con ellos,
gracias a abrir esos datos,
podemos dar lugar a servicios
innovadores,
por ejemplo, pues conecten todos
los datos de información,
de transporte en tiempo
real de una ciudad
y nos permitan encontrar
la ruta más rápida,
el punto al punto b o la ruta
menos contaminante
del punto a Al punto, y
supuestamente los gobiernos,
a los datos que van a conseguir es
qué hacer soluciones para ellos
sea cada vez menos costoso.
Llegamos aquí; tenemos un
enlace importante allí
o pierda y te aporta.
Este libro te aporta, es una
especie de catálogo
indexada a todos los datos de las
administraciones públicas.
Europa observar están,
pues clasificadas en diferentes
sapiens.
Ocho categorías, por ejemplo,
Saló que, por ejemplo,
podemos tata sets que nos
hablan de infame,
y pandemia no estamos todos sufren,
pues hay veréis como en este catálogo
de datos le dice qué información
se está generando,
y además veréis que tenemos
diferentes maneras
de acceder a los datos.
Tenemos como a tope de DC lo tenemos
en formato extranjero.
Lo bueno es que podemos
buscar a ir a Taseer.
Podemos también navegar o acceder
a un conjunto de soluciones
que se han generado encima
de esos datos.
Y tiene incluso un Spark el pollo,
es decir, tiene un punto
de consultas,
es parte de aquí los un
conjunto de ejemplos.
No vamos a ver si encontramos
una concreta.
Son preguntas demasiado genéricas,
tendríamos un poquillo para
descubrir alguna consulta concreta
sobre estos catálogos de datos,
que veremos ale,
pero, bueno, lo importante es que
ese es el portal de los portales
a los cuales tenemos acceso, luego
navegar por el mejor portal
que tenemos a nivel estatal,
que es el nivel.
El portal aporta bien, pero
vayamos ahora a pensar
o a entender cómo publicamos
nuestros datos.
Como lente, entonces he visto que
había cuatro principios.
El primero es que tenemos que usar
identificadores uniformes de recursos
para nombrar las cosas y segundo
ya que elegimos
unas son unas que apuntan, vía htc,
a un recurso existente en
la web mucho mejor,
porque podemos acceder a ellos.
Esta sería, por ejemplo,
Lahore que apuntaría a un recurso
que es la es unisex
y que está descrito, pues en un
catálogo de publicaciones
que tienen la Comisión Europea.
Si yo hago explica ahí pues
accedió a un recurso.
Este recurso en que está
descrito estos rdc
y lo bonito que tiene
es que, pues claro,
este recurso está descrito
en todos los idiomas.
Oficiales de la Unión Europea, claro,
es que aquí os ofrecemos
en castellano que dice
que este recurso, que está descrito
a través de una antología
que es la antología aunque está
describiendo el fondo
de las Naciones Unidas para
la infancia es decir bale
y luego pues bueno te están
clasificando que unicef
va a estar, como veremos por aquí.
Claro está aquí.
Esto que veis aquí está diciendo
que no es una entidad sola,
ella depende de la.
Eso es lo que es La uno vale.
Si yo eso es, estoy de esta
manera lanzando a unicef
con las Naciones Unidas.
Muestra recurso muy mal por mi parte,
vamos a ver si lo consigo,
copiar adecuadamente,
introduce.
Ya veis, aquí nos aparece
la instancia
que describe minuciosamente la
Organización de las Naciones Unidas,
donde lo tendremos en castellano
tanta aquí lo tenemos
Organización de las Naciones, muy
bien, para eso sirven las claros
cuando alguien de hecho
accede a la ruta
tal como he dicho ahora debe
devolver información útil,
agradecer que sea o tiene que
permitir a través de un empollón
o interfaz;
bueno, meter ahí consultas
que extraigan los da
y importante principio, 4.
Cada concepto debería estar
emplazado a otros.
Aquí voy resaltado justamente lo
acababa de enseñar como unicef
es una tradición que al fin y al
cabo depende de las Naciones Unidas,
por eso esa propiedad significa algo
así como que es un concepto
especializado de las
Naciones Unidas ;
es una organización de
las Naciones Unidas,
bien, he hablado muchas
veces hoy hasta ahora
de lengua o pentrita de modo
un tanto confuso,
hay que decir la inédita, no
necesariamente es o pentrita
que de eta son los datos que pueden
ser utilizados de manera libre.
Reutilizados distribuidos a leer
-y en general no suelen
tener restricciones,
no tienes que pagar royalties
por usarlos, como mucho,
y esto es una práctica como
tienes que reconocer,
de dónde han provenido tal
datos bale entonces
y no son necesariamente lo mismo,
aunque lo ideal sería que
trabajaremos con Open de eta,
claro que datos abiertos pueden ser
publicados de manera pública,
con una licencia abierta,
pero no necesariamente
estarán enlazados,
unos con otros.
Los de eta pueden tener pueden
seguir los cuatro principios,
sin embargo, para acceder a ellos
tienes que registrar
o tienes que auténtica arte
contra un portal h.
Bien, aquí tenemos una vez
más un recordatorio de
estas cuatro reglas
que necesariamente debemos cumplir
para tener datos enlazados aquí
en este dibujo como aparecen
cuatro entidades,
no aparece una entidad chico,
una entidad chica,
un coche y una casa, y vemos
por aquí estas flechas,
que básicamente establecen
enlaces entre ellas.
Por ejemplo, tenemos que A que
esta persona es propietaria,
hospital de este coche, con
Four o con esta relación,
o que esta chica conoce a este chico,
a través de esta relación
o a no, sea que le indica
lo que hace.
Es permite descubrir navegar moverte
por diferentes conceptos
a través de las relaciones que se
establecen entre bien entonces
una vez más-volviendo al tema
de estos son nombres
únicos para referenciar a las
cosas y que son importantes
porque es la manera que podemos
direccionar suelen
ser un estre un pacto y además
suelen seguir suelen
ser bien escritas que no tienen pues
Strings que están bien definidas
que son vale y además yendo
más allá suelen
ser persistentes es decir
que no son volátiles
que sea su origen en el tiempo
siguen apuntando siempre al mismo recurso
vale eso es algo muy importante
cuando decidimos que tiene
que apuntar a un recurso el hecho
de que sea aquí habéis ejemplos
pues bueno un poco el nuevo
portal de Linde
y al que habíamos ido antes pues
aquí ves cómo está descrito el país españa
es una taxonomía de países a ver
y aquí pues otros organismos
dentro de de ese repositorio,
colega de Génova Esteban,
luego se enseñará cómo se
permite la navegación,
datos enlazados, en este
caso del dominio
el segundo principio fundacional
de eta es conveniente usar?
No es otra cosa que una.
Sintaxis para repuntar datos
y recursos en la web
y también es conveniente poder hacer
uso de este lenguaje estándar
para consultar grapos r
recuerda que, con lo que modelo,
un triplete de información,
esas tripletes consiste en un sujeto
básicamente el recurso
al que tú quieres describir
que estoy identificado
por un hombre, un predicado
que básicamente
es una relación generalmente
entre dos conceptos
y que también, a su vez tiene
la sociedad de Lahore,
y, finalmente, un objeto
suelen ser dos tipos,
puede ser un recurso con
su propia orina
o puede ser directamente una
estrella con un valor final primitivo.
Aquí vemos el ejemplo
de dos tripletes.
Tenemos la ciudad de
Madrid al sujeto.
Es un predicado en un caso
apuntando a un literal.
En otro caso, apuntando a
un objeto vale bien,
ya se habían anunciado, que tiene
ley, que fue el creador del agua,
fue el creador de la web semántica
que ha sido el precursor,
del inédita.
O se ha creado este mecanismo
para clasificar los datos
en la zona.
Entonces dice.
Bueno, depende de cuándo te
esfuerzas publicar de modo abierto ser posible
y de lanzar tus datos.
Pues tu portal podrá recibir a un
rey una calificación de una estrella,
dos estrellas, tres estrellas,
cuatro 5,
como es.
Si lees el texto, el tema va desde
solamente requerir tus datos.
El formato en el que esté tener
una licencia abierta,
por ejemplo un PDF publicado
en una página web.
Eso es eso puede ser considerado
como el inédita con una
estrella públicas,
una extra es un formato propietario,
pero que es;
es evitable con un montón
de herramientas,
pues ya tendría dos estrellas.
Si haces un esfuerzo mayor
y a otras un estándar que es el
propietario que no pertenece
a una corporación que no ha sido
diseñado por la Corporación
en este caso Michael
usa, por ejemplo, sino
que es abierto,
pues tendría las estrellas
si estas fuerzas
en publicar estos datos ya como
merece seguir los principios
de la web semántica puede
tener cuatro estrellas,
y si ya rizar el rizo y encima
enlaza estos conceptos con otros,
de otros garajes externos al
tuyo, entonces tienes 5.
Esto es exactamente lo
mismo, esta tabla
y ahora vamos a ir escribiendo
una, uno con un ejemplo.
Claro.
Esto que veis aquí sería un
ejemplo de algo publicado
bajo la calificación de una estrella.
Lo que tenemos es un documento doc,
accesible a través de una licencia
abierta.
Cuáles son las ventajas de los datos?
Puede obtener una copia?
Pues una vez que tienes los datos
modificados, hacer lo que quieras,
con ello, para el público cuáles
son las ventajas?
Es fácil publicarlo.
No tiene que tratar los datos apenas,
y no tienen que explicar pues, o dar
explicaciones sobre la empresa.
está descrito en un formato
propietaria
pero altamente popular y la
gente puede hacer uso.
Puede ser un poco más
allá y decir vale?
En primer lugar, he publicado algo
en un formato que no es estructural,
es decir, que es binario.
Son datos binarios leer
en este otro caso.
Puede que los datos sean binarios,
pero son estructurados;
hay muchas utilidades que pueden
extraer las celdas,
las tablas las filas, las columnas
de su documento.
Sería publicar algo, por ejemplo,
como un examen,
tal como el que veis aquí a leer.
Como consumidor, tú puedes
procesar directamente
el fichero, usando software
propietario
para luego hacer cálculos
visualizaciones,
y luego puedes tú por supuesto,
transformar esos datos.
En otros formatos para el público
mantiene las ventajas
de la época anterior y es
bastante sencillo,
aunque se ha esforzado
un poquito más.
En vez de publicar algo
como Documentos,
Wall, que no tiene una estructura
que programática mente
puede ser tratada, la, publicada
como Nextel,
que hay muchas librerías,
aguas que permite programática,
tratar esos bien,
el paso tres es vaya más
allá; nuevos formatos,
propietarios usemos un formato,
que es libre;
alguno de los que veis
aquí en pantalla,
como por ejemplo XML v r, deje,
y encima es estructurada.
Ese es el formato hacerse v,
aparecen en primer lugar
en la primera fila,
lo que son las cabeceras, las
columnas de una tabla
y luego por cada fila, por cada
línea hay una fila y las columnas
de la fila están separadas por comas.
Como veis?
Aquí por eso se llama Coma, se pare.
Vale.
Hay otro formato que es el
té ese, v fabulador,
se para ti Bailly.
Bien, pues aquí estamos viendo
un ejemplo que muestra datos
sobre los accidentes en
carreteras, en 2006,
en algún lugar geográfico.
Ventajas para el consumidor.
No puedes manipular fácilmente
los datos,
y encima usar cualquier lenguaje
producción, cualquier librería,
para hacerlo,
no está restringido a utilizar
una herramienta que es capaz
de entender algo propietario.
Ahora publicado por Bueno,
relativamente sencillo,
de publicar aquí tienen que
hacer un esfuerzo,
un poquito extra.
Tienen que abrir, por ejemplo,
este fichero,
y ya lo tenían en un excel y en
vez de exportarlo como nexo
con exportan en un formato abierto,
como cese o normas
como el que permiten fácilmente,
pasarlos o transformarlos.
Las cuatro estrellas, pues aquella
queremos ir más allá
y queremos modelar estos
datos estructurados,
haciendo que encima tengan para
identificar los conceptos.
Ha descrito lo que veáis en pantalla
es un ejemplo del portal de datos
abiertos español.
Datos punto es que lo hace también.
Al igual que el europeo, indexar
todos los datos que son publicados
por las administraciones públicas
en España y yo voy Estado o rl
que veis aquí pues básicamente
estuviera accediendo
a la visión a la parte de un recurso
identificado por el sabor
y que resaltó.
Estoy diciendo que este recurso está
publicado con una licencia
abierta y está distribuido
en diferentes formatos.
De hecho,
pertenece al portal de datos
abiertos de el Ayuntamiento de Santander
junto con el Ayuntamiento
de Zaragoza .
Quizás son los ayuntamientos que
tienen portales de laudos
abiertos más sofisticados,
bale entonces aquí véis
que esta información puede
ser, visualiza,
hable de diferentes modos en html,
una visualización que por cada
comercio básicamente
está describiendo.
Si quitas.
Bale estaba,
me he perdido con.
Que siempre ayuda.
Vuelvas transparencias, a complicar
aquí otra vez.
Lo que quería enseñar
es que este recurso lo lo
lo bonito que tiene,
es que también los mismos contenidos
los está exportando.
Por ejemplo, en parte que es un.
Una señalización bastante
más entendible,
más legible, para los seres humanos,
la hubiera descargado mejor
si la descargó aquí como.
Me pongo en.
Y voy a ponerlo como lo es.
Vamos a ver si ahora lo vemos de
una manera digna en pantalla,
mal no, porque no es portado como
agradece Simeone, bueno.
Bien, esto ya tiene un formato más
como el que yo quería mostrar
al final en tres es un súper
conjunto de tarde.
Es una manera estabilizar.
Ya veis que aquí aparecen filas.
Bueno, más o menos las los
seres humanos entendemos
que es lo que están describiendo
que cada comercio
y por cada comercio soy
de su nombre, su a,
que se dedica el código Postal,
cuando fue creado y así con
cada una de las tiendas,
en este caso de Santander, que cuyos
datos han sido exportados
como a leer qué ventajas
para aquellos
que queramos explotar estos datos
tiene enlaces este documento
a otros recursos, entre ellos todos
aquellos que pertenecen
a la misma categoría
pues apuntan al concepto categorías
como, por ejemplo, moda.
Yuca.
Puede estar además fácilmente pasar
un enlace a una de las entidades,
a alguien para informarle
de sus datos
puedes combinar de una
manera sencilla,
otros para el publicado otros
publicados de datos.
Ahora podrían establecer enlaces
a tu brazo, aldeas, tiendas,
en este caso en Santander.
Imaginemos que por ahí alguien que
sentando crear un catálogo
de los comercios de todas
las ciudades españolas
es lo que podríamos hacer
en este catálogo
es ir apuntando a los catálogos
de cada una de las ciudades
y, como publicado ahora encima,
pues puedes tomar
de ejemplo el vocabulario que
está siendo utilizado
para publicar las tiendas de
Santander y hizo lo propio tú bien
para introducir nuevas
tiendas a Santander
o para crear tu propio catálogo
de comercios
y otra ciudad.
Obviamente, esto es más costoso,
mucho más costoso que el que publica
lo que es para nosotros formatos
o o maneras de crear, y, obviamente,
también, inéditas
estable en alguien que en personal,
y se asegure que la calidad
de lo que portas es
esta es la primera final no
terminado a finales,
tener formatos, datos
enlazados a otras,
a otros que estamos viendo
cómo desde una página
que habla de un ministerio
este caso de Grecia,
se puede apuntar a una secretaría
dentro de ese ministerio
y, bueno, básicamente lo que hay.
Ahí es al fin y al cabo.
Enlaces todos lo lo lo bello
de tenerle inédito Cinco
-Estrellas, es que fácilmente puedes
ir descubriendo datos relacionados,
puedes combinar datos de
distintos tus datos,
son más fácilmente descubrirles,
pero bueno,
tienes que invertir bastante
dinero y esfuerzo
en conseguir publicar los
datos de Samuel.
Pues bien, entonces sí
si os preguntáis
como transformaría el portal
web de mi organización,
en un portal de datos enlazados,
cuales son,
cuáles son los los pasos
que quede seguir,
no como publicados.
Relatos como responsable,
tendré que empezar con algunos
conjuntos de datos,
no voy a lanzarme a la piscina
y publicar todo
como y directamente te
sale una selección,
aquí es la tasa más importantes,
además de mayor relevancia
para el público.
Luego tendré
que seleccionar algunos modelos
para representar tales datos
y finalmente procede
a la publicación.
Si yo soy alguien que quiere
innovar en cierto sector,
lo que tengo que hacer es ir a
catálogos de datos públicos
de cierto sector de tal sector, por
ejemplo, el sector energético,
el sector de la educación imaginaos,
que queremos crear una herramienta
que recomienda el grupo de
investigación de la universidad
a debería mezclarse con que otro
grupo de investigación
de la Universidad ve para
conjuntamente,
tener más posibilidades de concurrir
a convocatorias de proyectos
para hacer eso, pues obviamente
tengo que seleccionar.
Qué voy a utilizar.
Tendré que establecer
puentes entre ellos
si no existe, tendrá que integrarlos,
y en acciones en ocasiones
podría incluso generar
como resultado una peseta agregado.
Bien, ya hay obvias ventajas de
subirse a esta iniciativa
o a esta visión de cómo mejorar
la transparencia,
como también, pues seguir
cierta legislación
que se está publicando sobre cómo
hay que hacer un mejor servicio
y rendición de cuentas públicas
a la ciudadanía.
Podemos mejorar la audiencia,
podemos hacer que los datos
que son de todos,
pues al fin y al cabo sean
utilizados mejor y de una manera sencilla,
bale.
Hay que tener en cuenta que
cuando datos tenemos
que modelar también los metadatos
para incrementar el valor
de aquellos datos que publicamos,
tenemos que licencias abiertas
y algo muy importante donde
quiero incidir.
Para acabar mi sesión es el tema,
tenemos que tener cuidado,
que lo que publicamos que sea
lo más correcto posible
y que tenga bueno, que esté limpio,
que éste esté depurada.
Entonces esto debe depurar datos,
pues es una tarea compleja,
una tarea costosa en tiempo y dinero,
pero necesaria para que para
corregir errores,
para asegurarse que usamos
formatos homogéneos,
para resolver, inconsistencias,
entrenadas y mitad metadatos todos
para eliminar duplicados.
Bien, afortunadamente, sobre todo
cuando trabajamos con datos,
es un formato muy común de
exportar información.
Hay herramientas libres,
como esta, que veis aquí o pez Rifai,
que te permite de una manera
muy intuitiva
importar.
Ese es eliminar duplicados,
hacer cosas
como la que habéis aquí claro que
aquí tenemos una tabla con Valores,
donde como veis las fechas cada
uno las ha indicado,
como le ha venido de engaño, las
direcciones de correo electrónico
y algunos que no las han escrito
de manera correcta.
Hay columnas que no tienen valores,
hay maneras distintas
en diferentes idiomas de publicar
datos de los países.
Entonces esto, diríamos, la parte
azul es una chapuza.
Es una mala manera de publicar
datos en enlazados,
porque si tú quieres procesar
esta con un programa,
pues tienes que tener
un programa lleno
de excepciones lleno de valoraciones,
complicaría sobremanera su lógica
y que estaría sujeto
a los cambios arbitrarios de
formatos por aquellos que publican los datos.
Todas.
Hay procesos que se encargan de
generar estos datos más limpios.
Eso es lo que es el clima sin es
lo que hacen herramientas
como bale final sí publicamos.
Nuestra misión final es romper los
silos de información que hay
detrás de nuestras organizaciones.
Queremos que otros se den cuenta de
la riqueza del conocimiento,
es interesante para temas
de marketing,
para temas de demostrar el
valor de lo que hacemos.
Aquí tenéis algunos ejemplos,
podrían haber puesto un listado larguísimo
de algunos repositorios de datos
públicos que me parecen reseñables.
Por ejemplo, me parece muy
destacable el portal de datos
de la ciudad de Zaragoza.
Si queréis jugar con datos y ver
como una humillación pública,
una universidad debería
publicar datos.
Bien, recomiendo que visite
este portal,
donde se han esforzado muchísimo,
en alcanzar la excelencia,
en alcanzar las cinco estrellas, en
la publicación de datos abiertos,
y en la zaga; por supuesto
que dos ejemplos claros
de los que ya hice mención en días
anteriores de datos en la zona
ya abiertos son whisky nata,
y el primero, recordar son
repositorio de repletas;
son contribuir por la comunidad
y que no tiene una antología,
es básicamente nombre a describir
tripleta este modo sencillo
y todos podéis participar,
enriqueciendo añadiendo nuevas
tripletes y a través de un mes
parque del, que es el
que estoy apuntando
a qué hora y media es un choque
conjunto de la Wikipedia,
que han extraído las partes, que
son procesales de las páginas,
html los y han ofrecido también un
Spar que le impone a la consulta.
Bien, para acabar simplemente decir.
Si estáis muy interesados
en el portal de la iniciativa aporta
es un portal excelente documenta,
de qué va esto, de crear
datos que dan servicio
y que aporta un valor a la
sociedad y una industria
como vayáis pues tiene
diferentes tareas.
Aporta esta iniciativa del
Ministerio de Innovación
cuyo propósito es impulsar y
coordinar la apertura de datos,
estimular un mercado ligado a la
reutilización de información,
el sector público
y contribuir a favorecer las
condiciones del desarrollo
de la Estrategia Europea
de Datos en España
que se cambie esta iniciativa
es la que vela,
porque cada vez se preste
más atención
a la generación de datos públicos
de valor para todos,
sobre todo para innovadores,
para empresas,
para que los utilicen luego
en sus soluciones.
De hecho, sí aquí vemos empresas
que están utilizando
datos importantes.
Como por ejemplo idealista es bien
conocida por todos nosotros,
que hace un uso extensivo de
todos estos datos públicos
que veis aquí el catastro.
Además, si tenéis curiosidad,
por favor esa Saguer y esto lo bueno
es que es una realidad,
que cada vez tenemos más datos
siendo publicados y deberíamos
capaces de lanzarnos con
ellos y explotarlos.
Y bueno tiene esta es
este movimiento,
pues tiene un alto potencial
económico y relevancia para sectores
como la agricultura, el turismo, la
energía, sector inmobiliario ale
lleváis algunas aplicaciones para
las cuales los datos públicos
podrían utilizarse en este sector.
Bueno, hemos acabado por eso,
transparencia o se demostrado por eso
los principios del diseño
de ese propósito,
que tiene de facilitar el procesado
enlazado la conexión
entre diferentes datos provistos
por diferentes organizaciones
para crear soluciones
de valor añadido
no siempre es equivalente
open de eta.
Aunque su manifestación más común es
tener la Open de eta y se apoya,
pues en estándares enfoques
tradicionales de la uer
y de las webs se mantenga
como la psoriasis.
Como el lenguaje agradece Sparks
y entre sus muchas múltiples
ventajas inédita,
integración con sistemas antiguos,
delegado negro,
así permite la interoperabilidad
semántica y da lugar
a la creatividad, a la innovación,
aquí tenéis referencias
a a básicamente
al trabajo que he utilizado o
las hace a los documentos
que utilizado para generar
esta presentación
concretamente admito clonado
una parte importante
de esta presentación
que está enlazada,
y eso es todo lo que quería
contar de momento.
Ahora, el turno de preguntas
o consultas.
Qué pasa Maite?
Que no se puede acceder
al enlace compartido?
Mal.
La.
Vale, vale, si hay esto, es un
todo si se podía decir,
pero que algunos hayan podido hacer.
Queréis hacer alguna consulta.
Podéis hablar también de
no es obligatorio
que lo hagáis por horchata josefa.
Tiene un problema con el
micro y no puede,
aunque quisiera hacer consultas.
Bueno, pues ahora supuestamente
mi colega Esteban
va a tomar el control.
Vamos a ver si se incorpora.
Voy a consultarle.
Cómodo se conecte.
Le voy a ceder el rol de moderador y
es que ese es su buena compañía.
Quizás alguno de vosotros se va
a conectar luego la sesión
de de Haika y de arriesgarse a.
Voy a hablar con Jiménez.
Ahora que me dice.
Se merece que le espere un minuto.
Mientras tanto, si quieres
preguntarle algo,
adelante.
En principio todo.
Claro, hasta el momento
ya todo esto está siendo
algo muy novedoso,
por lo menos por mi parte,
pero la verdad
es que no lo hace sencillo,
dentro de toda la complejidad
que tiene este tema.
Claro, me alegro que
aparecido su tema,
voy a darle permisos a Esteban.
Gracias.
Tengo que a no disculpas a Jesús
sin querer disculpas
Jesús tras hacerme hacer respirador.
Yo ahora decir si puedes hacer un
esperado, por favor, vale,
como sería la grabación, la pararla.
Bueno, yo yo voy a parar la
grabación, no, yo tampoco puedo.
Era los llamados a las personas,
no tiene que haber un momento, que
es que estoy viendo la pantalla,
a ver si soy, sí sí la está salvando
en la nube Diego,
sino porque es un poco problema
de grabar el disco duro.
Pero bueno, vale, pues si continúa
yo a recibir enlace continuo
y han dejado buena compañía
aquí con la mano.
Gracias Diego Gracia, no.
Bueno.
Nada.
Voy a compartir pantalla.
Buenos días en Diego
se ha hecho una presentación
genérica de de lo que se trata,
la relación con Open Data
en la relación
o la cómo surge el inquieto Penat
a partir de la definición
de una serie de estándares
de la web semántica
y cómo al final lo que
se gusta llegamos
es él ofrecer, digamos, la
trastienda de las de las webs enlazadas,
que serían los datos que
soportan esas webs.
Es decir, ahí hay un hay una
frase de Tim Berners-Lee
en un momento dado que dice.
Dame los datos o algo así.
Entonces él lo que busca el
momento del Open Data,
es ofrecer los datos o
datos de interés,
datos que están tras la información
que se publican,
las las diferentes webs para
los usuarios en general
y también para máquinas.
Vamos a ver ahora en
esta presentación
un poco el enfoque dirigido
hacia Asia.
Bueno, vamos a ver, estos dos
asuntos está en primer lugar, pues bueno,
al proyecto Hércules,
qué relación tiene el espacio
con el Open Data
y qué tipos de lazos externos
tenemos y que supone
tener estos datos?
.
979
01:08:05,020 --> 01:08:06,980
El proyecto de Hércules,
Si recordáis, la la presentación
general
que hicimos ayer a la mañana
era un es un sistema,
sea ésta, está basado en la creación
del Sistema de Gestión
de investigación que va a exponer,
tiene como soporte datos abiertos,
semánticos, para ofrecer
una visión global
de los datos de la investigación del
sistema universitario español.
La idea es mejorar la gestión,
análisis las posibles sinergias
y que hay entre entre
las universidades
y el gran público.
En particular entre las intensidades
y la empresa ha subrayado
sí sí ha subrayado,
en rojo el tema de datos
abiertos se mantiene,
es decir,
desde el desde el primer lugar desde
el primer momento Hércules
es un proyecto que tiene la apertura
de los datos la apertura de los datos
no de cualquier manera sino de
una manera se mantiene.
Entonces esto es, es un,
es un punto de partida
para el proyecto y es un criterio
de de realización del proyecto.
El proyecto tiene que ser capaz
de suministrar este tipo
de información.
Los dos pilares que tiene
el proyecto,
que lo estructura sería,
por una parte,
la construcción de un prototipo
de sistema gestión
de la investigación que
se pero otra parte
está la arquitectura se mantiene
también lo subrayado,
es decir, son los dos puntos
de arquitecturas.
La arquitectura se mantiene,
lo que va a permitir la expresión
de los datos abiertos,
semánticos acuerdo.
El proyecto, como ya dijimos,
se divide entre sus proyectos,
tenemos acción,
tenemos ese eje y tenemos
ha sido la arquitectura, la
arquitectura semántica
infraestructura antológica de los
datos del sistema universal
español en ese sistema de gestión
y el esma, que es el que son.
Los dos proyectos que están
comenzando ahora
son los que van a enriquecer
los datos;
a partir de internet iban
a desarrollar métodos
para permitir análisis.
Entonces aquí de nuevo, desde
el primer momento,
desde el primer momento que se
plantearon estos proyectos,
tenemos el tema de la arquitectura
semántica
la infraestructura antológica,
es decir,
la manera de definir los datos con
estándares de la web semántica
y enriquecerlo a partir de internet.
Son datos a partir de internet,
es decir, no enriquece con otra cosa,
sino con datos.
En cuanto a la definición de ocio,
era el desarrollo de una
plataforma incidente
para almacenar, gestionar y publicar
los datos del sng,
y esto es importante publicar
sería el punto de partida
de nuevo desde el diseño, que tiene
que ser capaz de publicar datos
de la sgae basándose en
las estructuras.
Esto implica que se van a publicar
de una determinada manera,
ese será el prototipo innovador,
sistema de gestión de la
investigación y el esma.
Consiste en identificar,
extraer y analizar
y evaluar conjuntos de
datos relevantes.
Esto se completa partidos,
se completa con datos obtenidos de
información de fuentes externas,
de datos nuevos, de datos enlazados,
es decir, con datos externos.
Esto es lo que comentábamos
el otro día también
en la reunión que comunicación
hay entre los proyectos Segi
y mandada.
Ha sido consolidar datos
el nuevo central
unifica datos, es más
explota los datos
y, es más, se conecta con ese eje,
y esto es lo que dijimos.
Entonces.
Hubo dos cosas que no dijimos
expresamente, que son estas,
que ha sido publicar datos
abiertos y enlazados,
es decir, la esa, esos
datos que quedan ahí
no solamente quedan ahí almacenados
guardados en una caja,
sino que se publican, tienen
que publicarse de manera
abierta y enlazada, y no central,
pública datos abiertos
y enlazados del sistema
universitario español.
Es decir, tenemos el sistema este
que esto es la comunicación,
digamos, las cosas que hace
de cierta manera interna.
Pero las cosas que hacía fuera entre
las cosas que hacían fuera,
los dos socios publican
datos hacia fuera.
Qué quiere decir,
que tanto Hércules Asia Central como
cada uno de las universidades
son servidores el que trata de datos?
Había este simbólico que veis aquí
lo si lo hubiesen una página
de una página por ahí;
no con estos colores
puede ser con otros, pero en general
lo que quiere decir
es que de alguna manera permite
acceder a datos enlazados,
o bien porque hay una descarga
o porque los datos enlazados
están incrustados.
Algo tiene, que quiere decir
que esa página permite enlazar
datos a máquinas.
Estos datos siempre,
aunque pueden tener una
visión para personas
y de hecho suelen tener el
objetivo principal,
es que se pueda reutilizar,
que se puedan reutilizar desde
otros programas; es decir,
que haya máquinas máquinas en
sentido no físico sino lógico;
que puedan reutilizar la información;
hablábamos de limpieza ayer
y decíamos que la rapidez
en la publicación de los datos
abiertos es un factor de innovación,
pero si es incómodo utilizarlo
estos frenos.
Entonces qué posibles problemas
podemos tener al usar datos
abiertos según cómo estén hechos?
El primer problema es
cómo se obtienen.
Hay que descargar un fichero,
hay una pie;
el segundo sería el modelo.
Seat.
Qué modelo de datos está
expuesto es cerrado,
es abierto ese estándar expresivos
extensible luego la relación,
es decir, se pueden los los datos
a es posible acceder a datos
y hacer relaciones entre ellos
o te lo tienes que descargar
y luego tuvieras que
relaciones acceso
está enlazado con fuentes
externas o no?
.
1096
01:14:07,520 --> 01:14:08,480
Esa es decir, no más
que se actualiza,
hable quién es el responsable de
actualizar el propietario
de los datos y cómo se difunden.
Entonces decíamos que en
el caso del Open Data
la obtención de los datos
es mediante una pie.
El modelo se ha abierto, es público,
es estándar, expresivo y extensible
se accede a consultas
de tipos parques
como las que vimos ayer previamente;
se enlaza con fuentes externas
que íbamos a verlo un poco
más en detalle.
La actualización es mediante una
piensa el usuario que reutiliza
los datos.
Se conecta a una pie que siempre
están actualizados mejor.
Se conecta a una pie que ofrece
datos que siempre están actualizados,
porque la responsabilidad es del
propietario de los datos,
sino que lo utiliza y los datos
se difunden vía web
de una manera activa.
Es decir,
que el Open Data es el mejor medio
para publicar datos abiertos,
que esa publicación de datos
abiertos es un requisito de partida,
ya no solo de ha sido sino de
los culés en conjunto.
Otro asunto que comentábamos
ayer respecto a los datos
es que los los datos,
y esto también es un requerimiento
tienen que ser fer,
que significa que tienen que ser
encontrarles accesibles,
interoperable, sí reutilizables-
como dijimos ayer.
Ser también significa
Pues justo bueno,
a los estos principios,
fer proporcionan una serie
de directrices
para publicar los datos de
una manera correcta.
Que permita la reutilización
en mayor grado posible
sean interoperable;
es decir,
que sean qué puedan ser reutilizados
fundamentalmente por otras máquinas
-para mezclarlos combinarlos,
explotarlos hacer representaciones
gráficas
para lo que sea los principios
de estos datos.
Los principios se refieren
tanto a datos
metadatos como infraestructura,
y de nuevo tenemos que los datos
abiertos y enlazados
es el mejor medio para hacer cerca.
Entonces, tenemos dos requisitos,
que los datos tienen que ser
abiertos y se tienen que publicar,
y además, que tienen que ser
entonces la manera de hacerlo como limpieza.
La arquitectura se mantiene,
vimos que teníamos ya un componente
que era el inquieta,
Taseer ver este es el componente
que permite la publicación
de los datos que están
en el almacenamiento
que vivimos ayer.
El textos como datos abiertos
y enlazados el servicio tiene
estas características,
proporciona una interfaz html,
porque es bueno digamos es
esto es una cortesía
hacia las personas,
aunque el objetivo del
servicio principal
tiene que ser la reutilización,
la reutilización,
por parte de máquinas proporcionar
los datos en formato
PDF es lo que sirve para
que una máquina
pueda utilizarlo cumple una
recomendación del estándar.
Luego nos lo explicará esto,
Álvaro un poco más en detalle
en la siguiente sesión,
y cuenta con un servicio que permite
localizar entidades por el nombre.
Este sería el interfaz para personas
en interfaz para datos.
Son los los datos brutos
en el formato rnc,
modelado por la antología.
También teníamos un que permitía
interrogar el gestor.
Esta es la manera complementaria,
digamos para la utilización,
y es importante esto sea, digamos
que el Parque del Buen permite,
a autores y administradores
consultar los datos del brazo de conocimiento
almacenados en el gestor
gestor de la entidad
y en otros esto es importante.
Es decir, a la hora de reutilizar.
Si los datos están lanzados
Podemos en la sala,
entre repositorios y recuperar
información de sitios distintos
a la vez y mezclarlos en
una misma aplicación.
El rdc sorprendentemente esto bueno
ya lo vimos ayer insisto más
es El componente de la arquitectura
que almacena El brazo de conocimiento
en El servidor de ese servidor.
Pero sí que voy a destacar que
proporciona el servicio de datos
y consultas a quien quiera hacer ver.
Si eso les parque pueden que son
las maneras de reutilizarlo.
Teníamos un componente que lo
citamos ayer brevemente, que era.
Hay un componente de la arquitectura,
que es el que se encarga de
hacer el descubrimiento.
Sobre los datos que vienen
de este descubrimiento.
Tenemos tres fases.
La primera tenemos la reconciliación
entonces,
la reconciliación, y esto
es lo que vimos ayer
hay un paso en el que utilizamos
datos obtenidos
en el descubrimiento de enlaces.
Utilizamos.
Los datos abiertos que
hemos obtenido,
el descubrimiento enriquece,
con las fuentes externas.
La detección de equivalencias.
Obtenemos los enlaces a entidades
de otros no sé si es decir,
este es el paso en el que o
con el que conseguimos
que los datos que están cargados
en el cesto estén enlazados hacia
fuentes externas de información
de una manera más segura
y automática.
Entonces, vamos a entrenar ahora un
poco ya en el detalle concreto
de que se hacen.
Ha sido lanzado con datos externos,
tenemos.
Aquí hay que distinguir entre
dos tipos de las aduanas,
la sala de datos o el enlazado.
No es lo mismo hacer tener
un link a una web;
por ejemplo, en el proceso de
descubrimiento Hércules
ha sido obtienen la csa,
fuentes externas,
por ejemplo, la página
de un investigador.
En esta página voy a acceder.
Es la página de Diego López de Ipiña,
pero es una página, una página web.
Esto es la web de tipo convencional.
Sin embargo, sí si lo
hacemos con datos.
Es decir, si mediante un curro
es un comando básico,
hacemos una petición a esta web.
Le aquí lo que vamos a obtener son.
No, no es no es la vista,
sino la vista de los datos.
Voy a hacerlo un momento.
Es decir, si hacemos esta petición.
Lo que vamos a obtener no
no son, no es el html,
sino son unos datos que
podemos reutilizar.
Esto era bueno,
se hace aquí; está haciéndose
mediante.
Esto entonces lo que ha devuelto
aquí pues es son datos
datos en qué formato pues
en formato XML
en el que se lo he pedido aquí.
Esto tiene otros formatos de datos
que puedan reutilizar en este caso.
Bueno, en todos los ejemplos que voy
a poner voy a intentar pedir este.
Entonces.
Digamos que hay una diferencia
entre el azar
con una web que sirve
para una persona,
es decir, yo puedo presentarle al
usuario un enlace o una ficha,
que está en la web de la universidad
y ponerle un enlace
y decir.
Este investigador tiene esta
página en esta otra web,
eso es el enlazado de la uefa,
way web convencional
y otra cosa es que hacemos
datos con datos,
es decir, que el triple o los
triples que están en el receptor,
definiendo a un investigador
tienen un triple,
que lo enlaza con los datos
rdc, que están en otro.
Almacenamiento externo externo,
pero no externo la universidad,
sino externa del país
e incluso que está en Internet y que
permite obtener información,
que se pueda reutilizar.
Entonces, el proceso
de descubrimiento,
el primer paso que tenemos,
el primer enlazado que hay es
con y con otros nuevos
ha sido ustedes.
Este proceso de descubrimiento que
hemos comentado antes incluye
el enlazado de datos con
el nuevo unidad
y, por tanto, con otras
universidades,
es decir, tenemos que vamos a cargar
en la Universidad de Murcia,
vamos a cargar un triple
que va a decir
que el investigador con este.
Con este identificador es el mismo
que un identificador que este, otro,
que este otro, que está en el
lodo unidad en Reino Unido.
Tenemos un triple que dice que este
investigador es el mismo
que un investigador que está
en otro texto diferente,
es decir,
esto que nos permitiría
hacer una aplicación
en la que yo mostrase información
una aplicación estuviera en Murcia
y la que se muestra esa información
obtenida desde el gestor de
la Universidad de Deusto,
automáticamente y con cierta rapidez,
porque el dato está directamente
directamente accesible,
se puede ir navegando entre enlaces
y llevará al candidato a
ese dato final bale.
Entonces tendremos unidad un
conjunto de de triples de este estilo,
pues tantos como tantos
como universidades.
Tengan a este profesor entre
sus propios datos,
es decir, que es lo que va a pasar,
que cada universidad
se va a cargar una publicación.
Imaginemos que hay una publicación,
hecha por cinco profesores,
cada uno de cinco universidades
distintas.
Esa publicación estará en
cada uno de los aseos,
en cada uno de los aseos.
Instalan los cinco investigadores,
uno de ellos con más datos el que
corresponde a la universidad,
pero el resto estarán.
También tienen que estar como
entidades, cada uno
de esos de esos cinco a su vez
estarán enlazados con unidad,
que será donde estén los enlaces a
todos ellos, y de esa manera,
pues se podría ir navegando por el
contenido de un investigador,
en cada universidad.
Otro dato tenemos con qué otros
datos lanzamos con Ortiz,
porque dice.
Es un sistema de vuelos
no sé si conocéis.
Es un repositorio que de de
contenido científico,
que básicamente hace 2, dos
cosas tiene proporcionado
un identificador único y persistente,
acaba investigador único
en todo el mundo
y recoge información de su
producción científica.
Entonces una cosa que hace
es ofrecer sus datos.
Esos datos que hemos visto antes,
que tienen una, una, una presentación
teme que se está aquí la que estaba
haciendo la de Diego
tiene una vista en formato.
Es decir, podemos acceder a los
datos de este investigador,
los datos que han ocasionado
esta presentación web.
En realidad a los datos que
están detrás de la web.
El tipo de petición que acepta
pues es su un gueto,
este sea en este caso, digamos,
estamos pidiendo la misma hora,
pero con un pidiéndole,
en este formato
y lo que vamos a obtener, es un
XML, pues con la información,
con toda la información
de este usuario.
El siguiente que tenemos
con el que lanzamos
sería de Dembélé es una,
es un sitio web,
un repositorio de parecidas, pero
dedicado solamente a temas
de de ti, de Tecnología
de la Información,
y la comunicación de aquí
es un poco diferente.
No tenemos así como en aquí teníamos,
llevamos, la es la misma.
Uri la misma web en la que devuelve
html o redes en función
de la petición.
En el caso de lo que hacen
es poner un enlace,
poner un punto redes después,
es decir, si yo copió.
Este enlace,
lo que ha hecho es descargar Mel rdc.
Pero sí puedo culpables
y no puedo copiarla.
Este mismo lo devuelves la página
de Diego López de Ipiña.
Aquí tenemos volviendo
a la presentación.
Tenemos un punto.
Tenemos un asunto similar que, bueno,
pues según lo que se
pida, da la boda.
El tesoro de la Unesco,
el de la Unesco,
es es bueno no decirlo
gracias a una lista,
tienen un origen bastante antiguos,
del año 70 luego creo
está actualizada,
pero es una lista controlada,
estructural de determinados
de tipo temático.
Entonces, lo que establece es
el tesoro de la unesco.
Esto queda aquí digamos, tiene
una serie de términos
que permiten sistematizar
el conocimiento.
Hay un proyecto de la Universidad
de Murcia, además,
que ha transformado el
tesoro de la Unesco
en una estructura de propias webs.
Se mantiene formato,
es este proyecto de aquí no
sé si lo conocía, eso no.
Entonces, bueno, esto tiene una
presentación jerárquica
que se puede navegar, y esto sí.
Esto que vemos aquí es la
representación de esta categoría,
de la clasificación de
esta categoría,
del y tenemos aquí el acceso
al rbs de esta categoría.
Es decir, de nuevo podemos enlazar
con datos de qué supone esto que
digamos que si alguien tira,
digamos que si alguien que conozca
el tesoro un un podría desde fuera
leer directamente o conectarse
directamente
aquellos recursos en
el gestor de ocio
que correspondan con esa categoría e
incluso a sus categorías padres,
porque esto está en ese formato
que permite hacer
ese tipo de inferencias hacia arriba.
El siguiente enlace que tenemos es
con la Oficina Europea de Patentes,
la Oficina Europea de Patentes tiene
un proyecto de ley que data,
que que recoge todas las
patentes europeas
estaba actualizado al día.
La verdad es que está bastante bien,
pues aquí se pueden consultar tanto
las tanto las patentes como
las especificaciones,
es decir, todas las entidades
que manejan de patentes
y de clasificaciones son, se pueden,
se pueden consultar en esta web,
pide nuevo, tenemos tanto
la parte de The,
digamos, la parte visual.
Como veis, esto es bastante parecido
a esa representación
que tenemos nosotros en nuestro
que luego se explicará
Álvaro y yo con más detalle.
Esta es la la presentación digamos,
de los datos un poco brutos
para usuarios no dejan de ser una es
una presentación bastante austera,
pero tenemos datos que nos
podemos descargar.
Es decir, tenemos datos, podemos
consumir los datos de links
Open Data que están en ese formato.
Los pueblos nos podemos consumir
a través de estas que conseguimos
con esto,
que una patente que estuviera
cargada de Inaxio
estaría enlazada a su página
web, a sus datos,
sus datos y a su página web.
En la Oficina Europea de Patentes
y por tanto, desde ahí se podría
ser, por ejemplo,
una aplicación que consultara
todos estos datos.
Es decir, no haría falta tener
estos datos cargados,
nació sino que los datos se podrían
mostrar a través de estos enlaces.
Como decía, esa era la la
vista para personas
y esta es la misma vista.
Para máquinas las máquinas tienen
acceso a los datos y bueno,
dentro de estos datos hay enlaces
a otros datos a su vez.
Es decir, los datos enlazados
no son solamente datos enlazados
hacia fuera,
sino también hacia dentro, estarán
enlazados entre sí
con cada uno con su propio modelo.
En el caso de la Oficina
Europea de Patentes
con el suyo, lógico para patentes
en el caso de.
Ha sido con el modelo antológico
de la red de antologías
Hércules.
Volvemos un poco a lo
que decíamos antes,
no el la descripción que hemos
hecho de de los de los tres
grandes proyectos Hércules.
No hay un tercer proyecto,
que se esma, es que lo que hace o
lo que va a hacer básicamente
es enriquecimiento de datos,
y eso es la de.
A partir de internet y desarrollo
de métodos de análisis,
que es la de Mila, pero
métodos de análisis
se entonces es importante, esto
sea una parte muy importante,
es que completa los datos a partir
de la información de fuentes
de datos externas, fuente
de datos externas
entre las fuentes de datos
en general ha abierto
si está ahí desde Internet.
Entonces esto ya es
un poco lo que lo que viene en
los siguientes proyectos,
pero que viene gracias a.
Que a que así está desarrollado
de una determinada manera,
porque ha sido el soporte
de todo esto,
ese modelo antológico
es el que permite hacer
estas explotaciones
y estas incorporaciones de
datos hasta entonces
qué datos vamos a tener
o vamos a incorporar.
Por una parte,
vamos a tener datos de estos, son
datos de carácter general,
que están de carácter enciclopédico,
que están extraídos de la Wikipedia.
Son dos proyectos distintos,
debe, pedía, es un proyecto
más con intervención,
más humana está un poco
más mecanizado.
Vamos a verlos de momento.
Bale esta sería la página de
Murcia, el municipio,
porque la provincia va a tener otro.
Entonces es el tipo de entidad
y además estos son datos.
El tipo de datos que te
puedes encontrar en.
Es que qué tipos de enlazados
hay que tener?
Pues bueno que si saber este es
un poco de tipo trivial,
pero si hay alguien que pone
que que hay algún dato que está
posicionado en Murcia.
Si de Murcia ciudad no te
hace falta tampoco
tener todos los datos de Murcia
directamente en tu sistema,
sino que pueden recurrir a los
datos que están aquí detrás
y mostrar información contextual
de algún tipo del tipo
que te interese, por ejemplo.
Pues si disculpa, está por ejemplo
lo que comentábamos el otro día
de la del posicionamiento.
Bueno, esto es, por ejemplo, cuál
sería la las temperaturas.
Creo que son tío, las temperaturas
medias por mes,
un día.
Si tengo algún dato.
Por ejemplo, si se quisiera
hacer una aplicación,
como comentábamos ayer,
de posicionamiento,
estos datos se pueden recuperar
desde aquí
y con esos datos te podrías
pintar ya,
pues por ejemplo un mapa sin tener
esos datos, tu directamente
en tu sistema es bueno
pero como digo,
es de carácter enciclopédico.
No sé si miramos por aquí pues bueno.
Personajes famosos de Murcia,
Rafael Moneo, es murciano.
Algunas relación bien en este
sería el caso de Grecia.
Si nos vamos a ir nota.
Vemos una presentación, es un
poco distinto, pero bueno,
tenemos una cosa parecida.
Aquí esto es una representación
muy austera,
de los datos que en realidad están
detrás de un teléfono
tenemos estos dos proyectos que
son de tipo de tipo general.
Tenemos otro, por ejemplo,
meses de términos en el ámbito
de la medicina,
es decir, vamos a enlazar con los
resultados de investigación
con términos estandarizados que
están en una antología; disculpas,
que se mes.
En este caso, es una puntilla.
Estoy contento, he puesto.
Esto sería un es un diccionario de
términos determinados médicos,
por ejemplo.
Pues.
Esto sería un término médico,
con el que el azar y una manera
de esa ambigüedad
de nuevo te puedes conectar
con datos.
Tenemos el cese o que
son aparecido para.
Temas de computación e informática.
Tenemos la bne, los datos de
la Biblioteca Nacional,
en el que tenemos tanto podemos
acceder tanto a tantos libros
o publicaciones de tipo, también
científico-técnico,
que hay bastantes que tienen
que ver con ámbitos que ya
no son tan tecnológicos,
que pueden estar más en el
ámbito de la sociología,
el derecho o similar, y tenemos
es bueno estos datos que son
de de sexo tanto de publicaciones
como de temas.
Qué más que más vamos a tener!
Vamos a tener un diccionario médico
que se meterá de terminología médica.
Vamos a tener la terminología
clínica integral,
que también es una normalización
de nombres para medicamentos,
y esos puntos suspensivos que
dice que vamos a tener más
porque, bueno, pues porque
va a haber más.
Entonces, bueno, esto desde el punto
de vista de sistemas vamos
a verlo luego en la presentación
que va a hacer Álvaro.
El asunto es que esto supone
un un estrés añadido
para los sitios que ofrecen datos.
Es decir, ya no es solamente
una web que ofrece
un html para ser consumido
por las personas,
sino que ofrece unos datos bueno del
html también hay veces que es
consumido por las, por las máquinas,
porque llegan a indexar, no, pero,
pero en el caso de que se ofrezcan
datos ya es algo específico,
está sufriendo datos directamente,
y eso supone un estrés añadido
a los sistemas que tienen
que conocer, y ese estrés
añadido puede venir,
además de sitios muy diversos.
Pueden ser tanto de gente que estén
deseando esta información a saber
para qué o de gente que realmente ha
enlazado estos datos con los suyos,
y eso está provocando una serie de
consultas que te van a exigir más
a los sistemas que lo que sería
una web convencional.
Entonces, según vaya creciendo.
Esto lo esperable es que ese tipo
de tráfico vaya siendo mayor.
Entonces es es algo que creo
que tenéis que conocer
desde el punto de vista de sistemas
para pensar, plantear bueno,
en función del tipo de cosas
que yo estáis haciendo
en otros sitios que tenéis que hacer
para proteger estos sistemas
o para monitorizar estos sistemas
y que el uso sea el que
nosotros consideramos
que tiene que ser y no el
que un bote chino ruso,
desde donde sea, pues piense
que tiene que ser.
Entonces con esto acabamos
la presentación que era,
que creo que era, era un poco
el conjunto de Diego
y la mía se quedó corta.
Entonces, bueno, lo que queríamos
era eso que era importante,
que conociera esta faceta
del proyecto,
porque porque bueno,
igual no nos afecta directamente
en cuanto a uso,
pero si afecta en cuanto a sistema,
si tienes que saber por qué es
decir, va a haber datos,
legítimos, saber usos, legítimos,
usos no tan legítimos,
pero uno de los hechos
previstos que tiene
ha sido el que la gente se pueda
hacer con los datos de Asia
y tenéis que estar, tenéis
que conocerlo
y tener las medidas oportunas de
monitorización y de control.
Vale?
Tienes alguna pregunta.
Yo, en principio no van
a su compañero,
tendrán algo que preguntar por ahí.
Se escuchan, se ha escuchado.
Qué os parece este asunto?
Pensáis que os podéis ver afectados,
que nos podéis ver afectados,
que es algo de lo
que preocuparse igual,
no a corto plazo,
pero a medio plazo sí que es algo
que tenéis que conocer.
Creo se van conociendo toda
la temática de la punta,
que al final se puede,
en un momento dado.
Sabe por dónde puede venir, mayo,
cómo puede ir mejorando la cosa,
teniendo un conocimiento global,
que no todo boca a la persona
de una cosa,
sólo teniendo conocimiento global
de todo esto, sí creo que,
como he dicho, creo que es
importante que supiera, y eso,
que esta otra faceta del proyecto
ha sido que no es.
Tiene como tiene 3, no obtiene
2, una de ellas
que se viviendas no tiene,
por una parte, la lo
que sería cargar datos,
y se que esa parte nuclear
importante,
luego tiene una parte que es de
publicación de esos datos,
y esa parte tiene 2.
Una es que es una web convencional
en la que los datos se pueden
consumir por personas,
pero luego tiene esa otra parte.
Es que los datos se pueden consumir
por máquinas y potencialmente puede
ser una explotación que tenga
cierta importancia,
sobre todo igual no tanto
por por usos legítimos,
sino por gente que haga cosas raras
que se pone a indexar,
porque sí o que entonces él,
el que se países o que tiene
esa naturaleza.
Creo que sea una cosa fundamental
para no tener sorpresas.
Luego.
Sí luego, aparte, bueno, como
cultura en general está bien.
No todo van a ser cómodo,
como decía un profesor que tenía yo
no todo van a hacer pan galletas
también en la informática
y otras cosas.
Pues si queréis, si no
tenéis ninguna duda,
a ver, teníamos la siguiente sesión
con Álvaro ya la tenemos prevista
a las 11 cuarto.
Si queréis, hacemos una pausa
y seguimos a las 11 cuarto
por mi parte.
Vale, vale, pues voy a
parar la grabación.
Momento.