/ 15 de julio de 2021

Buenos días a todos los seguidores de la Oficina de Software Libre de la Universidad de Granada. Soy Juan Manuel López Castro, el encargado de actualizar el portal de datos abiertos de la UGR . En este primer post voy a realizaros una breve introducción a los conceptos básicos sobre el «open data» y algunas consideraciones que se deben de tener en cuenta a la hora de proceder a publicar conjuntos de datos.

Además de este post, tenemos más post sobre datos abiertos como por ejemplo, La Universidad de Granada, transparencia y datos abiertos, Open Data UGR apuesta por el gestor de contenidos Drupal, Conjuntos de datos abiertos, etc.

Open data o datos abiertos, ¿qué son?

Tanto el gobierno, como la mayoría de las administraciones públicas, disponen de una gran cantidad de datos. Algunos de estos datos son generados por los ciudadanos como por ejemplo, datos de circulación, tráfico, etc. También datos sobre niveles de CO2 en la atmósfera, climatológicos, geo-espaciales, etc.

Todos estos datos pueden ser publicados y liberados, para poder realizar investigaciones sobre ellos y obtener conclusiones muy relevantes para llegar a innovar en tecnologías y aportar un valor extra. Este sería el objetivo del «open data», la liberación de conjuntos de datos de gran valor.

Sin embargo, a la hora de publicar conjuntos de datos, se deben de tener en consideración unas condiciones que deben de cumplir. Estas condiciones han sido redactadas por Barbara Ubaldi en Open Government Data: Towards Empirical Analysis of Open Government Data Initiatives.

Las condiciones son las siguientes:

  • Completos. Completos y públicos, sin estar sujetos a condiciones de privilegios o limitaciones de uso.
  • Puros. Utilizar un formato raw.
  • Disponibilidad. Deben de estar actualizados y recientes, ya que esto aumentará su valor.
  • Accesibilidad. Accesibles para todos los ciudadanos.
  • Procesables en computadores. Formato digital y bien estructurados.
  • No discriminatorios. Para hacer uso de los conjuntos de datos, sería recomendable no requerir un registro o autenticación de usuario.
  • Sin propiedad. No pueden ser propiedad de ninguna entidad.
  • Licencia gratuita. No puede haber derechos de copyright sobre los datos abiertos, aunque en algunos casos puede haber restricciones sobre privacidad o seguridad.

A parte de estas condiciones, la Royal Society, definió que los datos abiertos deberían de ser FAIR. Esto quiere decir que deben de ser findables (F), accesibles (A), interoperables (I) y reusables (R).

Nivel de madurez

Una de las consideraciones más importantes a la hora de publicar conjuntos de datos en un portal de datos sería el formato y estructura que elegimos para nuestros datos. Cuanto mejor estructurados estén y su formato este más estandarizado, mayor será su valor, su interoperabilidad y su nivel de reutilización.

Para este proceso tan completo Tim Berners-Lee propuso un sistema para medir la calidad de los datos. Para ello definió cinco niveles diferentes de madurez:

  • Nivel 1, donde tenemos datos sin ningún nivel de estructura. Es el caso de archivos en formato pdf, imágenes, vídeos, etc.
  • Nivel 2, donde se utiliza un nivel de estructura que es apoyado por un software. En este caso tendríamos los conjuntos de datos en formato Excel.
  • Nivel 3, donde no se utiliza ningún software propietario para dar el formato. Sería el caso de archivos en texto plano con estructura .CSV.
  • Nivel 4, donde se utiliza el estándar RDF y donde los datos estructurados están identificados mediante URIs.
  • Nivel 5, en este último nivel los datos además de estar identificados mediante URIs como en el nivel anterior, se añade la características que de están en lazados entre sí, dotando así a los conjuntos de datos de un contexto.
Fuente

Cuanto mayor sea el nivel de madurez, mejor será la estructura de datos utilizada y por consiguiente la calidad de los datos será también mayor.

Beneficios, impulsores y barreras

Como todo en esta vida, el proceso del open data tiene sus ventajas, situaciones que impulsan a liberar conjuntos de datos y otras situaciones donde las entidades no ven tan claro que el open data sea aconsejable para ellos.

Con respecto a los beneficios que trae consigo el open data nos encontramos con que ofrece conjuntos de datos de gran valor, donde aplicando técnicas de BigData e Inteligencia Artificial, se pueden realizar investigaciones y obtener conclusiones muy relevantes. Además la liberación de estos conjuntos de datos ofrece la posibilidad a la creación de nuevas empresas, que tengan como objetivo el análisis y explotación de dichos datos. Por último cabe destacar que las entidades que realicen la liberación de datos aumentarán su nivel de transparencia con el ciudadano y por consiguiente el nivel de confianza entre ambos (ciudadanos y entidades públicas).

Por otro lado tenemos a las situaciones que impulsan y que frenan el desarrollo del open data:

  • Dentro de los impulsores del open data nos encontramos con que suelen venir que fuera de la entidad pública o del gobierno en cuestión. Son por ejemplo, la presión ciudadana por conocer datos públicos, iniciativas, nuevas tecnologías emergentes para la explotación de datos, etc.
  • Dentro de las barreras, nos encontramos que se diferencian en tres tipos:
    • Barreras culturales. Son barreras que vienen dadas por la falta de compromiso de las entidades públicas por temor a la perdida de control debido a la publicación de datos. Se necesita de un gran compromiso político para transformar la mentalidad de estas entidades públicas.
    • Barreras legales y organizativas. Con respecto a las barreras legales y organizativas nos encontramos con la existencia de lagunas legales y normativas, que dificultan la creación de servicios de open data, que faciliten la publicación e intercambio de conjuntos de datos.
    • Barreras prácticas y técnicas. Esta barreras son las relacionadas con el lenguaje y la estructura de los conjuntos de datos.

Estrategias destacadas

Para ir finalizando con este primer post sobre open data, sería interesante comentar las estrategias que han llevado a cabo ciertos países a la hora de proceder a la apertura de datos. Estos datos fueron obtenidos de un papers de Google Schoolar (Open data: an international comparison of strategies), donde se analizaba las estrategias llevadas a cabo por España, Australia, Dinamarca, Reino Unido y Estados Unidos; y se obtenía como denominador común tres estrategias o motivaciones finales.

Estas estrategias fueron las siguientes:

  • Aumentar el derecho democrático y la participación política. Esto se justifica debido a que la mayoría de los países estudiados coincidían en que en una democracia moderna el ciudadano debe de estar informado sobre los datos públicos de su gobierno.
  • Fomentar la investigación e innovación. Al llegar a publicar conjuntos de datos de alto valor, pueden surgir empresas TIC dedicadas al estudio y explotación de estos conjuntos de datos. También sostienen que la publicación de estos datos trae consigo un gran valor económico.
  • Fortalecer la aplicación de la ley. Esta última estrategia trata sobre como hacer al ciudadano más participe de un gobierno. Al aumentar la transparencia los ciudadanos se involucran más con el gobierno y cuestión y aumenta el cumplimiento de las leyes.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Web Campus Infantil
Logo y enlace Web Campus Infantil 2021
Web SereIngeniera
Logo y enlace Web SereIngeniera 2021
PyconES 2022
Logo y enlace PyconES 2022
Humor
Humor
Archivos
Categorías