/ 15 de julio de 2021

Buenos d铆as a todos los seguidores de la Oficina de Software Libre de la Universidad de Granada. Soy Juan Manuel L贸pez Castro, el encargado de actualizar el portal de datos abiertos de la UGR . En este primer post voy a realizaros una breve introducci贸n a los conceptos b谩sicos sobre el 芦open data禄 y algunas consideraciones que se deben de tener en cuenta a la hora de proceder a publicar conjuntos de datos.

Adem谩s de este post, tenemos m谩s post sobre datos abiertos como por ejemplo, La Universidad de Granada, transparencia y datos abiertos, Open Data UGR apuesta por el gestor de contenidos Drupal, Conjuntos de datos abiertos, etc.

Open data o datos abiertos, 驴qu茅 son?

Tanto el gobierno, como la mayor铆a de las administraciones p煤blicas, disponen de una gran cantidad de datos. Algunos de estos datos son generados por los ciudadanos como por ejemplo, datos de circulaci贸n, tr谩fico, etc. Tambi茅n datos sobre niveles de CO2 en la atm贸sfera, climatol贸gicos, geo-espaciales, etc.

Todos estos datos pueden ser publicados y liberados, para poder realizar investigaciones sobre ellos y obtener conclusiones muy relevantes para llegar a innovar en tecnolog铆as y aportar un valor extra. Este ser铆a el objetivo del 芦open data禄, la liberaci贸n de conjuntos de datos de gran valor.

Sin embargo, a la hora de publicar conjuntos de datos, se deben de tener en consideraci贸n unas condiciones que deben de cumplir. Estas condiciones han sido redactadas por Barbara Ubaldi en Open Government Data: Towards Empirical Analysis of Open Government Data Initiatives.

Las condiciones son las siguientes:

  • Completos. Completos y p煤blicos, sin estar sujetos a condiciones de privilegios o limitaciones de uso.
  • Puros. Utilizar un formato raw.
  • Disponibilidad. Deben de estar actualizados y recientes, ya que esto aumentar谩 su valor.
  • Accesibilidad. Accesibles para todos los ciudadanos.
  • Procesables en computadores. Formato digital y bien estructurados.
  • No discriminatorios. Para hacer uso de los conjuntos de datos, ser铆a recomendable no requerir un registro o autenticaci贸n de usuario.
  • Sin propiedad. No pueden ser propiedad de ninguna entidad.
  • Licencia gratuita. No puede haber derechos de copyright sobre los datos abiertos, aunque en algunos casos puede haber restricciones sobre privacidad o seguridad.

A parte de estas condiciones, la Royal Society, defini贸 que los datos abiertos deber铆an de ser FAIR. Esto quiere decir que deben de ser findables (F), accesibles (A), interoperables (I) y reusables (R).

Nivel de madurez

Una de las consideraciones m谩s importantes a la hora de publicar conjuntos de datos en un portal de datos ser铆a el formato y estructura que elegimos para nuestros datos. Cuanto mejor estructurados est茅n y su formato este m谩s estandarizado, mayor ser谩 su valor, su interoperabilidad y su nivel de reutilizaci贸n.

Para este proceso tan completo Tim Berners-Lee propuso un sistema para medir la calidad de los datos. Para ello defini贸 cinco niveles diferentes de madurez:

  • Nivel 1, donde tenemos datos sin ning煤n nivel de estructura. Es el caso de archivos en formato pdf, im谩genes, v铆deos, etc.
  • Nivel 2, donde se utiliza un nivel de estructura que es apoyado por un software. En este caso tendr铆amos los conjuntos de datos en formato Excel.
  • Nivel 3, donde no se utiliza ning煤n software propietario para dar el formato. Ser铆a el caso de archivos en texto plano con estructura .CSV.
  • Nivel 4, donde se utiliza el est谩ndar RDF y donde los datos estructurados est谩n identificados mediante URIs.
  • Nivel 5, en este 煤ltimo nivel los datos adem谩s de estar identificados mediante URIs como en el nivel anterior, se a帽ade la caracter铆sticas que de est谩n en lazados entre s铆, dotando as铆 a los conjuntos de datos de un contexto.
Fuente

Cuanto mayor sea el nivel de madurez, mejor ser谩 la estructura de datos utilizada y por consiguiente la calidad de los datos ser谩 tambi茅n mayor.

Beneficios, impulsores y barreras

Como todo en esta vida, el proceso del open data tiene sus ventajas, situaciones que impulsan a liberar conjuntos de datos y otras situaciones donde las entidades no ven tan claro que el open data sea aconsejable para ellos.

Con respecto a los beneficios que trae consigo el open data nos encontramos con que ofrece conjuntos de datos de gran valor, donde aplicando t茅cnicas de BigData e Inteligencia Artificial, se pueden realizar investigaciones y obtener conclusiones muy relevantes. Adem谩s la liberaci贸n de estos conjuntos de datos ofrece la posibilidad a la creaci贸n de nuevas empresas, que tengan como objetivo el an谩lisis y explotaci贸n de dichos datos. Por 煤ltimo cabe destacar que las entidades que realicen la liberaci贸n de datos aumentar谩n su nivel de transparencia con el ciudadano y por consiguiente el nivel de confianza entre ambos (ciudadanos y entidades p煤blicas).

Por otro lado tenemos a las situaciones que impulsan y que frenan el desarrollo del open data:

  • Dentro de los impulsores del open data nos encontramos con que suelen venir que fuera de la entidad p煤blica o del gobierno en cuesti贸n. Son por ejemplo, la presi贸n ciudadana por conocer datos p煤blicos, iniciativas, nuevas tecnolog铆as emergentes para la explotaci贸n de datos, etc.
  • Dentro de las barreras, nos encontramos que se diferencian en tres tipos:
    • Barreras culturales. Son barreras que vienen dadas por la falta de compromiso de las entidades p煤blicas por temor a la perdida de control debido a la publicaci贸n de datos. Se necesita de un gran compromiso pol铆tico para transformar la mentalidad de estas entidades p煤blicas.
    • Barreras legales y organizativas. Con respecto a las barreras legales y organizativas nos encontramos con la existencia de lagunas legales y normativas, que dificultan la creaci贸n de servicios de open data, que faciliten la publicaci贸n e intercambio de conjuntos de datos.
    • Barreras pr谩cticas y t茅cnicas. Esta barreras son las relacionadas con el lenguaje y la estructura de los conjuntos de datos.

Estrategias destacadas

Para ir finalizando con este primer post sobre open data, ser铆a interesante comentar las estrategias que han llevado a cabo ciertos pa铆ses a la hora de proceder a la apertura de datos. Estos datos fueron obtenidos de un papers de Google Schoolar (Open data: an international comparison of strategies), donde se analizaba las estrategias llevadas a cabo por Espa帽a, Australia, Dinamarca, Reino Unido y Estados Unidos; y se obten铆a como denominador com煤n tres estrategias o motivaciones finales.

Estas estrategias fueron las siguientes:

  • Aumentar el derecho democr谩tico y la participaci贸n pol铆tica. Esto se justifica debido a que la mayor铆a de los pa铆ses estudiados coincid铆an en que en una democracia moderna el ciudadano debe de estar informado sobre los datos p煤blicos de su gobierno.
  • Fomentar la investigaci贸n e innovaci贸n. Al llegar a publicar conjuntos de datos de alto valor, pueden surgir empresas TIC dedicadas al estudio y explotaci贸n de estos conjuntos de datos. Tambi茅n sostienen que la publicaci贸n de estos datos trae consigo un gran valor econ贸mico.
  • Fortalecer la aplicaci贸n de la ley. Esta 煤ltima estrategia trata sobre como hacer al ciudadano m谩s participe de un gobierno. Al aumentar la transparencia los ciudadanos se involucran m谩s con el gobierno y cuesti贸n y aumenta el cumplimiento de las leyes.

Deja una respuesta

Tu direcci贸n de correo electr贸nico no ser谩 publicada. Los campos obligatorios est谩n marcados con *

Este sitio usa Akismet para reducir el spam. Aprende c贸mo se procesan los datos de tus comentarios.

Web Campus Infantil
Logo y enlace Web Campus Infantil 2024
Web SereIngeniera
Logo y enlace Web SereIngeniera 2024
PyconES 2022
Logo y enlace PyconES 2022
Humor
Humor
Archivos
Categor铆as