/ 28 de febrero de 2015

Aviso: Este es un post antiguo, puede que su informaci贸n est茅 desactualizada. Si est谩 buscando algo sobre un evento actual, tenga en cuenta que puede que este no sea el que busca.

Durante el pasado fin de semana (20-23) celebramos el 3er Open Data Day Granada con un hackathon en el que la idea principal era usar datos libres para llevar a cabo diferentes proyectos. El evento, que consigui贸 reunir en torno a 30 personas (de las cuales hab铆a un gran n煤mero de personas no relacionadas con el campo de la inform谩tica), comenz贸 el viernes por la ma帽ana en la ETSIIT con charlas sobre transparencia en la informaci贸n y la exposici贸n de las ideas con las que se iban a trabajar en los 3 grupos de desarrollo organizados, continu贸 por la tarde en las instalaciones del CITIC con diversos talleres de herramientas que podr铆an ser de utilidad para desarrollo de los proyectos.

El evento dio comienzo con la presentaci贸n del mismo por parte de JJ Merelo, en la que transmiti贸 su idea de que significa que los datos sean transparentes hoy en d铆a y como la informaci贸n representa el poder, para finalizar diciendo que 鈥渓a informaci贸n es poder dormir mejor鈥.

Seguidamente empez贸 a hablar tambi茅n sobre transparencia y los datos abiertos, pero adem谩s desde el punto de vista del 鈥gobierno abierto鈥, un tipo de gobierno basado en transparencia gubernamental, participaci贸n ciudadana en el debate p煤blico, rendici贸n de cuentas por parte de los pol铆ticos para el cumplimiento de las leyes y el acceso a la tecnolog铆a e innovaci贸n que ser谩n las que faciliten que todo esto se haga posible.

Despu茅s de un descanso, se inici贸 la exposici贸n de las ideas en las que se trabajar铆a durante el fin de semana, abriendo con Incho Cordero y el periodismo de datos. La motivaci贸n de su idea esta basada en los recientes resultados publicados del 脥ndice Transparencia de los Ayuntamientos en el que ayuntamiento de Granada obten铆a la peor nota de toda Espa帽a, hecho que se pone de manifiesto cuando vemos que enlaces de licitaciones p煤blicas que encontramos en la p谩gina del ayuntamiento no funcionan.

La siguiente idea es presentada por Pablo Garc铆a y Antonio Fern谩ndez, y consiste en trabajar en el Proyecto PETRA para la predicci贸n del estado del tr谩fico mediante los datos abiertos que proporciona la DGT. Explicando como mediante el proyecto Sipesca quieren desarrollar un sistema de informaci贸n aut贸nomo mediante el cual puedan recolectar, siempre de forma an贸nima, los datos de transito de las v铆as mediante conexi贸n WiFi, Bluetooth y RFID con dispositivos que se encuentren en los veh铆culos o transe煤ntes, para as铆 poder predecir posibles usos de las v铆as.

La 煤ltima idea en ser presentada corr铆a a cargo de Mario Heredia, en la que bas谩ndose en su experiencia de trabajo como parte del equipo de desarrollo de la plataforma de transparencia de la Universidad de Granada (http://transparente.ugr.es/ –聽http://opendata.ugr.es/), propuso varias ideas de trabajo para desarrollar como son: analizar matriculaciones en las diferentes ramas de conocimiento, estudiar el porcentaje de mujeres y hombres en las diferentes titulaciones o comparar los datos publicados por las universidades que contaran con un portal de transparencia; una vez obtenidos estos datos y despu茅s de ser analizados, se intentar铆a llegar a una conclusi贸n sobre los mismos.

Una vez que todas las ideas fueron expuestas, lleg贸 el momento de hacer una pausa durante unas horas que los asistentes aprovecharon para intercambiar ideas mientras tomaban un relajado almuerzo. Ya por la tarde comenzaron los talleres, siendo el primero de ellos llevado a cabo por Pablo Hinojosa y consistente en explicar de forma simplificada el trabajo con Git, un sistema de control de versiones que facilita enormemente el trabajo colaborativo, adem谩s de ser muy eficiente y que tiene una gran confiabilidad. Comenta como su funcionamiento aunque desde un entorno de l铆nea de comandos es muy amigable debido a la cantidad de informaci贸n que obtenemos ante cualquier incidencia, adem谩s de explicar las distintas etapas del trabajo con Git para que cualquier que quiera usarlo no tenga miedo por no tener un gran conocimiento inform谩tico previo.

El siguiente taller se explica como hacer scraping de datos (que consiste en extraer informaci贸n), adem谩s de formas de extraer datos de un archivo en formato PDF y diferentes fuentes de datos comunes. Para el scraping nos presenta herramientas como HTTrack que nos permiten obtener todo el contenido de una p谩gina web directamente, adem谩s de explicar que dicho scraping tambi茅n se puede hacer desarrollando aplicaciones en lenguajes como Perl o Python. Seguidamente presenta aplicaciones como Tabula, con las que se puede extraer informaci贸n de archivos PDF, aunque alguna veces el resultado no es especialmente bueno porque este formato tiene una edici贸n m谩s bien cerrada. Por 煤ltimo, da a conocer programas como Pentaho, que nos permitir谩n procesar fuentes de datos comunes para procesar su informaci贸n y obtener un valioso conocimiento de los datos que lo forman.

Para finalizar el programa del primer d铆a, otra vez JJ Merelo cierra con un taller sobre plataformas para visualizado de datos y la importancia que tiene este aspecto a la hora de presentar el resultado. Son 3 las soluciones que expone, la primera CartoDB, una plataforma que nos permite montar un servicio en la nube y mapas web con los datos que se podr谩n visualizar desde cualquier navegador, adem谩s, esta tiene la particularidad de ser una empresa open source espa帽ola. La siguiente plataforma es Google Fusion Tables, un servicio de Google que nos permite almacenar datos en tablas y luego nos permitir谩 visualizar esos datos en forma de distintos tipos de gr谩ficos: l铆neas, barras, circulares, etc, adem谩s de poder visualizarlos tambi茅n en mapas geogr谩ficos basados en Google Maps. La 煤ltima alternativa presentada fue ShinyApps, una plataforma como servicio que permite almacenar aplicaciones web Shiny, un framework para aplicaciones echas en R, uno de los lenguaje de programaci贸n m谩s usados en investigaciones estad铆sticas y el 谩mbito matem谩tico, as铆 que es una soluci贸n que nos permite realizar tambi茅n trabajos de visualizar de datos en gr谩ficos o mapas, pero con una complejidad mayor.

Ya con todos los retos expuestos y los talleres concluidos, se organizaron los diferentes equipos para comenzar el trabajo de resolver los problemas planteados. Se empezaron a crear repositorios en GitHub, documentos online de Google Docs, grupos en Telegram, cualquier cosa que pudiera ayudar a organizar el trabajo en una fase tan temprana del proyecto.

Grupo 1:


Grupo 2: Repositorio聽GitHub

Grupo 3: Repositorio聽GitHub

Si algo caracteriza a un hackathon es el corto periodo de tiempo en el que se desarrolla la actividad, por lo que todo el proceso de trabajo tiene que ser muy 谩gil, as铆 que para ir informando de en qu茅 estaban trabajando varios de los participantes usaron los hashtag #OpenDataDay y #SmartCityHack en Twitter, como podemos ver aqu铆 o aqu铆. En lo que s铆 estaban de acuerdo la mayor铆a, es que la cantidad de informaci贸n era de tal magnitud, que dif铆cilmente podr铆an tener un proyecto terminado en un fin de semana, pero servir铆a de inicio para lo que pod铆an ser interesantes proyectos.

Llega el d铆a de la presentaci贸n de los resultados y los grupos se vuelven a reunir en el CITIC para terminar sus presentaciones. El primer equipo, que iba a investigar los contratos de contrataci贸n menores del Ayuntamiento de Granada, expone para empezar las dificultades que han tenido para extraer la informaci贸n con la dispon铆an para trabajar ya que en su mayor铆a proven铆a de archivos PDF, adem谩s comentan como an茅cdota que curiosamente hab铆a recursos con datos que desaparecieran de repente mientras estaban trabajando, lo que motivar铆a m谩s todav铆a este tipo de proyectos de investigaci贸n por la transparencia. Terminan comentando las conclusiones que han sacado de las cifras de los contratos con los que han trabajado.

Siguen las presentaciones, y es el turno del grupo de trabajo del Proyecto PETRA. Comienzan comentando la metodolog铆a de trabajo que han seguido para continuar hablando sobre el trabajo que han desarrollado: scraping de datos de los recursos de la DGT, conocimiento de datos Bluetooth y el estudio de APIs de tr谩fico. La an茅cdota de este grupo fue cuando contaron que hab铆an realizado una videoconferencia con otro grupo de trabajo de un hackathon de Lituania y como pudieron tener una peque帽a conversaci贸n sobre sus proyectos. Para la visualizaci贸n de sus datos usaron Google Fusion Tables, cuyo resultando mostraron durante la exposici贸n.

La 煤ltima exposici贸n, fue la llevada a cabo por los participantes que se hab铆an unido por un fin de semana a nosotros, al equipo desarrollador de la plataforma de transparencia de la UGR, llevado a cabo desde la propia Oficina de Software Libre de la Universidad de Granada. Al final nuestro reto fue el de realizar comparaciones entre los datos abiertos que ponen a disposici贸n de todo el mundo las diferentes universidades p煤blicas andaluzas, lo que nos llev贸 a exponer el primer problema que encontramos, la poca homogeneidad en el tipo de datos disponibles en cada una de las plataformas, porque mientras que unas plataformas te daban datos de poco inter茅s anal铆tico; como es el caso de la publicaci贸n de los 铆ndices de satisfacci贸n del alumnado, no daban otros que considerar铆amos m谩s interesante, como pueden ser los 铆ndices de rendimiento acad茅mico; hab铆a otras que ni siquiera publicaban los datos como tal, publicaban gr谩ficos referentes a los datos. Tambi茅n intentamos realizar una peque帽o an谩lisis econ贸mico relacionado con los datos de matriculaci贸n, pero la informaci贸n disponible era bastante escasa, por lo que terminamos llegando a la conclusi贸n de que hay universidades que van el buen camino en cuanto a transparencia, pero a otras les queda un largo camino que recorrer.

Y con esto finaliz贸 el evento, en el que seg煤n la opini贸n de los participantes hab铆a sido un gran experiencia (aunque tambi茅n un gran esfuerzo por tantas horas de trabajo). Este ha sido solo el primer evento del a帽o, esperamos poder hacer muchos m谩s y contar con vuestra asistencia. As铆 que muchas gracias a todos y esperamos veros en el pr贸ximo!

Deja una respuesta

Tu direcci贸n de correo electr贸nico no ser谩 publicada. Los campos obligatorios est谩n marcados con *

Este sitio usa Akismet para reducir el spam. Aprende c贸mo se procesan los datos de tus comentarios.

Web Campus Infantil
Logo y enlace Web Campus Infantil 2021
Web SereIngeniera
Logo y enlace Web SereIngeniera 2021
Web Jornadas De Software Libre
Logo y enlace Web Jornadas de Software Libre 2018
Humor
Humor
Archivos
Categor铆as