(English version: Open data syndromes: from Gollum to Despacito, going through Forrest Gump)

Durante los dos últimos años he participado en el proyecto de implantación de la transparencia en las entidades locales de Cataluña, en el marco de la “Red de Gobiernos Locales Transparentes de Cataluña” y hemos impulsado la apertura de la información pública en formatos abiertos, fácilmente reutilizables, interoperables, estandarizados y de calidad.

Lo hemos hecho aplicando el principio de eficiencia “once only” (solo una vez): es decir, no volver a solicitar a las administraciones locales que publiquen los datos que ya han comunicado, en algún momento, a una administración supramunicipal o superior: no hemos dirigido a éstas y hemos solicitado la apertura de sus ficheros que contienen los datos consolidados de todas las administraciones locales: presupuestos, personal, deuda, subvenciones, contratación, etc. Esta información la hemos puesto a disposición en una plataforma compartida de datos abiertos y, las más de 1.000 entidades locales usuarias del servicio de Transparencia del Consorci AOC, disponen de esta información publicada automáticamente y actualizada periódicamente en su portal, sin necesidad de realizar ninguna tarea adicional.

Os presento a continuación un listado de las principales barreras, actitudes o “síndromes” que han dificultado este proceso de apertura de los datos públicos en poder de una administración supramunicipal o superior. Según la Real Academia Española, un “síndrome” es un conjunto de signos o fenómenos reveladores de una situación negativa.

Síndrome de “En búsqueda de la Ley perdida”. Nadie menciona, ni sabe lo que dice, ni recuerda, ni tiene en cuenta la Ley 37/2007, sobre reutilización de la información del sector público. Hace diez años de su aprobación, pero sus obligaciones son unas perfectas desconocidas. Parece ser que, tras su aprobación, esta Ley se perdió en el valle incógnito del pozo de Almas en Egipto, junto al arca perdida.

Síndrome de Gollum. Como en la película de “El señor de los anillos”, el anillo es “mi tesoro” y se convierte en una persona poderosa y, al mismo tiempo, egoísta, obsesionada en no compartirlo y paranoica con que nadie se lo quite. Con los datos pasa lo mismo. Hay roles en la administración cuya función ha sido toda la vida conservar y proteger los datos, y sufren de “paranoias” cuando alguien los quiere “tocar”. Aquello de que “los datos son de los ciudadanos” es una quimera.

Síndrome de Kilian Jornet. La lista de dificultades que se exponen para no implantar la apertura de los datos del sector público parece más larga y compleja que escalar el Everest. Los responsables de los ficheros aducen problemas de privacidad, mala calidad de los datos (con el riesgo de dar muy mala imagen), de dificultades tecnológicas, que tendrá un coste económico grande, que nadie lo necesita, etc. Una larga lista de excusas. Como dice Kilian Jornet “yo no busco excusas para entrenar ¿y tú?”

Síndrome de Twin Peaks. Como en la serie de Twin Peaks, nada es lo que parece y a cada paso hay una sorpresa. Los responsables de los datos aceptan compartir la información en formato de datos abiertos, pero nuestra satisfacción inicial se transforma cuando se comprueba que únicamente se ponen a disposición en formato PDF. Son datos “semiabiertos”, tirando a “oscuros” porque no son nada fáciles de explotar y analizar.

Síndrome de Forest Gump. Este personaje de ficción se convirtió por casualidad en un campeón mundial de ping-pong con una estrategia muy simple: devolver todas las pelotas y vencer al contrario por agotamiento. En la Administración tenemos muchos “Forest Gump”, expertos en el arte del ping-pong de las solicitudes. Se les pide que compartan la información en formato de datos abiertos y responden, pero con una cosa diferente que, evidentemente, no es lo que hemos pedido. Devolvemos la pelota de ping-pong con más energía y precisión, y nos la devuelven por otro lado de “la mesa” pero continúa siendo poco útil. Y así repetidamente, hasta que desistimos por agotamiento.

Síndrome de “Solo en (mi) casa”. Por supuesto que puedes consultar “mi” información pública, pero “solo en mi casa”. Para consultar los datos debes crear enlace de tu web a “mi casa”, dónde hay un buscador para acceder a ella, y así queda muy claro quién es el “amo” de los datos y así, además, el contador de visitas a “mi web” sube.

Síndrome del “Despazito”. Puedes acceder a los datos e incluso te los puedes descargar en ficheros de datos abiertos y estructurados (CSV u hoja de cálculo) desde un buscador, pero “despazito”. Se ha implantado una restricción en el buscador que solo permite descargar la información en “trozitos” de pocos centenares de registros, por supuestas limitaciones tecnológicas y para que nadie se empache de tantos datos. Si alguien quiere hacer un análisis global de los datos, lo podrá hacer, pero muy “despazito”.

Síndrome de “El Código Da Vinci”. Los datos están todos disponibles en formato abierto, estructurado y estandarizado. Parece que finalmente lo hemos conseguido, pero nos encontramos con la sorpresa que faltan los códigos clave para resolver algunos enigmas: por ejemplo, en un fichero datos de contratación con las licitaciones de todas las entidades locales no se publica el código del NIF/CIF de la empresa adjudicataria, solo el nombre. Como cada administración ha escrito el nombre de la empresa de forma diferente, será tan complicado hacer análisis y cruces de datos que ni el genio de Da Vinci lo conseguiría. Por ejemplo, analizar todos los contratos adjudicados a una determinada empresa en diversas Administraciones.

Síndrome de “Los otros la tienen más grande”. Disculpar el lenguaje soez, pero es una expresión muy gráfica. Cuando finalmente se consigue publicar un conjunto de datos de, por ejemplo, toda la información de la liquidación del presupuesto de todas las administraciones locales de Cataluña en formato abierto, interoperable, estandarizado, bien codificado, etc, aparece algún “experto” que elabora ránquines de datos abiertos que lo desprecia porque es solo un único dataset, y pone como ejemplo de buena práctica a otras administraciones que tienen centenares de datasets. Analizadas esas supuestas buenas prácticas, vemos que hay portales de datos abiertos que publican un dataset por cada entidad, para cada año y por concepto detallado (por ejemplo, el presupuesto de gastos por capítulo económico). Bien, si utilizáramos este criterio, un único dataset de la liquidación del presupuesto de todas las administraciones locales de Cataluña se convertiría en, como mínimo 30.000 datasets: (+1000 entidades locales) x (10 años de historia de presupuestos) * (3 conceptos: ingresos, gastos por clasificación económica, gastos por programa). Pero, ¿qué es lo más útil si se quiere hacer un análisis comparativo por año o entre ayuntamientos?

A pesar de las dificultades, creo que se ha hecho un excelente trabajo, se ha conseguido publicar 35 conjuntos de datos abiertos, con información consolidada de todas las administraciones locales de Cataluña, aunque ciertamente queda mucho por hacer. Como decía Confucio “el hombre que mueve montañas empieza apartando piedrecitas”. Ahí estamos.

Nota: Agradecimientos a Josep Matas

Anuncis

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

S'està connectant a %s