Datos Abiertos: remedio peor que la enfermedad
Post escrito en conjunto con Pablo Galaz Painecura
Muchos meses esperando, finalmente llegó el nuevo Portal de Datos del Estado, pero a primera vista requiere de mucho esfuerzo para llegar a estándares mínimos.
Hace ya un tiempo que escribo sobre el Portal de Datos del Estado. Un ejemplo de ello es que en mayo 2023 ya hacía referencia al incumplimiento de su puesta en marcha, y la promesa para que estuviera en diciembre de 2023, estamos hablando hace más de un año de eso.
Durante el 2024 participé de varias sesiones para definir la Estrategia de Datos del Estado, invitación que agradezco de parte de la Secretaría de Gobierno Digital – Ministerio de Hacienda, en esta instancia me tocó participar representando a la Universidad de Chile. Uno de los elementos que se discutió en varias oportunidades en las sesiones de trabajo, fue la de contar con un Portal de Datos del Estado actualizado.
Ya había perdido la esperanza de contar con un portal de datos, y se me dijo que Diciembre de 2024 habría uno nuevo. Hace un par de días mi colega Pablo Galaz, con quien hemos trabajado en varias instituciones es públicas el tema de datos, me preguntó ¿si había visto el nuevo portal? le dije que no y luego mi reflexión fue: que bueno ya tenemos nuevo portal, pero hasta ahí llegaron las buenas noticias.
Con Pablo nos pusimos a darle una mirada y nuestra sorpresa fue mayúscula. Aquí les dejamos un mini-evaluación desde la perspectiva de un usuario final que ingresa al nuevo portal de datos.
El nuevo portal
Después de una rápida navegada datos.gob.cl, nos encontramos con múltiples errores, y que luego de postergar más de 1 año la entrada en vigencia del portal de datos, no hacen más que reforzar la idea de que este es un tema relativamente marginal para el proceso de Transformación Digital.
Experiencia Usuaria
La experiencia usuaria del portal es bastante deficiente, particularmente en el corazón del sitio: la sección Conjunto de Datos. El primer problema ocurre al filtras información según atributos estructurados (Organizaciones, Categorías, Licencias) y no estructurados (Etiquetas o Formatos) que se disponen para ello. Los filtros se aplican automáticamente cada vez que seleccionas un atributo (no puedes seleccionar dos al mismo tiempo), y como resultado se despliegan todos los Conjuntos de Datos que vayan cumpliendo con todas las condiciones de forma secuencial. Una consecuencia directa de ello es que, por ejemplo, no es factible revisar en la misma página los datos publicados por 2 o más servicios públicos (porque cada conjunto de datos es cargado por un único Servicio).
Un segundo problema ocurre al utilizar la opción de “Ordenar por:”. En las pruebas que realizamos, se pudo comprobar que esta opción de ordenamiento deja si efecto cualquier filro que se haya aplicado previamente. Por ejemplo, el filtro Categorías = Educación entrega 121 Conjuntos de Datos. Luego, al Ordenar por: = Nombre Ascendente, se despliegan nuevamente lo 2.681 Conjuntos de Datos del portal.
En tercer lugar, llama la atención que el atributo Formatos no sea una variable estructurada. Como consecuencia, por ejemplo, existen archivos en formato “excel”, “Excel”, “EXCEL”, “.xls”, “.xlsx”, “XLSX”, y “XLS” (todos corresponden a un mismo formato).
Cuarto, los atributos para filtrar los Conjuntos de Datos desplieguen sus valores sin mucho rigor. En el caso de los atributos Organizaciones y Categorías, los valores se despliegan de la Z a la A. Y en los atributos no estructurados como Etiquetas y Formatos, sigue la misma reglada, sumada a que – además – despliega primero los valores que inician con una letra minúscula, y luego las que comienzan con una mayúscula.
Cuarto, es raro que el portal solicite constantemente que confirmes que eres humano, esto debiera ser una marca por una vez y ya.
Finalmente, y sumado a todo lo anterior, nos encontramos en algunas ocasiones con el error “Bad Gateway” (puerta de enlace incorrecta). Este error es un código de estado HTTP 502 que indica que un servidor, que actúa como puerta de enlace o proxy, ha recibido una respuesta inválida o incorrecta de otro servidor al que está intentando acceder para completar la solicitud del usuario.
Dicho error se puede producir por diversas razones: problemas de comunicación entre servidores, tiempo de espera agotado (Timeout), servidor de destino inactivo o caído, errores de configuración de DNS, problemas de sobrecarga en el servidor, problemas con el firewall o proxy o finalmente errores en las cabeceras HTTP.
Información Desactualizada
Este es un error bastante grave, ya que si se hace un nuevo lanzamiento de un portal de datos, se espera al menos que ciertos datos básicos estén actualizados. A modo de ejemplo, si revisamos el Conjunto de Datos publicados por la Subsecretaría de Hacienda y lo ordenamos según el filtro “Última modificación”, dentro de las publicaciones más recientes tenemos el Presupuesto 2011 publicado en el portal el año 2015. Es decir, datos de hace 13 años publicados hace 9 años. Datos aparte es que el conjunto de datos se encuentre publicado 2 veces, y con enlaces desactualizados (y algunos, incluso, reconocidos como sitios inseguros por Google Chrome).
Tener información así de desactualizada lo único que hacen este desprestigiar el portal de datos. Como último recurso, se podría haber incluido un link al sitio Presupuesto Abierto de la DIPRES, un portal de datos reforzado visualizaciones sobre recursos asignados y ejecución mensual a nivel transaccional para el Gobierno Central desde el año 2016.
Información Mínima
Al visitar la sección Instituciones, se puede apreciar que hay un sin número de entidades que no cuentan con una descripción de la misma, dando cuenta que la plataforma permite operar sin garantizar que se cumplan reglas de negocios asociadas a la información mínima necesaria para una adecuada experiencia usuaria. Es evidente que la plataforma no debería permitir el ingreso de información dejando ciertos campos en blanco.
Como a nivel de los conjuntos de datos
Visualización
En la página de inicio hay visualizaciones asociadas sobre un Conjunto de datos destacados, sin ahondar qué criterios se utilizaron para definir como “destacado” un conjunto de datos. Independiente a lo anterior, la verdad es que las visualizaciones son excesivamente básicas (solo diagramas de torta) y presentan problemas variados. Entre estos últimos, se evidencia el uso de una paleta de 3 colores (azul, rosado y amarillo) en gráficos que contienen 4 o más categorías, o bien el uso de colores que refuerzan estereotipos de género (azul para hombres, rosado para mujeres). Finalmente, los enlaces que indican “Descargar” no funciona para ninguna de las visualizaciones que revisamos.
El sitio presenta problemas básicos de visualización, en términos de la paleta de colores (se limita a 3 colores aún cuando se despliega información para 4 o más categorías), los colores e información de las gráficas, por ejemplo: ¿a qué se refiere el gráfico Estudio de indicadores de gobierno digital?
Después de darle una recorrida inicial, debemos decir que nos sentimos un tanto desilusionados por lo que vimos, el nivel de desarrollo no se condice con el tiempo y recursos desplegados. Esperamos que esta sea una versión beta del nuevo portal de datos abiertos, porque – de no ser así – estamos peor que en 2022.
Bonus Track
Ejemplo de navegación del nuevo portal de datos del Estado
Niun brillo tu post
Gracias por el comentario …
¿Y que se requiere para que tenga brillo?