Portales de Datos, hay para todos los gustos
Hoy que necesitamos construir políticas públicas basadas en evidencia, los portales de datos son una herramienta muy necesaria para lograrlo
Desde hace algunos años que se viene impulsado políticas públicas para publicar y promover datos que están en poder del estado, incluso movimientos internacionales que apoyan y promueven este proceso como es el caso del OGP. Esto ha generado una gran proliferación de diferentes tipos de portales de datos, con múltiples formatos, estructuras, público objetivo, fuentes de datos y propósitos.
A continuación he intentado hacer una categorización, relativamente simple que permita agrupar por tipología de este tipo de portales.
Instituciones Estadísticas
En primer lugar, tenemos los portales de datos de las instituciones estadísticas nacionales, los cuales hace algunos años eran sitios web de carácter documental, que contenían básicamente informes estadísticos, en ggeneral archivos pdf.
Hoy han evolucionado, mostrando de forma mucho más interactiva los datos que estas instituciones producen en forma cotidiana. Los portales nacionales de estadísticas mejor evaluados por diferentes expertos son los correspondientes al Reino Unido, Holanda y Nueva Zelanda.
Reino Unido
Holanda
Nueva Zelanda
Existen portales similares que contienen información de carácter oficial de muchos países, me refiero a los portales de organismos multilaterales que han desarrollado áreas especiales dentro de sus sitios habituales con información estadística.
Un buen ejemplo de estos sitios son las áreas de datos del Banco Mundial, OCDE y la Unión Europea.
Estos sitios permiten realizan análisis comparativos entre países, respecto de un mismo indicador, por ejemplo: evolución del PIB a lo largo de los años.
Banco Mundial
OCDE
Unión Europea
Datos Abiertos
En la última década hemos visto como han surgido los denominados portales de datos abiertos, o datos.xxx (Data.gov, Data.gov.uk y otros). Correspondientes a repositorios gubernamentales de archivos de datos (datasets) que generan diferentes instituciones públicas, habitualmente del Gobierno Central.
Hoy en día, muchos de estos portales están bastante cuestionados, ya que una buena cantidad de ellos con el correr de los años se han transformado en una suerte de cementerio de elefantes de datos, con muchos conjuntos de datos antiguos, desactualizados y de poco valor (Datos.gob.cl).
Algunos países han modificado su política inicial de contar con un repositorio centralizado de datos, para pasar a utilizar la plataforma GitHub como repositorio.
Los portales más emblemáticos en esta área, probablemente porque fueron los que iniciaron este proceso son:
Estado Unidos
Reino Unido
Visualizaciones y Animaciones
Otra tendencia que hemos visto en los últimos años, son portales de datos que buscan agregar y procesar información desde diferentes fuentes, tanto públicas, como privadas). Son una suerte de agregadores de información, estructurada de forma atractiva y presentada con visualizaciones muy amenas y didácticas.
Lo que buscan estos portales es presentar la información, habitualmente de carácter estadístico en un formato atractivo para el usuario. Incluso algunos van más lejos desarrollando animaciones en base a los datos presentados.
Buenos ejemplos de esto son los portales de datos nacionales (estadísticas nacionales) desarrollados por la compañía Datawheel, iniciada por Cesar Hidalgo.
Otro buen ejemplo es el portal Gapminder, basado en las publicaciones del fallecido Hans Rosling, autor del gran libro Factfulness sobre el que escribí hace ya algún tiempo.
Data USA
Data Chile
Gapminder
Contar Historias
Otro ejemplo de portales de datos, son los desarrollados por medios de comunicación con el objeto de contar una historia, habitualmente asociados a un tema específico, en el cual los datos y sus visualizaciones van acompañado alguna noticia o reportaje sobre el tema.
Probablemente los medios de comunicación que más han desarrollado esta área, muy vinculada al periodismo de datos son el New York Times, The Guardian o El País entre otros.
New York Times
COVID-19
Finalmente otro buen ejemplo de portales de datos que han surgido en los últimos meses son, los portales de información del COVID-19, se trata de sitios con información habitualmente de fuentes oficiales, con mucho énfasis visualizaciones, que permiten analizar el comportamiento de la pandemia en una zona determinada, incluyendo comparaciones.
Probablemente, el portal más reconocido en esta área es el desarrollado por la Universidad John Hopkins.
John Hopkins
Finalmente hay algunos sitios que han recopilado los principales portales de datos, les adjunto un par de estas recopilaciones
- Big Data: 33 Brilliant And Free Data Sources Anyone Can Use
- 100 Datasets
- 70 Amazing Free Data Sources You Should Know
- Top 10 Great Sites with Free Data Sets
Lo importante el día de hoy, es que ya no basta con armar un portal de datos, sino que debemos analizar nuestro público objetivo y según ello diseñar el más adecuado a ese público.
Excelente post, muy pertinente.
Quizás el mayor desafío son dos adicionalos a los que nombras: la actualización frecuente y dentro de un calendario conocido (para hacerla confiable) y que cada archivo de datos esté efectivamente acompañado por sus respectivos metadatos, que describan adecuadamente los datos que se ofrecen.
Gracias Alejandro
Lovoy a promocionar en la pagina FB. Como siempre: excelentes tus aportes
Un abrazo
Muchas gracias Juan Carlos por tu comentarios, y muy pertinentes los desafíos que planteas, estamos llenos de portales de datos que más parecen cementerios de elefantes
Muchas gracias Edgar por tu comentarios
Muchas gracias Ester por tu comentario
Gracias por su post, estaba buscando información sobre portales para mirar cómo su distribución y funcionamiento, dado que trabajo con uno, pero necesitamos darle una estructura y acompañamiento; tal como dice debe estar integrado a la planificación de lo que se requiere, lo único que veo como inconveniente , es que los portales permiten subir excel, csv, webservice, pero en general sino se dispone de un sistema que permita actualizar de manera automática los datos, sin tener una persona actualizando de manera manual, creo que el valor agregado es poco por los errores , el tiempo y la desactualización que ello conllevaría. De todas formas, es una gran iniciativa y se deben seguir impulsando.
Muchas gracias Patricia por tu comentario, efectivamente como dices los portales conllevan un trabajo de actualización y gestión de contenidos, incluso si tienes mecanismos de actualización automática, se deben considerar procesos de gestión de contenidos, los cuales son difícilmente automatizables. En caso contrario rápidamente quedarán obsoletos
Saludos
Alejandro