A algunos se les olvidó el Open Data!
Pensé que estas prácticas se habían acabado, pero hace unos días andaba buscando información sobre el gasto destinado a investigación y desarrollo (I+D) en nuestro país; mi búsqueda me llevó al sitio del Ministerio de Economía, en particular al área, Tercera Encuesta Nacional sobre Gasto y Personal en Investigación y Desarrollo (años de referencia 2011-2012)
“La Encuesta sobre Gasto y Personal en I+D busca recoger información cuantitativa relativa a los recursos financieros y cantidad de personal, destinados a actividades de investigación y desarrollo, durante los años de medición, en el sector Empresas, en el Estado, en la Educación Superior (universidades) y en las Instituciones Privadas sin Fines de Lucro (IPSFL)”
Pero volvamos al tema central, por que decía que esperaba que estas prácticas se hubieran acabado, en particular las que dicen relación como se accede a la información carácter público; una encuesta pagada con recursos públicos lo es.
Para obtener la referida encuesta, se debe pasar por un proceso que dista mucho de las buenas prácticas de datos abiertos, a los cuales Chile ha adherido, en primer lugar hay que llenar un formulario, muy extenso, con todo tipo de información, la cual además en forma mayoritaria es de carácter obligatorio, entre los datos solicitados hay:
- Tipo Institución (un menú de opciones, en que todas se refieren a instituciones, no existe la alternativa de persona natural, es decir si un ciudadano de a pié quiere la encuesta, no queda claro que debe poner)
- Nombre Institución
- Dirección
- Ciudad
- País
- División / Departamento
- Nombre solicitante
- Apellido Paterno
- Apellido Materno
- Profesión solicitante
- Fono solicitante
- Rut solicitante
- Correo electrónico solicitante
- Comentario, que dice “Objetivo de la investigación por la que solicita los datos de la encuesta”
Hace algunos años teníamos el mismo problema con la encuesta CASEN, se pedía todo tipo de información para acceder a la data.
En este caso, la solicitud tiene un foco en instituciones, de hecho la clasificación de instituciones que pueden solicitar son: Administración Pública, Centro de Estudios, ONG, Empresa, Organismo Internacional, Universidad, Otra.
Pero eso no fue todo, ingresé datos, en institución puse “Otras” y como nombre de Institución “Alejandro Barros”, luego de completar todos los campos me apareció la pantalla anterior, por correo me enviaron un archivo comprimido conteniendo varios archivos con datos de la encuesta.
Este listado de archivos no contenía ninguna explicación y/o documentos que aclaren el método (cuestionario, tipo de encuesta, tamaño de la muestra, error, nivel de confianza), contenido y resultados. Como si eso no fuera todo, el formato de los resultados venían en un formato propietario (.dta) correspondiente al formato que utiliza el paquete estadístico Stata, el cual dicho sea de paso vale varios cientos de dólares si consigue un buen precio, sólo para ver los datos y/o para convertirlos a formatos más abiertos.
A partir de mi experiencia me surgen varias preguntas, respecto de esta forma de obtener acceso a los datos
- ¿Por qué se exige tanta información para descargar los archivos?
- ¿Qué tipo de uso se le va a dar a mis datos, por parte de la entidad encargada de definir la política pública de protección de datos personales?
- ¿Qué pasa si soy una persona natural y que no representa a ninguna institución, puedo acceder a los datos?
- ¿Por qué tengo que declarar los objetivos de mi investigación?
- ¿Por qué no hay información básica de la encuesta (método, cuestionario, error muestral, …)?
- ¿Por qué los datos no se entregan en formatos abiertos?
Chile se ha hecho miembro del Open Government Partnership (OGP), que dicho sea de paso el sitio con los avances y compromisos no se ha actualizado desde agosto del 2013. La pertenencia a dicha iniciativa plantea importantes desafíos en materias de acceso a la información pública y en particular frente a la política de datos abiertos, comprometiendo una agenda de cambios muy sustantivos en esta materia. Incluso plantea el cumplimiento de los 8 principios de los datos abiertos.
- Completitud, toda la data es pública, no sólo lo que la autoridad estime pertinente (pre-procesada)
- Fuente primaria, los datos de la fuente primaria, o denominada “raw data”, datos sin pre-procesamiento, salvo el necesario para no afectar otras normas como es le caso de la protección de datos personales.
- Oportuna, debe disponibilizarse en forma inmediata o al menos con poca demora.
- Disponible a todo tipo de usuarios (sin restricción)
- Procesable, esto es, datos estructurados que puedan ser procesados por un computador
- No discriminatoria, disponible a cualquiera sin necesidad de registro
- No propietaria, esto es que no puede estar en formatos asociados a alguna entidad o bien que requieran de algún tipo de herramienta propietaria para su uso.
- Licenciamiento libre, no sujeta a ningún tipo de copyright, patente u otro tipo de derecho.
Me parece bastante mal, por decir lo menos, que una de las agencias dedicadas a la política pública de desarrollo digital como es el Ministerio de Economía, siga con estas prácticas en materia de acceso a los datos, a estas alturas del siglo XXI.