Definición
Los datos abiertos u open data en inglés, corresponden a una filosofía y práctica que está orientada a que todos los datos pueden ser utilizados, reutilizados y redistribuidos, sin ninguna limitación por cualquier persona y que a lo mas deban indicar la atribución de la fuente y que los datos se presenten de la misma manera en que aparecen en su forma original (Open Knowledge Foundation, 2012)..
Características de los datos abiertos
La definición de apertura completa ofrece detalles claros sobre su significado. En resumen, los puntos clave son:
- Disponibilidad y acceso: la información debe ser accesible en su totalidad y a un costo razonable de reproducción, idealmente para descargar desde internet. Además, debe estar en un formato conveniente y modificable.
- Reutilización y redistribución: los datos deben proporcionarse bajo condiciones que permitan su reutilización, redistribución e incluso integración con otros conjuntos de datos.
- Participación universal: cualquier persona debe poder usar, reutilizar y redistribuir la información sin discriminación por esfuerzo, personas o grupos. No se deben permitir restricciones «no comerciales» que impidan el uso comercial de los datos, ni limitaciones de uso para fines específicos (como solo para educación).
La razón por la que es tan importante ser claros sobre lo que significa ser «Abierto» y por qué se utiliza esta definición tiene una respuesta sencilla: interoperabilidad. La interoperabilidad se refiere a la capacidad de diferentes sistemas y organizaciones para trabajar juntos (interoperar). En este caso, implica la capacidad de integrar distintas bases de datos. Esta capacidad es esencial porque facilita que diferentes componentes trabajen de manera conjunta, lo que es crucial para la construcción de sistemas grandes y complejos. Sin interoperabilidad, es casi imposible lograrlo, tal como lo ilustra el conocido mito de la Torre de Babel, donde la incapacidad de comunicarse (interoperar) provoca el colapso de todo el proyecto. Esta interoperabilidad es crucial para comprender los principales beneficios prácticos de la apertura: el notable aumento en la capacidad de combinar diversas bases de datos o conjuntos de datos, lo que permite desarrollar productos y servicios más innovadores y de mejor calidad (estos beneficios se abordan con mayor detalle en la sección sobre la importancia de los datos abiertos).
La Presidencia del Consejo de Ministros plantea los principios que los datos abiertos deben tener, y se muestran en el grafico Nº 1.

De que datos se habla
Lo fundamental es que, al hablar de apertura de datos, el enfoque está en la información no personal, es decir, aquellos datos que no revelan detalles sobre personas específicas. De manera similar, ciertos tipos de datos gubernamentales pueden estar sujetos a restricciones relacionadas con la seguridad nacional.
¿Cómo se pueden abrir los datos?
Existen tres reglas principales que recomendamos seguir al abrir datos:
- Manténlo sencillo. Comienza con algo pequeño, fácil de implementar y rápido. No hay requisitos específicos para los conjuntos de datos en esta etapa. Puedes empezar abriendo un solo conjunto de datos (dataset), o incluso una sección de un conjunto más grande. Y por supuesto, entre más conjuntos de datos logres abrir, mejor. Avanzar lo más rápido posible es positivo porque te permite generar impulso y aprender del proceso. La innovación involucra tanto fracasos como éxitos, y es importante entender que no todos los conjuntos de datos serán útiles.
- Comprométete desde el principio y de manera constante. Involúcrate con los usuarios reales y potenciales, así como con los reutilizadores de los datos, tan pronto como sea posible y con frecuencia, ya sean ciudadanos, empresas o desarrolladores. Esto garantizará que la siguiente versión de tu servicio sea lo más relevante posible. Es importante tener en cuenta que muchos de los datos no llegarán directamente a los usuarios finales, sino a través de «infomediarios», quienes toman los datos y los transforman para presentarlos de manera comprensible. Por ejemplo, la mayoría de nosotros no necesita o quiere una base de datos masiva de coordenadas GPS, sino que preferimos un mapa. Por lo tanto, en primer lugar, comprométete con los infomediarios. Ellos serán quienes reutilicen y reinterpreten los datos.
- Aborda los miedos y malentendidos comunes. Esto es particularmente crucial cuando se trabaja con grandes instituciones, como el gobierno. Al abrir los datos, es probable que surjan muchas preguntas y preocupaciones. Por lo tanto, es fundamental (a) identificar las más relevantes y (b) tratar estos problemas lo antes posible.
Open Data y formatos
Los Datos Abiertos, o OpenData, son actualmente un recurso valioso, aunque aún no han alcanzado su máximo potencial. Muchos países, impulsados por las nuevas tendencias de filtraciones en la red, por moda o por una verdadera creencia en la transparencia, han comenzado a publicar sus datos en registros o inventarios públicos conocidos como OpenData. Aunque es casi imposible predecir con exactitud cómo y dónde se generará valor a partir de estos inventarios en el futuro, hay muchas áreas donde se espera que los datos abiertos resulten útiles. Además, diversos grupos de personas y organizaciones, incluido el propio gobierno, pueden beneficiarse del acceso a esta información.
El formato de un archivo es una forma específica de codificar la información para su almacenamiento, y establece un estándar que define cómo se organiza y codifica esa información dentro del archivo.
Un formato libre significa tener libertad en su uso. Esta libertad de información permite a los programadores lograr la compatibilidad entre diferentes programas, ya que no existen restricciones en su utilización. Es decir, los programadores pueden acceder a sus especificaciones tanto para crear archivos como para importar o exportarlos.
Por lo anterior se entiende que el Open Data utilizara formatos de archivos de acceso libre que faciliten la distribución de la data compartida. En la tabla 2 podemos ver algunos de estos formatos:
EXTENSION | DESCRIPCION |
CSV | Los archivos CSV (del inglés comma-separated values) son un tipo de documento en formato abierto sencillo para representar datos en forma de tabla, en las que las columnas se separan por comas |
XLS | XLS es un tipo de archivo de Microsoft Excel y, por lo tanto, es adecuado para hojas de cálculo |
SAV | Los archivos SAV son generados por el programa estadístico SPSS |
DBF | dBASE desarrolló el formato DBF, que generalmente se utiliza para los archivos de base de datos implementadas por el software del sistema de gestión de base de datos dBASE para almacenar, recuperar y hacer referencia a los datos guardados en el formato DBF. Otros programas que lo utilizan son los conocidos Fox Pro y Visual Fox Pro |
En la actualidad ya no se utiliza el formato DBF aunque podemos encontrar todavia data histórica almacenada en este formato.
Referencias bibliográficas
Bron, M. (2015). OpenData. Miradas y perspectivas de los Datos Abiertos (1a ed). Proyecto Libro-E.
Brys, C. (2012). Manual de los Datos Abiertos. Open Knowledge Foundation.
PCM. (2013). Estrategia nacional de datos abiertos gubernamentales del Perú 2017-2021. Secretaría de gestión pública-PCM.