Estandarización de valores de los campos¶
-
El uso de valores estandarizados permite la correlación de datos entre conjuntos de datos, la comparación inter-administraciones (entre agencias y/o sectores), la interoperabilidad y el enlazado de datos. Para ello, los valores de determinados campos deben ser consistentes entre datasets.
-
A tener en cuenta:
- Solo es posible saber si una magnitud es grande o pequeña si se puede comparar con otra teniendo en cuenta las similitudes y diferencias, por ejemplo, entre conjuntos de datos originados por diferentes administraciones.
- La norma AENOR 137801:2015, Ciudades Inteligentes, Datos Abiertos, considera datos técnicamente correctos aquellos que, entre otras características:
- Utilizan la misma codificación y normalización para el mismo tipo de dato publicado en diferentes datasets de un catálogo. Por ejemplo, las direcciones se publican siempre con la misma estructura, tipo, formatos en cualquier conjunto de datos y los elementos de georreferenciación utilizan el mismo sistema de coordenadas de referencia.
- La codificación y normalización utilizada se basa en algún estándar común reconocido y utilizado por otras organizaciones codificación. Por ejemplo: estándares aprobados por EUROSTAT o el INE.
- Es recomendable:
- Usar vocabularios de uso común para normalizar la estructura y valores de la información publicada en los conjuntos de datos.1
- En el caso de no usar vocabularios de referencia, el valor que se asigne a un determinado atributo debe ser único y coherente en toda utilización de dicho valor a lo largo de la tabla. Es decir, si se opta por usar el valor "Barcelona", para referirse a esta ciudad, no se debe usar el valor “Ciudad de Barcelona”.
Ejemplo: estandarización de la denominación y código de actividad económica.¶
Mala práctica
marca |
actividad_vendedor |
chevrolet |
Venta de coches |
buick |
Venta de vehículos |
plymouth |
Venta |
Buena práctica
marca |
codigo_vendedor |
actividad_vendedor |
chevrolet |
45.11 |
Venta de automóviles y vehículos de motor ligeros |
buick |
45.11 |
Venta de automóviles y vehículos de motor ligeros |
plymouth |
45.19 |
Venta de otros vehículos de motor |
En este ejemplo, os valores del campo ‘código_vendedor’ son los correspondientes a la nomenclatura estadística de actividades económicas de la Comunidad Europea (NACE, Rev. 2) de EUROSTAT para la estandarización de las actividades económicas de los vendedores de vehículos.
-
La Norma AENOR 137801:2015 incluye una relación de vocabularios de referencia disponibles en: http://vocab.linkeddata.es/datosabiertos/ ↩