Estructuras de datosverticales vs horizontales¶
-
Cuando se diseñan estructuras de datos tabulares es recomendable evitar el crecimiento horizontal de valores.
-
Siempre que sea posible es preferible situar las variables o atributos de los datos en las columnas de una tabla y añadir los valores correspondientes a las observaciones de los mismos en las filas.
- El crecimiento horizontal de una estructura de datos tabular puede dificultar su mantenimiento y la confección de visualizaciones.
- Por lo general, es más fácil identificar relaciones entre variables en columnas que entre filas y es más fácil hacer comparaciones entre grupos de observaciones, en filas, que entre grupos de columnas.
- No obstante, esta recomendación debe ajustarse según las necesidades de actualización de los datos:
- Si es necesario registrar nuevas variables o atributos que no se habían registrado previamente, por ejemplo: una serie temporal, entonces es razonable el crecimiento horizontal de la estructura de datos. es decir, añadir nuevas columnas. Esto permitirá insertar observaciones para las nuevas variables manteniendo valores en blanco en las observaciones previas a la actualización para estas nuevas columnas, si es que no existe un valor asignable a esas observaciones. Al añadir nuevas observaciones, necesariamente tienen que introducirse nuevas filas.
Ejemplo: crecimiento horizontal vs vertical¶
Mala práctica
marca |
averias_radiador |
averias_carburador |
averias_suspension |
averias_embrague |
chevrolet chevelle malibu |
0 |
7 |
1 |
0 |
buick skylark 320 |
1 |
2 |
2 |
2 |
plymouth satellite |
0 |
4 |
4 |
1 |
Buena práctica
marca |
tipo_averia |
cantidad_averias |
chevrolet chevelle malibu |
radiador |
0 |
chevrolet chevelle malibu |
carburador |
7 |
chevrolet chevelle malibu |
suspensión |
1 |
chevrolet chevelle malibu |
embrague |
0 |
buick skylark 320 |
radiador |
1 |
buick skylark 320 |
carburador |
2 |
buick skylark 320 |
suspensión |
2 |
buick skylark 320 |
embrague |
2 |
plymouth satellite |
radiador |
0 |
plymouth satellite |
carburador |
4 |
plymouth satellite |
suspensión |
4 |
plymouth satellite |
embrague |
1 |
En el ejemplo se observa una forma de disponer los datos evitando el crecimiento horizontal de la estructura de datos agregando nuevas variables similares a las existentes. La trasposición a una estructura vertical mediante la creación de dos variables nuevas, “tipo_averia” y “cantidad_averias”, permite añadir fácilmente nuevas observaciones en forma de filas.
En cambio, cuando se publican series temporales, por ejemplo, el histórico de demanda de vehículos entre los años 1972-1977, es razonable el crecimiento horizontal de la estructura si surge la necesidad, por ejemplo, de completar la serie histórica de los años ‘70.
Buena práctica
marca |
1972 |
1973 |
1974 |
1975 |
1976 |
1977 |
chevrolet chevelle malibu |
345 |
423 |
1234 |
1690 |
2345 |
2134 |
buick skylark 320 |
124 |
252 |
785 |
914 |
1353 |
896 |
plymouth satellite |
57 |
71 |
165 |
315 |
1104 |
1561 |