Saltar a contenido

Estructuras de datosverticales vs horizontales

  • Cuando se diseñan estructuras de datos tabulares es recomendable evitar el crecimiento horizontal de valores.

  • Siempre que sea posible es preferible situar las variables o atributos de los datos en las columnas de una tabla y añadir los valores correspondientes a las observaciones de los mismos en las filas.

  • El crecimiento horizontal de una estructura de datos tabular puede dificultar su mantenimiento y la confección de visualizaciones.
  • Por lo general, es más fácil identificar relaciones entre variables en columnas que entre filas y es más fácil hacer comparaciones entre grupos de observaciones, en filas, que entre grupos de columnas.
  • No obstante, esta recomendación debe ajustarse según las necesidades de actualización de los datos:
    • Si es necesario registrar nuevas variables o atributos que no se habían registrado previamente, por ejemplo: una serie temporal, entonces es razonable el crecimiento horizontal de la estructura de datos. es decir, añadir nuevas columnas. Esto permitirá insertar observaciones para las nuevas variables manteniendo valores en blanco en las observaciones previas a la actualización para estas nuevas columnas, si es que no existe un valor asignable a esas observaciones. Al añadir nuevas observaciones, necesariamente tienen que introducirse nuevas filas.

Ejemplo: crecimiento horizontal vs vertical

Image title

Mala práctica

marca

averias_radiador

averias_carburador

averias_suspension

averias_embrague

chevrolet chevelle malibu

0

7

1

0

buick skylark 320

1

2

2

2

plymouth satellite

0

4

4

1

Buena práctica

marca

tipo_averia

cantidad_averias

chevrolet chevelle malibu

radiador

0

chevrolet chevelle malibu

carburador

7

chevrolet chevelle malibu

suspensión

1

chevrolet chevelle malibu

embrague

0

buick skylark 320

radiador

1

buick skylark 320

carburador

2

buick skylark 320

suspensión

2

buick skylark 320

embrague

2

plymouth satellite

radiador

0

plymouth satellite

carburador

4

plymouth satellite

suspensión

4

plymouth satellite

embrague

1

En el ejemplo se observa una forma de disponer los datos evitando el crecimiento horizontal de la estructura de datos agregando nuevas variables similares a las existentes. La trasposición a una estructura vertical mediante la creación de dos variables nuevas, “tipo_averia” y “cantidad_averias”, permite añadir fácilmente nuevas observaciones en forma de filas.

En cambio, cuando se publican series temporales, por ejemplo, el histórico de demanda de vehículos entre los años 1972-1977, es razonable el crecimiento horizontal de la estructura si surge la necesidad, por ejemplo, de completar la serie histórica de los años ‘70.

Buena práctica

marca

1972

1973

1974

1975

1976

1977

chevrolet chevelle malibu

345

423

1234

1690

2345

2134

buick skylark 320

124

252

785

914

1353

896

plymouth satellite

57

71

165

315

1104

1561