Anatomía de un Gráfico

Cada gráfico en altair es compuesto al describir un mínimo de tres elementos:

  • Datos
  • Marcadores
  • Codificaciones

Datos

Altair acepta datasets de 3 maneras:

  • un DataFrame de pandas
  • un objeto de clase Data de altair
  • datos en formato JSON o csv de manera directa

Nosotros trabajaremos con DataFrames de pandas.

Pandas es una de las mejores opciones para trabajar con estructuras de datos en python. El nombre pandas proviene de Python Data Analysis Library. pandas esta basada en numpy (de Numeric Python) la cual provee estructuras de datos (arrays o matrices) las cuales pandas utiliza para crear DataFrames. Un DataFrame es una estructura de datos en la cual se pueden guardar datos de distintos tipos (cadenas de caractéres (strings), integers, floats, y más) en cada columna. Es similar a una tabla o una planilla de Excel o Google Spreadsheets.

Como es una estructura de python claro que su índice comienza en 0.

Marcadores

El marcador en un gráfico es la representación visual de tus datos. Altair ofrece los siguientes marcadores hasta el momento:

Marcador Método Descripción Ejemplo
area mark_area() Un gráfico de area. Simple Stacked Area Chart
barra mark_bar() Un gráfico de barras. Simple Bar Chart
círculo mark_circle() Un diagrama de dispersión con círculos rellenos. One Dot Per Zipcode
geofigura mark_geoshape() Una fígura geográfica. Choropleth Map
línea mark_line() Un gráfico de líneas. Simple Line Chart
punto mark_point() Un diagrama de dispersión con formas de puntos configurables. Faceted Scatter Plot with Linked Brushing
rectángulo mark_rect() Un rectángulo relleno, usado para mapas de calor (heatmaps). Simple Heatmap
regla mark_rule() Una línea vertical u horizontal que abarca el eje. Candlestick Chart
cuadrado mark_square() Un diagrama de dispersián con cuadrados. N/A
texto mark_text() Un diagrama de dispersián con los puntos representados con texto. Simple Bar Chart with Labels
marca mark_tick() Una marca o línea horizontal o vertical. Strip Plot

Codificaciones

Un gráfico es una representación visual de tus datos. Es esencial conectar tu información a un elemento visual en el gráfico. En altair eso se le conoce como encode o codificar tus datos. Es el proceso de asignar valores (en este caso columnas de tu DataFrame) a elementos posicionales (como el eje X o Y) o propiedades de tu marcador (como el color o el tamaño). Altair es una biblioteca para crear gráficos altamente configurables asi que simplemente enlistar todas las codificaciones posibles sería una manera muy ineficáz de aprender. La mejor manera de aprender es haciendo.

Tipos de Datos

altair hace un buen trabajo deduciendo el tipo de datos con el que estas trabajando al igual que pandas. Pero también puedes especificar el tipo de datos en tus gráficos. Altair reconoce 4 tipos de datos:

Tipo de datos Código Descripción
cuantitativo Q una cantidad continua y de números reales
ordinal O una cantidad discreta y ordenada
nominal N una cantidad discreta y desordenada
temporal T un valor de tiempo o fecha

En los ejercicios de este cápitulos aprenderás sobre las bastas opciones que tienes para representar tus datos de manera gráfica con altair.


anatomia de un grafico