Anatomía de un Gráfico
Cada gráfico en altair
es compuesto al describir un mínimo de tres elementos:
- Datos
- Marcadores
- Codificaciones
Datos
Altair
acepta datasets de 3 maneras:
- un
DataFrame
depandas
- un objeto de clase
Data
dealtair
- datos en formato
JSON
ocsv
de manera directa
Nosotros trabajaremos con DataFrames
de pandas
.
Pandas
es una de las mejores opciones para trabajar con estructuras de datos en python
. El nombre pandas
proviene de Python Data Analysis Library. pandas
esta basada en numpy
(de Numeric Python) la cual provee estructuras de datos (arrays o matrices) las cuales pandas
utiliza para crear DataFrames. Un DataFrame es una estructura de datos en la cual se pueden guardar datos de distintos tipos (cadenas de caractéres (strings), integers, floats, y más) en cada columna. Es similar a una tabla o una planilla de Excel o Google Spreadsheets.
Como es una estructura de python
claro que su índice comienza en 0.
Marcadores
El marcador en un gráfico es la representación visual de tus datos. Altair
ofrece los siguientes marcadores hasta el momento:
Marcador | Método | Descripción | Ejemplo |
---|---|---|---|
area | mark_area() | Un gráfico de area. | Simple Stacked Area Chart |
barra | mark_bar() | Un gráfico de barras. | Simple Bar Chart |
círculo | mark_circle() | Un diagrama de dispersión con círculos rellenos. | One Dot Per Zipcode |
geofigura | mark_geoshape() | Una fígura geográfica. | Choropleth Map |
línea | mark_line() | Un gráfico de líneas. | Simple Line Chart |
punto | mark_point() | Un diagrama de dispersión con formas de puntos configurables. | Faceted Scatter Plot with Linked Brushing |
rectángulo | mark_rect() | Un rectángulo relleno, usado para mapas de calor (heatmaps). | Simple Heatmap |
regla | mark_rule() | Una línea vertical u horizontal que abarca el eje. | Candlestick Chart |
cuadrado | mark_square() | Un diagrama de dispersián con cuadrados. | N/A |
texto | mark_text() | Un diagrama de dispersián con los puntos representados con texto. | Simple Bar Chart with Labels |
marca | mark_tick() | Una marca o línea horizontal o vertical. | Strip Plot |
Codificaciones
Un gráfico es una representación visual de tus datos. Es esencial conectar tu información a un elemento visual en el gráfico. En altair
eso se le conoce como encode o codificar tus datos. Es el proceso de asignar valores (en este caso columnas de tu DataFrame) a elementos posicionales (como el eje X o Y) o propiedades de tu marcador (como el color o el tamaño).
Altair
es una biblioteca para crear gráficos altamente configurables asi que simplemente enlistar todas las codificaciones posibles sería una manera muy ineficáz de aprender. La mejor manera de aprender es haciendo.
Tipos de Datos
altair
hace un buen trabajo deduciendo el tipo de datos con el que estas trabajando al igual que pandas
. Pero también puedes especificar el tipo de datos en tus gráficos. Altair
reconoce 4 tipos de datos:
Tipo de datos | Código | Descripción |
---|---|---|
cuantitativo | Q | una cantidad continua y de números reales |
ordinal | O | una cantidad discreta y ordenada |
nominal | N | una cantidad discreta y desordenada |
temporal | T | un valor de tiempo o fecha |
En los ejercicios de este cápitulos aprenderás sobre las bastas opciones que tienes para representar tus datos de manera gráfica con altair
.