Business Intelligence Data Analytics Data Science Estatística Python

Visualização de Dados com Altair Python

visualização de dados com Altair

Fala galera do mundo dos dados! A linguagem Python é muito utilizada para análise de dados. 📊🚀🎲3️⃣📈. Dessa forma , aqui vou mostrar como criar visualização de dados com Altair Python, umas das 5 libs apresentadas no artigo bibliotecas para visualização de dados em Python.

Então, você vai aprender a gerar os principais gráficos para visualização de dados com Altair Python:

  1. Gráfico de Barra
  2. Gráfico de Linha
  3. Gráfico de Área
  4. Gráfico de Pizza
  5. Gráfico de Dispersão
  6. Gráfico de Caixa
  7. Gráfico de Histograma

Finalmente, agora é hora de criar as visualizações de dados ao cubo com a biblioteca Python Altair. Antes de tudo faremos a carga das bases de dados para utilizar nas visualizações.

Bases de Dados para Visualização

Primeiramente precisamos da base de dados, e utilizaremos conjuntos de dados disponíveis na biblioteca Seaborn. Dessa forma, o ideal para você praticar, é utilizar também outros conjuntos de dados. Você pode conseguir conjuntos de dados facilmente em plataformas como o Kaggle ou o Dados Abertos ou leia sobre bases de dados gratuitas para impulsionar suas análises de dados.

Aqui utilizaremos duas bases de dados, o primeiro é o conjunto de dados mpg. Que contém informações sobre carros. A importação é feita com o código Python abaixo.

# base de dados de carros
mpg = sns.load_dataset('mpg')
mpg.head(2)

Então, na imagem abaixo um exemplo dos dados carregados.

Em seguida temos o segundo é o conjunto de dados flights. Que contém informações sobre voos ao longo dos anos. O código Python abaixo fará a importação.

# base de dados de voos
flights = sns.load_dataset('flights')
flights.head(2)

Então, confere os primeiros registros dos dados na imagem abaixo.

Com os dados carregados podemos partir para a construção dos gráficos com a biblioteca Altair Python.

Gráfico de Barra Altair

O primeiro exemplo com a biblioteca Python Altair é com o gráfico mais tradicional e conhecido por todos, o gráfico de barras. O código Python abaixo mostra como criar um gráfico de barras com o Altair Python.

alt.Chart(mpg).mark_bar().encode(
   x='origin',
   y='count()')

A função mark_bar é responsável pela criação. Confere o gráfico de barras gerado na imagem abaixo.

altair python

Do gráfico de barras, vamos ao gráfico e linhas.

Gráfico de Linha Altair

É hora do gráfico de linha com o Altair Python, utilizado para analisar dados ao longo do tempo. O código Python abaixo mostra como criar um gráfico de linha com a biblioteca Python Altair.

alt.Chart(flights).mark_line(interpolate='monotone').encode(
   x='year',
   y='passengers',
   color='month')

É a função mark_line que cria o gráfico de linha. Como resultado a imagem abaixo.

python altair

Das linhas as áreas.

Gráfico de Área Altair

Similar ao gráfico de linha, o gráfico de área traz além da evolução ao longo do tempo, a proporção de cada elemento em relação ao todo. Com o código a seguir será produzido o gráfico de área.

alt.Chart(flights).mark_area(opacity=0.3).encode(
   x='year',
   y='passengers',
   color='month')

A imagem abaixo é o resultado do gráfico de área, onde a função mark_area gera esse tipo de gráfico.

altair python

Seguimos da área até uma pizza!!! Essa biblioteca Altair Python é demais.

Gráfico de Pizza Altair

Agora o gráfico mais amado e odiado. Alguns repudiam a utilização desse tipo de gráfico, eu prefiro o bom senso de quando utilizar (caso não tenha outro jeito 😁), então use com moderação. Mas caso precise, o código Python abaixo irá te auxiliar.

alt.Chart(mpg).mark_arc().encode(
   theta='count()',
   color='origin')

E esse é o seu resultado! A pizza é toda sua.

python altair

Da pizza à dispersão! 🎲 

Gráfico de Dispersão Altair

Aqui vamos a uma análise bivariada, ou seja, analisando duas variáveis. A ideia é estender como as variáveis se relacionam, e se existe uma correlação. Para tal visual temos o código abaixo.

alt.Chart(mpg).mark_point().encode(
   x='horsepower',
   y='acceleration')

Na sequência o resultado da função mark_point, com o visual do gráfico de dispersão.

altair python

Da dispersão dos dados aos seus outliers com o gráfico de caixa.

Gráfico de Caixa Altair

Além de apontar os outliers, é importante para entender a distribuição dos dados através dos quartis representados no gráfico de caixa. Com o código Python a seguir temos o gráfico de caixa.

alt.Chart(mpg).mark_boxplot().encode(
   x='horsepower')

A imagem do gráfico de caixa abaixo é gerado com a função mark_boxplot.

python altair

Da distribuição da caixa, para a distribuição do histograma.

Gráfico de Histograma Altair

Em busca da distribuição normal! É uma curva simétrica, unimodal com forma de sino. Ela é a principal distribuição e mais utilizada para modelar fenômenos naturais. O histograma ajuda o analista a entender o comportamento da distribuição dos dados. Para gerar esse tipo de gráfico temos o código Python abaixo.

alt.Chart(mpg).mark_bar().encode(
   alt.X("acceleration", bin=True),
   y='count()')

Na imagem abaixo temos um exemplo do gráfico de histograma gerado pelo código acima.

altair python

Criar gráficos em Python com Altair pode ser uma alternativa interessante.

Altair Python ao Cubo

E então, estes são os principais gráficos para visualização de dados com Altair Python que vão ajudar e muito na construção do seu dataviz. Além disso, teremos outras bibliotecas para visualização de dados em Python. Portanto, não perca os próximos conteúdos! Então, fica ligado aqui nas novidades com a nossa Newsletter. Um abraço e até a próxima!!!

Conteúdos ao Cubo

Se você curtiu o conteúdo, aqui no Dados ao Cubo tem muito mais. Então, deixo algumas sugestões de conteúdos que você pode gostar. Sempre falando sobre o mundo dos dados!

Finalizo com um convite para você ser Parceiro de Publicação Dados ao Cubo e escrever o próximo artigo, compartilhando conhecimento para toda a comunidade de dados.

Gostou? Compartilhe!

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *