Fala galera do mundo dos dados! A linguagem Python é muito utilizada para análise de dados. 📊🚀🎲3️⃣📈. Dessa forma , aqui vou mostrar como criar visualização de dados com Altair Python, umas das 5 libs apresentadas no artigo bibliotecas para visualização de dados em Python.
Então, você vai aprender a gerar os principais gráficos para visualização de dados com Altair Python:
- Gráfico de Barra
- Gráfico de Linha
- Gráfico de Área
- Gráfico de Pizza
- Gráfico de Dispersão
- Gráfico de Caixa
- Gráfico de Histograma
Finalmente, agora é hora de criar as visualizações de dados ao cubo com a biblioteca Python Altair. Antes de tudo faremos a carga das bases de dados para utilizar nas visualizações.
Bases de Dados para Visualização
Primeiramente precisamos da base de dados, e utilizaremos conjuntos de dados disponíveis na biblioteca Seaborn. Dessa forma, o ideal para você praticar, é utilizar também outros conjuntos de dados. Você pode conseguir conjuntos de dados facilmente em plataformas como o Kaggle ou o Dados Abertos ou leia sobre bases de dados gratuitas para impulsionar suas análises de dados.
Aqui utilizaremos duas bases de dados, o primeiro é o conjunto de dados mpg. Que contém informações sobre carros. A importação é feita com o código Python abaixo.
# base de dados de carros mpg = sns.load_dataset('mpg') mpg.head(2)
Então, na imagem abaixo um exemplo dos dados carregados.

Em seguida temos o segundo é o conjunto de dados flights. Que contém informações sobre voos ao longo dos anos. O código Python abaixo fará a importação.
# base de dados de voos flights = sns.load_dataset('flights') flights.head(2)
Então, confere os primeiros registros dos dados na imagem abaixo.

Com os dados carregados podemos partir para a construção dos gráficos com a biblioteca Altair Python.
Gráfico de Barra Altair
O primeiro exemplo com a biblioteca Python Altair é com o gráfico mais tradicional e conhecido por todos, o gráfico de barras. O código Python abaixo mostra como criar um gráfico de barras com o Altair Python.
alt.Chart(mpg).mark_bar().encode( x='origin', y='count()')
A função mark_bar é responsável pela criação. Confere o gráfico de barras gerado na imagem abaixo.

Do gráfico de barras, vamos ao gráfico e linhas.
Gráfico de Linha Altair
É hora do gráfico de linha com o Altair Python, utilizado para analisar dados ao longo do tempo. O código Python abaixo mostra como criar um gráfico de linha com a biblioteca Python Altair.
alt.Chart(flights).mark_line(interpolate='monotone').encode( x='year', y='passengers', color='month')
É a função mark_line que cria o gráfico de linha. Como resultado a imagem abaixo.

Das linhas as áreas.
Gráfico de Área Altair
Similar ao gráfico de linha, o gráfico de área traz além da evolução ao longo do tempo, a proporção de cada elemento em relação ao todo. Com o código a seguir será produzido o gráfico de área.
alt.Chart(flights).mark_area(opacity=0.3).encode( x='year', y='passengers', color='month')
A imagem abaixo é o resultado do gráfico de área, onde a função mark_area gera esse tipo de gráfico.

Seguimos da área até uma pizza!!! Essa biblioteca Altair Python é demais.
Gráfico de Pizza Altair
Agora o gráfico mais amado e odiado. Alguns repudiam a utilização desse tipo de gráfico, eu prefiro o bom senso de quando utilizar (caso não tenha outro jeito 😁), então use com moderação. Mas caso precise, o código Python abaixo irá te auxiliar.
alt.Chart(mpg).mark_arc().encode( theta='count()', color='origin')
E esse é o seu resultado! A pizza é toda sua.

Da pizza à dispersão! 🎲
Gráfico de Dispersão Altair
Aqui vamos a uma análise bivariada, ou seja, analisando duas variáveis. A ideia é estender como as variáveis se relacionam, e se existe uma correlação. Para tal visual temos o código abaixo.
alt.Chart(mpg).mark_point().encode( x='horsepower', y='acceleration')
Na sequência o resultado da função mark_point, com o visual do gráfico de dispersão.

Da dispersão dos dados aos seus outliers com o gráfico de caixa.
Gráfico de Caixa Altair
Além de apontar os outliers, é importante para entender a distribuição dos dados através dos quartis representados no gráfico de caixa. Com o código Python a seguir temos o gráfico de caixa.
alt.Chart(mpg).mark_boxplot().encode( x='horsepower')
A imagem do gráfico de caixa abaixo é gerado com a função mark_boxplot.

Da distribuição da caixa, para a distribuição do histograma.
Gráfico de Histograma Altair
Em busca da distribuição normal! É uma curva simétrica, unimodal com forma de sino. Ela é a principal distribuição e mais utilizada para modelar fenômenos naturais. O histograma ajuda o analista a entender o comportamento da distribuição dos dados. Para gerar esse tipo de gráfico temos o código Python abaixo.
alt.Chart(mpg).mark_bar().encode( alt.X("acceleration", bin=True), y='count()')
Na imagem abaixo temos um exemplo do gráfico de histograma gerado pelo código acima.

Criar gráficos em Python com Altair pode ser uma alternativa interessante.
Altair Python ao Cubo
E então, estes são os principais gráficos para visualização de dados com Altair Python que vão ajudar e muito na construção do seu dataviz. Além disso, teremos outras bibliotecas para visualização de dados em Python. Portanto, não perca os próximos conteúdos! Então, fica ligado aqui nas novidades com a nossa Newsletter. Um abraço e até a próxima!!!
Conteúdos ao Cubo
Se você curtiu o conteúdo, aqui no Dados ao Cubo tem muito mais. Então, deixo algumas sugestões de conteúdos que você pode gostar. Sempre falando sobre o mundo dos dados!
- Modelos de Machine Learning com Scikit-Learn
- Importar CSV no PostgreSQL com o DBeaver
- BI do Problema ao Dashboard
- API com Python, o Céu é o Limite!
- Extrair Texto de Vídeo com Python
- Time de Dados na Prática
- Extraindo Texto de Arquivos PDF com Python
- Variáveis em Python
Finalizo com um convite para você ser Parceiro de Publicação Dados ao Cubo e escrever o próximo artigo, compartilhando conhecimento para toda a comunidade de dados.

Baiano, apaixonado por dados e tecnologia, amante das inovações tecnológicas que facilitam a vida humana! Formado em Engenharia da Computação e com MBA em Gestão da Informação e Business Intelligence e especialização em Data Science. Atualmente atua como Data Tech Lead na Lopes, além de Professor na área de dados e nas horas vagas cria uns modelos de Machine Learning com Python e soluções diversas com dados!