Fala galera do mundo dos dados! A linguagem Python é muito utilizada para análise de dados. 📊🚀🎲3️⃣📈. Dessa forma , aqui vou mostrar como criar visualização de dados com Altair Python, umas das 5 libs apresentadas no artigo bibliotecas para visualização de dados em Python.
Então, você vai aprender a gerar os principais gráficos para visualização de dados com Altair Python:
Finalmente, agora é hora de criar as visualizações de dados ao cubo com a biblioteca Python Altair. Antes de tudo faremos a carga das bases de dados para utilizar nas visualizações.
Primeiramente precisamos da base de dados, e utilizaremos conjuntos de dados disponíveis na biblioteca Seaborn. Dessa forma, o ideal para você praticar, é utilizar também outros conjuntos de dados. Você pode conseguir conjuntos de dados facilmente em plataformas como o Kaggle ou o Dados Abertos ou leia sobre bases de dados gratuitas para impulsionar suas análises de dados.
Aqui utilizaremos duas bases de dados, o primeiro é o conjunto de dados mpg. Que contém informações sobre carros. A importação é feita com o código Python abaixo.
# base de dados de carros mpg = sns.load_dataset('mpg') mpg.head(2)
Então, na imagem abaixo um exemplo dos dados carregados.
Em seguida temos o segundo é o conjunto de dados flights. Que contém informações sobre voos ao longo dos anos. O código Python abaixo fará a importação.
# base de dados de voos flights = sns.load_dataset('flights') flights.head(2)
Então, confere os primeiros registros dos dados na imagem abaixo.
Com os dados carregados podemos partir para a construção dos gráficos com a biblioteca Altair Python.
O primeiro exemplo com a biblioteca Python Altair é com o gráfico mais tradicional e conhecido por todos, o gráfico de barras. O código Python abaixo mostra como criar um gráfico de barras com o Altair Python.
alt.Chart(mpg).mark_bar().encode( x='origin', y='count()')
A função mark_bar é responsável pela criação. Confere o gráfico de barras gerado na imagem abaixo.
Do gráfico de barras, vamos ao gráfico e linhas.
É hora do gráfico de linha com o Altair Python, utilizado para analisar dados ao longo do tempo. O código Python abaixo mostra como criar um gráfico de linha com a biblioteca Python Altair.
alt.Chart(flights).mark_line(interpolate='monotone').encode( x='year', y='passengers', color='month')
É a função mark_line que cria o gráfico de linha. Como resultado a imagem abaixo.
Das linhas as áreas.
Similar ao gráfico de linha, o gráfico de área traz além da evolução ao longo do tempo, a proporção de cada elemento em relação ao todo. Com o código a seguir será produzido o gráfico de área.
alt.Chart(flights).mark_area(opacity=0.3).encode( x='year', y='passengers', color='month')
A imagem abaixo é o resultado do gráfico de área, onde a função mark_area gera esse tipo de gráfico.
Seguimos da área até uma pizza!!! Essa biblioteca Altair Python é demais.
Agora o gráfico mais amado e odiado. Alguns repudiam a utilização desse tipo de gráfico, eu prefiro o bom senso de quando utilizar (caso não tenha outro jeito 😁), então use com moderação. Mas caso precise, o código Python abaixo irá te auxiliar.
alt.Chart(mpg).mark_arc().encode( theta='count()', color='origin')
E esse é o seu resultado! A pizza é toda sua.
Da pizza à dispersão! 🎲
Aqui vamos a uma análise bivariada, ou seja, analisando duas variáveis. A ideia é estender como as variáveis se relacionam, e se existe uma correlação. Para tal visual temos o código abaixo.
alt.Chart(mpg).mark_point().encode( x='horsepower', y='acceleration')
Na sequência o resultado da função mark_point, com o visual do gráfico de dispersão.
Da dispersão dos dados aos seus outliers com o gráfico de caixa.
Além de apontar os outliers, é importante para entender a distribuição dos dados através dos quartis representados no gráfico de caixa. Com o código Python a seguir temos o gráfico de caixa.
alt.Chart(mpg).mark_boxplot().encode( x='horsepower')
A imagem do gráfico de caixa abaixo é gerado com a função mark_boxplot.
Da distribuição da caixa, para a distribuição do histograma.
Em busca da distribuição normal! É uma curva simétrica, unimodal com forma de sino. Ela é a principal distribuição e mais utilizada para modelar fenômenos naturais. O histograma ajuda o analista a entender o comportamento da distribuição dos dados. Para gerar esse tipo de gráfico temos o código Python abaixo.
alt.Chart(mpg).mark_bar().encode( alt.X("acceleration", bin=True), y='count()')
Na imagem abaixo temos um exemplo do gráfico de histograma gerado pelo código acima.
Criar gráficos em Python com Altair pode ser uma alternativa interessante.
E então, estes são os principais gráficos para visualização de dados com Altair Python que vão ajudar e muito na construção do seu dataviz. Além disso, teremos outras bibliotecas para visualização de dados em Python. Portanto, não perca os próximos conteúdos! Então, fica ligado aqui nas novidades com a nossa Newsletter. Um abraço e até a próxima!!!
Se você curtiu o conteúdo, aqui no Dados ao Cubo tem muito mais. Então, deixo algumas sugestões de conteúdos que você pode gostar. Sempre falando sobre o mundo dos dados!
Finalizo com um convite para você ser Parceiro de Publicação Dados ao Cubo e escrever o próximo artigo, compartilhando conhecimento para toda a comunidade de dados.
Apaixonado por dados e tecnologia ❤️ , criando soluções com dados 📊 📈 , desde 2015, sempre buscando tornar os processos orientados! Com formação em Engenharia da Computação 💾 , MBA Gestão da Informação e Business Intelligence e Especialização em Data Science.
Também atuo como professor na área de dados. Nas horas vagas crio modelos de Machine Learning 🤖 com Python em desafios do Kaggle e escrevo no Dados ao Cubo sobre o mundo dos dados 🎲 !
Compartilhando conhecimentos sempre 🚀
Fala Galera do mundo dos dados, hora de manipular dados no MongoDB com Python. Dessa…
Fala Galera do mundo dos dados, hora de manipular dados no Cassandra com Python. Dessa…
Fala galera do mundo dos dados, hoje é dia de aprender a função Select do Spark.…
Fala galera do mundo dos dados, hoje é dia de transformar consultas SQL em visualizações…
Fala galera do mundo dos dados, dando continuidade às consultas de banco de dados com…
Fala galera do mundo dos dados, hora de conhecer os bancos de dados NoSQL com…