Fala galera do mundo dos dados! A linguagem Python é muito utilizada para análise de dados. 📊🚀🎲3️⃣📈. Sendo assim, aqui vou mostrar como criar visualização de dados com Seaborn, umas das 5 libs apresentadas no artigo bibliotecas para visualização de dados em Python.
Então, você vai aprender a gerar os principais gráficos para visualização de dados com Seaborn Python:
- Gráfico de Barra
- Gráfico de Linha
- Gráfico de Área
- Gráfico de Dispersão
- Gráfico de Caixa
- Gráfico de Histograma
- Gráfico de Mapa de Calor
Finalmente, agora é hora de criar as visualizações de dados ao cubo com a biblioteca Seaborn. Antes de tudo faremos a carga das bases de dados para utilizar nas visualizações.
Bases de Dados para Visualização
Primeiramente precisamos da base de dados, e utilizaremos conjuntos de dados disponíveis na biblioteca Seaborn. Dessa forma, o ideal para você praticar, é utilizar também outros conjuntos de dados. Você pode conseguir conjuntos de dados facilmente em plataformas como o Kaggle ou o Dados Abertos ou leia sobre bases de dados gratuitas para impulsionar suas análises de dados.
Aqui utilizaremos duas bases de dados, o primeiro é o conjunto de dados mpg. Que contém informações sobre carros. A importação é feita com o código Python abaixo.
# base de dados de carros mpg = sns.load_dataset('mpg') mpg.head(2)
Então, na imagem abaixo um exemplo dos dados carregados.
Em seguida, o segundo é o conjunto de dados flights. Que contém informações sobre voos ao longo dos anos. O código Python abaixo fará a importação.
# base de dados de voos flights = sns.load_dataset('flights') flights.head(2)
Então, confere os primeiros registros dos dados na imagem abaixo.
Com os dados carregados a partir da biblioteca Seaborn, podemos partir para a construção dos gráficos.
Gráfico de Barra Seaborn
O primeiro tipo de gráfico com o Seaborn Python é com o mais tradicional e conhecido por todos, o gráfico de barras. O código Python abaixo mostra como criar um gráfico de barras com o Seaborn.
sns.countplot(data=mpg, x='origin');
A função bar é responsável pela criação e a função show pela exibição em tela. Confere o gráfico de barras gerado na imagem abaixo.
Do gráfico de barras com Seaborn, vamos ao gráfico e linhas.
Gráfico de Linha Seaborn
É hora do gráfico de linha com o Seaborn, utilizado para analisar dados ao longo do tempo. O código Python abaixo mostra como criar um gráfico de linha com o Seaborn Python.
sns.lineplot(data=flights, x='year', y='passengers');
Plot é a função que cria o gráfico de linha com a biblioteca Seaborn. Como resultado a imagem abaixo.
Juntamente com o exemplo acima, algumas dicas para gráficos de linhas com o Seaborn.
Dicas Gráfico de Linha Seaborn
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
- Como colocar várias linhas em um mesmo gráfico? Basta incluir o parâmetro hue com a coluna que separa as linhas.
- Como alterar a função de agregação do gráfico? Incluir o parâmetro estimator e informar o agragador.
Foram aplicadas essas dicas no código Python abaixo.
sns.lineplot(data=flights, x='year', y='passengers', hue='month', estimator=sum);
Assim temos o resultado do gráfico de linhas.
Das linhas à dispersão com a biblioteca Seaborn! 🎲
Gráfico de Dispersão Seaborn
Aqui vamos a uma análise bivariada, ou seja, analisando duas variáveis. Portanto, a ideia é estender como as variáveis se relacionam, e se existe uma correlação. Para tal visual temos o código abaixo.
sns.scatterplot(data=mpg, x='horsepower', y='acceleration');
Na sequência o resultado da função scatter, com o visual do gráfico de dispersão.
Na sequência algumas dicas para gráficos de linhas com o Seaborn.
Dicas Gráfico de Dispersão Seaborn
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
- Como identificar categorias no gráfico? Basta incluir o parâmetro hue com a categoria.
- Como colocar estilo nas categorias do gráfico? Incluir o parâmetro style com a categoria.
- Como colocar tamanho nas categorias do gráfico? Incluir o parâmetro size com a categoria.
Foram aplicadas essas dicas no código Python abaixo, use com moderação para não poluir o visual.
sns.scatterplot(data=mpg, x='horsepower', y='acceleration', hue='origin', style='origin', size='mpg');
Como resultado do gráfico de linhas.
Da dispersão dos dados aos outliers com gráfico de caixa.
Gráfico de Caixa Seaborn
Além de apontar os outliers, é importante para entender a distribuição dos dados através dos quartis representados no gráfico de caixa. Com o código Python a seguir temos o gráfico de caixa.
sns.boxplot(data=mpg, x='horsepower');
Assim a imagem do gráfico de caixa abaixo é gerado com a função boxplot.
Na sequência algumas dicas para gráficos de linhas com o Seaborn.
Dicas Gráfico de Caixa Seaborn
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
- Como mudar o gráfico para a vertical? Simplesmente alterando o parâmetro de x para y.
- Como incluir categorias do gráfico? Incluir a categoria no paramento x ou y, a depender da orientação desejada.
Foram aplicadas essas dicas no código Python abaixo.
sns.boxplot(data=mpg, y='horsepower', x='origin');
Como resultado do gráfico de caixas.
Da distribuição da caixa, para a distribuição do histograma com a biblioteca Seaborn Python.
Gráfico de Histograma Seaborn
Em busca da distribuição normal! É uma curva simétrica, unimodal com forma de sino. Ela é a principal distribuição e mais utilizada para modelar fenômenos naturais. O histograma ajuda o analista a entender o comportamento da distribuição dos dados. Para gerar esse tipo de gráfico temos o código Python abaixo.
sns.histplot(data=mpg, x='acceleration');
Na imagem abaixo temos um exemplo do gráfico de histograma gerado pelo código acima.
Na sequência algumas dicas para gráficos de linhas com o Seaborn.
Dicas Gráfico de Histograma Seaborn
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
- Como alterar os grupos de intervalos no gráfico? Basta incluir o parâmetro bin com o valor desejado.
- Como incluir uma estimativa de densidade do kernel no gráfico? Incluir o parâmetro o kde como True.
Foram aplicadas essas dicas no código Python abaixo.
sns.histplot(data=mpg, x='acceleration', bins=10, kde=True);
Como resultado do gráfico de dispersão.
Partiu finalizar com o mapa de calor da biblioteca Seaborn.
Gráfico de Mapa de Calor Seaborn
Para entender a correlação entre as variáveis temos o mapa de calor. Com o código Python a seguir temos o gráfico de mapas calor da biblioteca Seaborn.
sns.heatmap(mpg.corr());
A imagem do gráfico de mapa de calor abaixo é gerado com a função heatmap.
Além disso, algumas dicas para gráficos de linhas com o Seaborn.
Dicas Gráfico de Mapa de Calor Seaborn
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
- Como incluir rótulos no gráfico? Basta incluir o parâmetro annot com o valor True.
- Como formatar os rótulos no gráfico? Basta incluir o parâmetro fmt com a formatação desejada.
- Como alterar as cores do gráfico? Basta incluir o parâmetro cmap com o mapeamento de cores desejado.
Foram aplicadas essas dicas no código Python abaixo.
sns.heatmap(mpg.corr(), annot=True, fmt=".1f", cmap="crest");
Olha o resultado do gráfico de mapas calor.
Portanto, a biblioteca Seabon Python é sensacional para visualização de dados! 📊🚀🎲3️⃣📈
Seaborn Python ao Cubo
E então, estes são os principais tipos gráficos para visualização de dados com Seaborn Python que vão ajudar e muito na construção do seu dataviz. Na sequência, teremos outras bibliotecas para visualização de dados em Python. Não perca os próximos conteúdos! Então, fica ligado aqui nas novidades com a nossa Newsletter. Um abraço e até a próxima!!!
Conteúdos ao Cubo
Se você curtiu o conteúdo, aqui no Dados ao Cubo tem muito mais. Então, deixo algumas sugestões de conteúdos que você pode gostar. Sempre falando sobre o mundo dos dados!
- Modelos de Machine Learning com Scikit-Learn
- Importar CSV no PostgreSQL com o DBeaver
- BI do Problema ao Dashboard
- API com Python, o Céu é o Limite!
- Extrair Texto de Vídeo com Python
- Time de Dados na Prática
- Leitura de Textos com Emoji
- Estruturas de Dados em Python
Finalizo com um convite para você ser Parceiro de Publicação Dados ao Cubo e escrever o próximo artigo, compartilhando conhecimento para toda a comunidade de dados.
Apaixonado por dados e tecnologia ❤️ , criando soluções com dados 📊 📈 , desde 2015, sempre buscando tornar os processos orientados! Com formação em Engenharia da Computação 💾 , MBA Gestão da Informação e Business Intelligence e Especialização em Data Science.
Também atuo como professor na área de dados. Nas horas vagas crio modelos de Machine Learning 🤖 com Python em desafios do Kaggle e escrevo no Dados ao Cubo sobre o mundo dos dados 🎲 !
Compartilhando conhecimentos sempre 🚀