Visualização de Dados com Seaborn Python

visualização de dados com Seaborn

Fala galera do mundo dos dados! A linguagem Python é muito utilizada para análise de dados. 📊🚀🎲3️⃣📈. Sendo assim, aqui vou mostrar como criar visualização de dados com Seaborn, umas das 5 libs apresentadas no artigo bibliotecas para visualização de dados em Python.

Então, você vai aprender a gerar os principais gráficos para visualização de dados com Seaborn Python:

Gráfico de Barra
Gráfico de Linha
Gráfico de Área
Gráfico de Dispersão
Gráfico de Caixa
Gráfico de Histograma
Gráfico de Mapa de Calor

Finalmente, agora é hora de criar as visualizações de dados ao cubo com a biblioteca Seaborn. Antes de tudo faremos a carga das bases de dados para utilizar nas visualizações.

Bases de Dados para Visualização

Primeiramente precisamos da base de dados, e utilizaremos conjuntos de dados disponíveis na biblioteca Seaborn. Dessa forma, o ideal para você praticar, é utilizar também outros conjuntos de dados. Você pode conseguir conjuntos de dados facilmente em plataformas como o Kaggle ou o Dados Abertos ou leia sobre bases de dados gratuitas para impulsionar suas análises de dados.

Aqui utilizaremos duas bases de dados, o primeiro é o conjunto de dados mpg. Que contém informações sobre carros. A importação é feita com o código Python abaixo.

# base de dados de carros
mpg = sns.load_dataset('mpg')
mpg.head(2)

Então, na imagem abaixo um exemplo dos dados carregados.

Em seguida, o segundo é o conjunto de dados flights. Que contém informações sobre voos ao longo dos anos. O código Python abaixo fará a importação.

# base de dados de voos
flights = sns.load_dataset('flights')
flights.head(2)

Então, confere os primeiros registros dos dados na imagem abaixo.

Com os dados carregados a partir da biblioteca Seaborn, podemos partir para a construção dos gráficos.

Gráfico de Barra Seaborn

O primeiro tipo de gráfico com o Seaborn Python é com o mais tradicional e conhecido por todos, o gráfico de barras. O código Python abaixo mostra como criar um gráfico de barras com o Seaborn.

sns.countplot(data=mpg,
              x='origin');

A função bar é responsável pela criação e a função show pela exibição em tela. Confere o gráfico de barras gerado na imagem abaixo.

Do gráfico de barras com Seaborn, vamos ao gráfico e linhas.

Gráfico de Linha Seaborn

É hora do gráfico de linha com o Seaborn, utilizado para analisar dados ao longo do tempo. O código Python abaixo mostra como criar um gráfico de linha com o Seaborn Python.

sns.lineplot(data=flights,
             x='year',
             y='passengers');

Plot é a função que cria o gráfico de linha com a biblioteca Seaborn. Como resultado a imagem abaixo.

Juntamente com o exemplo acima, algumas dicas para gráficos de linhas com o Seaborn.

Dicas Gráfico de Linha Seaborn

Essas dicas podem te ajudar a evoluir a sua visualização de dados:

Como colocar várias linhas em um mesmo gráfico? Basta incluir o parâmetro hue com a coluna que separa as linhas.
Como alterar a função de agregação do gráfico? Incluir o parâmetro estimator e informar o agragador.

Foram aplicadas essas dicas no código Python abaixo.

sns.lineplot(data=flights,
             x='year',
             y='passengers',
             hue='month',
             estimator=sum);

Assim temos o resultado do gráfico de linhas.

Das linhas à dispersão com a biblioteca Seaborn! 🎲

Gráfico de Dispersão Seaborn

Aqui vamos a uma análise bivariada, ou seja, analisando duas variáveis. Portanto, a ideia é estender como as variáveis se relacionam, e se existe uma correlação. Para tal visual temos o código abaixo.

sns.scatterplot(data=mpg,
                x='horsepower',
                y='acceleration');

Na sequência o resultado da função scatter, com o visual do gráfico de dispersão.

Na sequência algumas dicas para gráficos de linhas com o Seaborn.

Dicas Gráfico de Dispersão Seaborn

Essas dicas podem te ajudar a evoluir a sua visualização de dados:

Como identificar categorias no gráfico? Basta incluir o parâmetro hue com a categoria.
Como colocar estilo nas categorias do gráfico? Incluir o parâmetro style com a categoria.
Como colocar tamanho nas categorias do gráfico? Incluir o parâmetro size com a categoria.

Foram aplicadas essas dicas no código Python abaixo, use com moderação para não poluir o visual.

sns.scatterplot(data=mpg,
                x='horsepower',
                y='acceleration',
                hue='origin',
                style='origin',
                size='mpg');

Como resultado do gráfico de linhas.

Da dispersão dos dados aos outliers com gráfico de caixa.

Gráfico de Caixa Seaborn

Além de apontar os outliers, é importante para entender a distribuição dos dados através dos quartis representados no gráfico de caixa. Com o código Python a seguir temos o gráfico de caixa.

sns.boxplot(data=mpg, 
            x='horsepower');

Assim a imagem do gráfico de caixa abaixo é gerado com a função boxplot.

Na sequência algumas dicas para gráficos de linhas com o Seaborn.

Dicas Gráfico de Caixa Seaborn

Essas dicas podem te ajudar a evoluir a sua visualização de dados:

Como mudar o gráfico para a vertical? Simplesmente alterando o parâmetro de x para y.
Como incluir categorias do gráfico? Incluir a categoria no paramento x ou y, a depender da orientação desejada.

Foram aplicadas essas dicas no código Python abaixo.

sns.boxplot(data=mpg,
            y='horsepower',
            x='origin');

Como resultado do gráfico de caixas.

Da distribuição da caixa, para a distribuição do histograma com a biblioteca Seaborn Python.

Gráfico de Histograma Seaborn

Em busca da distribuição normal! É uma curva simétrica, unimodal com forma de sino. Ela é a principal distribuição e mais utilizada para modelar fenômenos naturais. O histograma ajuda o analista a entender o comportamento da distribuição dos dados. Para gerar esse tipo de gráfico temos o código Python abaixo.

sns.histplot(data=mpg,
             x='acceleration');

Na imagem abaixo temos um exemplo do gráfico de histograma gerado pelo código acima.

Na sequência algumas dicas para gráficos de linhas com o Seaborn.

Dicas Gráfico de Histograma Seaborn

Essas dicas podem te ajudar a evoluir a sua visualização de dados:

Como alterar os grupos de intervalos no gráfico? Basta incluir o parâmetro bin com o valor desejado.
Como incluir uma estimativa de densidade do kernel no gráfico? Incluir o parâmetro o kde como True.

Foram aplicadas essas dicas no código Python abaixo.

sns.histplot(data=mpg,
             x='acceleration',
             bins=10,
             kde=True);

Como resultado do gráfico de dispersão.

Partiu finalizar com o mapa de calor da biblioteca Seaborn.

Gráfico de Mapa de Calor Seaborn

Para entender a correlação entre as variáveis temos o mapa de calor. Com o código Python a seguir temos o gráfico de mapas calor da biblioteca Seaborn.

sns.heatmap(mpg.corr());

A imagem do gráfico de mapa de calor abaixo é gerado com a função heatmap.

Além disso, algumas dicas para gráficos de linhas com o Seaborn.

Dicas Gráfico de Mapa de Calor Seaborn

Essas dicas podem te ajudar a evoluir a sua visualização de dados:

Como incluir rótulos no gráfico? Basta incluir o parâmetro annot com o valor True.
Como formatar os rótulos no gráfico? Basta incluir o parâmetro fmt com a formatação desejada.
Como alterar as cores do gráfico? Basta incluir o parâmetro cmap com o mapeamento de cores desejado.

Foram aplicadas essas dicas no código Python abaixo.

sns.heatmap(mpg.corr(),
            annot=True,
            fmt=".1f",
            cmap="crest");

Olha o resultado do gráfico de mapas calor.

Portanto, a biblioteca Seabon Python é sensacional para visualização de dados! 📊🚀🎲3️⃣📈

Seaborn Python ao Cubo

E então, estes são os principais tipos gráficos para visualização de dados com Seaborn Python que vão ajudar e muito na construção do seu dataviz. Na sequência, teremos outras bibliotecas para visualização de dados em Python. Não perca os próximos conteúdos! Então, fica ligado aqui nas novidades com a nossa Newsletter. Um abraço e até a próxima!!!

Conteúdos ao Cubo

Se você curtiu o conteúdo, aqui no Dados ao Cubo tem muito mais. Então, deixo algumas sugestões de conteúdos que você pode gostar. Sempre falando sobre o mundo dos dados!

Finalizo com um convite para você ser Parceiro de Publicação Dados ao Cubo e escrever o próximo artigo, compartilhando conhecimento para toda a comunidade de dados.

Tiago Dias

Apaixonado por dados e tecnologia ❤️ , criando soluções com dados 📊 📈 , desde 2015, sempre buscando tornar os processos orientados! Com formação em Engenharia da Computação 💾 , MBA Gestão da Informação e Business Intelligence e Especialização em Data Science.

Também atuo como professor na área de dados. Nas horas vagas crio modelos de Machine Learning 🤖 com Python em desafios do Kaggle e escrevo no Dados ao Cubo sobre o mundo dos dados 🎲 !

Compartilhando conhecimentos sempre 🚀