Fala galera do mundo dos dados! A linguagem Python é muito utilizada para análise de dados. 📊🚀🎲3️⃣📈. Sendo assim, aqui vou mostrar como criar visualização de dados com Seaborn, umas das 5 libs apresentadas no artigo bibliotecas para visualização de dados em Python.
Então, você vai aprender a gerar os principais gráficos para visualização de dados com Seaborn Python:
Finalmente, agora é hora de criar as visualizações de dados ao cubo com a biblioteca Seaborn. Antes de tudo faremos a carga das bases de dados para utilizar nas visualizações.
Primeiramente precisamos da base de dados, e utilizaremos conjuntos de dados disponíveis na biblioteca Seaborn. Dessa forma, o ideal para você praticar, é utilizar também outros conjuntos de dados. Você pode conseguir conjuntos de dados facilmente em plataformas como o Kaggle ou o Dados Abertos ou leia sobre bases de dados gratuitas para impulsionar suas análises de dados.
Aqui utilizaremos duas bases de dados, o primeiro é o conjunto de dados mpg. Que contém informações sobre carros. A importação é feita com o código Python abaixo.
# base de dados de carros mpg = sns.load_dataset('mpg') mpg.head(2)
Então, na imagem abaixo um exemplo dos dados carregados.
Em seguida, o segundo é o conjunto de dados flights. Que contém informações sobre voos ao longo dos anos. O código Python abaixo fará a importação.
# base de dados de voos flights = sns.load_dataset('flights') flights.head(2)
Então, confere os primeiros registros dos dados na imagem abaixo.
Com os dados carregados a partir da biblioteca Seaborn, podemos partir para a construção dos gráficos.
O primeiro tipo de gráfico com o Seaborn Python é com o mais tradicional e conhecido por todos, o gráfico de barras. O código Python abaixo mostra como criar um gráfico de barras com o Seaborn.
sns.countplot(data=mpg, x='origin');
A função bar é responsável pela criação e a função show pela exibição em tela. Confere o gráfico de barras gerado na imagem abaixo.
Do gráfico de barras com Seaborn, vamos ao gráfico e linhas.
É hora do gráfico de linha com o Seaborn, utilizado para analisar dados ao longo do tempo. O código Python abaixo mostra como criar um gráfico de linha com o Seaborn Python.
sns.lineplot(data=flights, x='year', y='passengers');
Plot é a função que cria o gráfico de linha com a biblioteca Seaborn. Como resultado a imagem abaixo.
Juntamente com o exemplo acima, algumas dicas para gráficos de linhas com o Seaborn.
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
Foram aplicadas essas dicas no código Python abaixo.
sns.lineplot(data=flights, x='year', y='passengers', hue='month', estimator=sum);
Assim temos o resultado do gráfico de linhas.
Das linhas à dispersão com a biblioteca Seaborn! 🎲
Aqui vamos a uma análise bivariada, ou seja, analisando duas variáveis. Portanto, a ideia é estender como as variáveis se relacionam, e se existe uma correlação. Para tal visual temos o código abaixo.
sns.scatterplot(data=mpg, x='horsepower', y='acceleration');
Na sequência o resultado da função scatter, com o visual do gráfico de dispersão.
Na sequência algumas dicas para gráficos de linhas com o Seaborn.
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
Foram aplicadas essas dicas no código Python abaixo, use com moderação para não poluir o visual.
sns.scatterplot(data=mpg, x='horsepower', y='acceleration', hue='origin', style='origin', size='mpg');
Como resultado do gráfico de linhas.
Da dispersão dos dados aos outliers com gráfico de caixa.
Além de apontar os outliers, é importante para entender a distribuição dos dados através dos quartis representados no gráfico de caixa. Com o código Python a seguir temos o gráfico de caixa.
sns.boxplot(data=mpg, x='horsepower');
Assim a imagem do gráfico de caixa abaixo é gerado com a função boxplot.
Na sequência algumas dicas para gráficos de linhas com o Seaborn.
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
Foram aplicadas essas dicas no código Python abaixo.
sns.boxplot(data=mpg, y='horsepower', x='origin');
Como resultado do gráfico de caixas.
Da distribuição da caixa, para a distribuição do histograma com a biblioteca Seaborn Python.
Em busca da distribuição normal! É uma curva simétrica, unimodal com forma de sino. Ela é a principal distribuição e mais utilizada para modelar fenômenos naturais. O histograma ajuda o analista a entender o comportamento da distribuição dos dados. Para gerar esse tipo de gráfico temos o código Python abaixo.
sns.histplot(data=mpg, x='acceleration');
Na imagem abaixo temos um exemplo do gráfico de histograma gerado pelo código acima.
Na sequência algumas dicas para gráficos de linhas com o Seaborn.
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
Foram aplicadas essas dicas no código Python abaixo.
sns.histplot(data=mpg, x='acceleration', bins=10, kde=True);
Como resultado do gráfico de dispersão.
Partiu finalizar com o mapa de calor da biblioteca Seaborn.
Para entender a correlação entre as variáveis temos o mapa de calor. Com o código Python a seguir temos o gráfico de mapas calor da biblioteca Seaborn.
sns.heatmap(mpg.corr());
A imagem do gráfico de mapa de calor abaixo é gerado com a função heatmap.
Além disso, algumas dicas para gráficos de linhas com o Seaborn.
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
Foram aplicadas essas dicas no código Python abaixo.
sns.heatmap(mpg.corr(), annot=True, fmt=".1f", cmap="crest");
Olha o resultado do gráfico de mapas calor.
Portanto, a biblioteca Seabon Python é sensacional para visualização de dados! 📊🚀🎲3️⃣📈
E então, estes são os principais tipos gráficos para visualização de dados com Seaborn Python que vão ajudar e muito na construção do seu dataviz. Na sequência, teremos outras bibliotecas para visualização de dados em Python. Não perca os próximos conteúdos! Então, fica ligado aqui nas novidades com a nossa Newsletter. Um abraço e até a próxima!!!
Se você curtiu o conteúdo, aqui no Dados ao Cubo tem muito mais. Então, deixo algumas sugestões de conteúdos que você pode gostar. Sempre falando sobre o mundo dos dados!
Finalizo com um convite para você ser Parceiro de Publicação Dados ao Cubo e escrever o próximo artigo, compartilhando conhecimento para toda a comunidade de dados.
Apaixonado por dados e tecnologia ❤️ , criando soluções com dados 📊 📈 , desde 2015, sempre buscando tornar os processos orientados! Com formação em Engenharia da Computação 💾 , MBA Gestão da Informação e Business Intelligence e Especialização em Data Science.
Também atuo como professor na área de dados. Nas horas vagas crio modelos de Machine Learning 🤖 com Python em desafios do Kaggle e escrevo no Dados ao Cubo sobre o mundo dos dados 🎲 !
Compartilhando conhecimentos sempre 🚀
Fala Galera do mundo dos dados, hora de manipular dados no MongoDB com Python. Dessa…
Fala Galera do mundo dos dados, hora de manipular dados no Cassandra com Python. Dessa…
Fala galera do mundo dos dados, hoje é dia de aprender a função Select do Spark.…
Fala galera do mundo dos dados, hoje é dia de transformar consultas SQL em visualizações…
Fala galera do mundo dos dados, dando continuidade às consultas de banco de dados com…
Fala galera do mundo dos dados, hora de conhecer os bancos de dados NoSQL com…