Fala galera do mundo dos dados! A linguagem Python é muito utilizada para análise de dados. 📊🚀🎲3️⃣📈. Aqui vou mostrar como criar visualização de dados com Plotly, umas das 5 libs apresentadas no artigo bibliotecas para visualização de dados em Python.
Você vai aprender a gerar os principais gráficos para visualização de dados com Plotly:
Agora é hora de criar as visualizações de dados ao cubo. Para começar faremos a carga das bases de dados para utilizar nas visualizações.
Primeiramente precisamos da base de dados, e utilizaremos conjuntos de dados disponíveis na biblioteca Seaborn. O ideal para você praticar, é utilizar também outros conjuntos de dados. Você pode conseguir conjuntos de dados facilmente em plataformas como o Kaggle ou o Dados Abertos.
Aqui utilizaremos duas bases de dados, o primeiro é o conjunto de dados mpg. Que contém informações sobre carros. A importação é feita com o código Python abaixo.
# base de dados de carros mpg = sns.load_dataset('mpg') mpg.head(2)
Na imagem abaixo um exemplo dos dados carregados.
O segundo é o conjunto de dados flights. Que contém informações sobre voos ao longo dos anos. O código Python abaixo fará a importação.
# base de dados de voos flights = sns.load_dataset('flights') flights.head(2)
Confere os primeiros registros dos dados na imagem abaixo.
Com os dados carregados podemos partir para a construção dos gráficos.
O primeiro exemplo com o Plotly é com o gráfico mais tradicional e conhecido por todos, o gráfico de barras. O código Python abaixo mostra como criar um gráfico de barras com o Plotly.
px.bar(data_frame=mpg, x='origin', width=400, height=400)
A função bar é responsável pela criação. Confere o gráfico de barras gerado na imagem abaixo.
Na sequência algumas dicas para gráficos de barras com o Plotly.
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
Foram aplicadas essas dicas no código Python abaixo.
px.bar(data_frame=mpg, x='origin', color='origin', width=400, height=400)
Olha o resultado do gráfico de linhas.
Do gráfico de barras, vamos ao gráfico e linhas.
É hora do gráfico de linha com o Plotly, utilizado para analisar dados ao longo do tempo. O código Python abaixo mostra como criar um gráfico de linha com o Plotly.
px.line(data_frame=flights, x='year', y='passengers', width=400, height=400)
Line é a função que cria o gráfico de linha. Confere o resultado na imagem abaixo.
Na sequência algumas dicas para gráficos de linhas com o Plotly.
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
Foram aplicadas essas dicas no código Python abaixo.
px.line(data_frame=flights, x='year', y='passengers', line_group='month', color='month', width=400, height=400)
Olha o resultado do gráfico de linhas.
Seguimos das linhas para as áreas.
Similar ao gráfico de linha, o gráfico de área traz além da evolução ao longo do tempo, a proporção de cada elemento em relação ao todo. Com o código a seguir será produzido o gráfico de área.
px.area(data_frame=flights, x='year', y='passengers', width=400, height=400)
A imagem abaixo é o resultado do gráfico de área, onde a função area gera esse tipo de gráfico.
Na sequência algumas dicas para gráficos de áreas com o Plotly.
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
Foram aplicadas essas dicas no código Python abaixo.
px.area(data_frame=flights, x='year', y='passengers', line_group='month', color='month', width=400, height=400)
Olha o resultado do gráfico de linhas.
Seguimos da área até uma pizza!!!
Agora o gráfico mais amado e odiado. Alguns repudiam a utilização desse tipo de gráfico, eu prefiro o bom senso de quando utilizar (caso não tenha outro jeito 😁), então use com moderação. Mas caso precise, o código Python abaixo irá te auxiliar.
px.pie(data_frame=mpg, names='origin', width=400, height=400)
E esse é o seu resultado da função pie! A pizza é toda sua.
Da pizza à dispersão! 🎲
Aqui vamos a uma análise bivariada, ou seja, analisando duas variáveis. A ideia é entender como as variáveis se relacionam, e se existe uma correlação. Para tal visual temos o código abaixo.
px.scatter(data_frame=mpg, x='horsepower', y='acceleration', width=400, height=400)
Na sequência o resultado da função scatter, com o visual do gráfico de dispersão.
Na sequência algumas dicas para gráficos de linhas com o Plotly.
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
Foram aplicadas essas dicas no código Python abaixo.
px.scatter(data_frame=mpg, x='horsepower', y='acceleration', color='origin', symbol='origin', size='mpg', width=400, height=400)
Olha o resultado do gráfico de dispersão.
Da dispersão dos dados aos seus outliers com gráfico de caixa.
Além de apontar os outliers, este visual é importante para entender a distribuição dos dados através dos quartis representados no gráfico de caixa. Com o código Python a seguir temos o gráfico de caixa.
px.box(data_frame=mpg, x='horsepower', width=400,height=400)
A imagem do gráfico de caixa abaixo é gerado com a função box.
Na sequência algumas dicas para gráficos de caixa com o Plotly.
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
Confere as dicas no código Python abaixo.
px.box(data_frame=mpg, y='horsepower', x='origin', width=400,height=400)
Olha o resultado do gráfico de caixas.
Da distribuição da caixa, para a distribuição do histograma.
Em busca da distribuição normal! É uma curva simétrica, unimodal com forma de sino. Ela é a principal distribuição e mais utilizada para modelar fenômenos naturais. O histograma ajuda o analista a entender o comportamento da distribuição dos dados. Para gerar esse tipo de gráfico temos o código Python abaixo.
px.histogram(data_frame=mpg, x='acceleration', width=400,height=400)
Na imagem abaixo temos um exemplo do gráfico de histograma gerado pelo código acima.
Na sequência algumas dicas para gráficos de histogramas com o Plotly.
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
Confere as dicas no código Python abaixo.
px.histogram(data_frame=mpg, x='acceleration', color='origin', nbins=10, width=400,height=400)
Olha o resultado do gráfico de histograma.
Depois de analisar a distribuição, vamos ver a correlação com o mapa de calor.
Para entender a correlação entre as variáveis temos o mapa de calor. Com o código Python a seguir temos o gráfico de mapas calor.
px.density_heatmap(data_frame=mpg, x='mpg', y='horsepower', width=400,height=400)
A função density_heatmap gera o gráfico de mapa de calor da imagem a seguir.
Na sequência algumas dicas para gráficos de mapa de calor com o Plotly.
Essas dicas podem te ajudar a evoluir a sua visualização de dados:
Essas dicas estão no código Python abaixo.
px.density_heatmap(data_frame=mpg, x='mpg', y='horsepower', text_auto=True, width=400,height=400)
Olha o resultado do gráfico de mapa de calor.
E então, estes são os principais gráficos para visualização de dados com Plotly Python que vão ajudar e muito na construção do seu dataviz. Na sequência, teremos outras bibliotecas para visualização de dados em Python. Não perca os próximos conteúdos! Então, fica ligado aqui nas novidades com a nossa Newsletter. Um abraço e até a próxima!!!
Se você curtiu o conteúdo, aqui no Dados ao Cubo tem muito mais. Então, deixo algumas sugestões de conteúdos que você pode gostar. Sempre falando sobre o mundo dos dados!
Finalizo com um convite para você ser Parceiro de Publicação Dados ao Cubo e escrever o próximo artigo, compartilhando conhecimento para toda a comunidade de dados.
Apaixonado por dados e tecnologia ❤️ , criando soluções com dados 📊 📈 , desde 2015, sempre buscando tornar os processos orientados! Com formação em Engenharia da Computação 💾 , MBA Gestão da Informação e Business Intelligence e Especialização em Data Science.
Também atuo como professor na área de dados. Nas horas vagas crio modelos de Machine Learning 🤖 com Python em desafios do Kaggle e escrevo no Dados ao Cubo sobre o mundo dos dados 🎲 !
Compartilhando conhecimentos sempre 🚀
Fala Galera do mundo dos dados, hora de manipular dados no MongoDB com Python. Dessa…
Fala Galera do mundo dos dados, hora de manipular dados no Cassandra com Python. Dessa…
Fala galera do mundo dos dados, hoje é dia de aprender a função Select do Spark.…
Fala galera do mundo dos dados, hoje é dia de transformar consultas SQL em visualizações…
Fala galera do mundo dos dados, dando continuidade às consultas de banco de dados com…
Fala galera do mundo dos dados, hora de conhecer os bancos de dados NoSQL com…