Fala galera do mundo dos dados, já conhecem a biblioteca Lux? A análise de dados não se trata apenas de números e estatísticas, sendo assim, visualizar os dados é essencial para compreender padrões e extrair insights valiosos, já mostramos várias Bibliotecas Para Visualização de Dados em Python. Uma outra ferramenta poderosa nesse contexto é a biblioteca Lux em Python. Neste artigo, exploraremos como o Lux pode elevar sua análise de dados, proporcionando uma experiência visual enriquecedora.
O Lux é uma biblioteca de visualização de dados que se integra perfeitamente ao ambiente de análise de dados em Python. Ela oferece uma abordagem inovadora, simplificando o processo de visualização e permitindo que usuários explorem seus dados de maneira interativa.
Veremos na prática como utilizar a biblioteca Lux para fazer o data discovery de uma base de dados do Kaggle.
A base de dados de aluguel que está disponível no Kaggle e é possível analisar muitas outras bases disponíveis na plataforma. Para quem não conhece o Kaggle, sugiro ler o artigo Introdução a Competições de Ciência de Dados no Kaggle.
Para começar a utilizar o Lux, basta instalar a biblioteca usando o pip.
pip install lux-api
Após a instalação, importe o Lux no seu ambiente Jupyter e comece a explorar seus dados:
import lux import pandas as pd
Para usar a biblioteca Lux no colab, utilize o comando a seguir.
from google.colab import output output.enable_custom_widget_manager()
Vamos considerar um exemplo simples de análise de dados usando o Lux. Suponha que temos um DataFrame chamado `df`, e imprtamos o conjunto de dados do kaggle casas para aluguel no Brasil.
df = pd.read_csv("/content/houses_to_rent_v2.csv") df.head()
Na imagem podemos ver as primeiras linhas do conjunto de dados.
Observe ainda o botão Toggle Pandas/Lux com ele acionamos as funcionalidades da biblioteca Lux.
Ao executar este código, o Lux automaticamente sugere visualizações relevantes, permitindo uma exploração visual imediata do conjunto de dados.
Correlação – Temos uma aba onde ele mostra as correlações entre as variáveis.
Distribuição – Em uma outra ele apresenta as distribuições das variáveis.
Ocorrência – E complementa com a frequência de valores das variáveis.
Aqui já nos permite conhecer muito melhor o nosso conjunto de dados e como ele está estruturado. E então, podemos evoluir a análise com algumas variáveis específicas.
Informamos duas variáveis para o Lux evoluir nossa análise.
df.intent = ["rent amount (R$)","fire insurance (R$)"] df
Dessa forma, temos um detalhamento dessas variáveis.
Realçar – Temos um destaque na correlação com a inclusão de outros atributos na análise.
Filtros – Também uma outra perspectiva na correlação com a inclusão de filtros na análise.
Geral – Fechando a correlação com uma generalização da distribuição.
Ainda tem mais!
Podemos ainda fixar alguns gráficos como o exemplo abaixo.
from lux.vis.Vis import Vis Vis(["city=São Paulo","rent amount (R$)"],df)
Aqui temos a distribuição com um filtro de algum atributo específico.
Ou podemos ver de um outro ponto de vista, sem especificar o valor do filtro.
from lux.vis.VisList import VisList VisList(["city=?","rent amount (R$)"],df)
Então temos a distribuição para cada valor do filtro possível.
Aqui nós finalizamos, mas aí é só o comecinho de uma análise de dados!!! Agora vai começar a diversão. Confere a documentação da biblioteca para evoluir ainda mais, e não deixe de usar outras ferramentas para deixar seu data discovery ainda mais completo!
Portanto, temos aqui como dar o start na Biblioteca Lux, uma adição valiosa ao ecossistema Python para análise de dados. Sua capacidade de simplificar a análise visual e revelar insights automaticamente faz dele uma ferramenta poderosa para cientistas de dados e analistas. Ao incorporar o Lux em seu fluxo de trabalho, você pode elevar a análise de dados a um novo patamar de eficiência e compreensão.
Experimente o Lux em seu próximo projeto de análise de dados e descubra como essa biblioteca pode transformar sua abordagem visual para insights mais rápidos e profundos. Um abraço do Dados ao Cubo e até a próxima.
Então, se você curtiu o conteúdo, aqui no Dados ao Cubo tem muito mais. Então, deixo algumas sugestões de conteúdos que você pode encontrar. Sempre falando sobre o mundo dos dados!
Para finalizar, se torne também Parceiro de Publicação Dados ao Cubo. Escreva o próximo artigo e compartilhe conhecimento para toda a comunidade de dados.
Apaixonado por dados e tecnologia ❤️ , criando soluções com dados 📊 📈 , desde 2015, sempre buscando tornar os processos orientados! Com formação em Engenharia da Computação 💾 , MBA Gestão da Informação e Business Intelligence e Especialização em Data Science.
Também atuo como professor na área de dados. Nas horas vagas crio modelos de Machine Learning 🤖 com Python em desafios do Kaggle e escrevo no Dados ao Cubo sobre o mundo dos dados 🎲 !
Compartilhando conhecimentos sempre 🚀
Fala Galera do mundo dos dados, hora de manipular dados no MongoDB com Python. Dessa…
Fala Galera do mundo dos dados, hora de manipular dados no Cassandra com Python. Dessa…
Fala galera do mundo dos dados, hoje é dia de aprender a função Select do Spark.…
Fala galera do mundo dos dados, hoje é dia de transformar consultas SQL em visualizações…
Fala galera do mundo dos dados, dando continuidade às consultas de banco de dados com…
Fala galera do mundo dos dados, hora de conhecer os bancos de dados NoSQL com…