Data Discovery com a Biblioteca Lux Python

data_discovery_lux

Fala galera do mundo dos dados, já conhecem a biblioteca Lux? A análise de dados não se trata apenas de números e estatísticas, sendo assim, visualizar os dados é essencial para compreender padrões e extrair insights valiosos, já mostramos várias Bibliotecas Para Visualização de Dados em Python. Uma outra ferramenta poderosa nesse contexto é a biblioteca Lux em Python. Neste artigo, exploraremos como o Lux pode elevar sua análise de dados, proporcionando uma experiência visual enriquecedora.

O que é a Biblioteca Lux

O Lux é uma biblioteca de visualização de dados que se integra perfeitamente ao ambiente de análise de dados em Python. Ela oferece uma abordagem inovadora, simplificando o processo de visualização e permitindo que usuários explorem seus dados de maneira interativa.

Recursos Principais da Biblioteca Lux

Análise de Conjunto de Dados – O Lux facilita a análise de conjuntos de dados complexos, destacando visualmente correlações, padrões e distribuições, proporcionando uma compreensão mais profunda dos dados.
Visualização Interativa – Com o Lux, a criação de visualizações interativas é intuitiva. Ele automaticamente sugere visualizações relevantes com base nos dados, economizando tempo e esforço.
Descoberta de Insights – O Lux possui recursos de descoberta de insights, sugerindo visualizações relevantes que podem revelar padrões e relações nos dados. Essa funcionalidade é especialmente útil para análise exploratória de dados.
Integração com Pandas e Jupyter – Com uma integração perfeita com Pandas e Jupyter, o Lux pode ser facilmente incorporado em fluxos de trabalho existentes, proporcionando uma experiência contínua aos usuários familiarizados com essas ferramentas.

Biblioteca Lux na Prática

Veremos na prática como utilizar a biblioteca Lux para fazer o data discovery de uma base de dados do Kaggle.

Base de Dados

A base de dados de aluguel que está disponível no Kaggle e é possível analisar muitas outras bases disponíveis na plataforma. Para quem não conhece o Kaggle, sugiro ler o artigo Introdução a Competições de Ciência de Dados no Kaggle.

Instalando a Biblioteca Lux

Para começar a utilizar o Lux, basta instalar a biblioteca usando o pip.

pip install lux-api

Importando as Bibliotecas Python

Após a instalação, importe o Lux no seu ambiente Jupyter e comece a explorar seus dados:

import lux
import pandas as pd

Para usar a biblioteca Lux no colab, utilize o comando a seguir.

from google.colab import output
output.enable_custom_widget_manager()

Importando a Base de Dados com Pandas

Vamos considerar um exemplo simples de análise de dados usando o Lux. Suponha que temos um DataFrame chamado `df`, e imprtamos o conjunto de dados do kaggle casas para aluguel no Brasil.

df = pd.read_csv("/content/houses_to_rent_v2.csv")
df.head()

Na imagem podemos ver as primeiras linhas do conjunto de dados.

Observe ainda o botão Toggle Pandas/Lux com ele acionamos as funcionalidades da biblioteca Lux.

Partiu Data Discovery Lux!

Ao executar este código, o Lux automaticamente sugere visualizações relevantes, permitindo uma exploração visual imediata do conjunto de dados.

Correlação – Temos uma aba onde ele mostra as correlações entre as variáveis.

Distribuição – Em uma outra ele apresenta as distribuições das variáveis.

Ocorrência – E complementa com a frequência de valores das variáveis.

Aqui já nos permite conhecer muito melhor o nosso conjunto de dados e como ele está estruturado. E então, podemos evoluir a análise com algumas variáveis específicas.

Evoluindo o Data Discovery com Lux

Informamos duas variáveis para o Lux evoluir nossa análise.

df.intent = ["rent amount (R$)","fire insurance (R$)"]
df

Dessa forma, temos um detalhamento dessas variáveis.

Realçar – Temos um destaque na correlação com a inclusão de outros atributos na análise.

Filtros – Também uma outra perspectiva na correlação com a inclusão de filtros na análise.

Geral – Fechando a correlação com uma generalização da distribuição.

Ainda tem mais!

Finalizando o Data Discovery com Lux

Podemos ainda fixar alguns gráficos como o exemplo abaixo.

from lux.vis.Vis import Vis
Vis(["city=São Paulo","rent amount (R$)"],df)

Aqui temos a distribuição com um filtro de algum atributo específico.

Ou podemos ver de um outro ponto de vista, sem especificar o valor do filtro.

from lux.vis.VisList import VisList
VisList(["city=?","rent amount (R$)"],df)

Então temos a distribuição para cada valor do filtro possível.

Aqui nós finalizamos, mas aí é só o comecinho de uma análise de dados!!! Agora vai começar a diversão. Confere a documentação da biblioteca para evoluir ainda mais, e não deixe de usar outras ferramentas para deixar seu data discovery ainda mais completo!

Biblioteca Lux ao Cubo

Portanto, temos aqui como dar o start na Biblioteca Lux, uma adição valiosa ao ecossistema Python para análise de dados. Sua capacidade de simplificar a análise visual e revelar insights automaticamente faz dele uma ferramenta poderosa para cientistas de dados e analistas. Ao incorporar o Lux em seu fluxo de trabalho, você pode elevar a análise de dados a um novo patamar de eficiência e compreensão.

Experimente o Lux em seu próximo projeto de análise de dados e descubra como essa biblioteca pode transformar sua abordagem visual para insights mais rápidos e profundos. Um abraço do Dados ao Cubo e até a próxima.

Referências

Conteúdos ao Cubo

Então, se você curtiu o conteúdo, aqui no Dados ao Cubo tem muito mais. Então, deixo algumas sugestões de conteúdos que você pode encontrar. Sempre falando sobre o mundo dos dados!

Para finalizar, se torne também Parceiro de Publicação Dados ao Cubo. Escreva o próximo artigo e compartilhe conhecimento para toda a comunidade de dados.

Tiago Dias

Apaixonado por dados e tecnologia ❤️ , criando soluções com dados 📊 📈 , desde 2015, sempre buscando tornar os processos orientados! Com formação em Engenharia da Computação 💾 , MBA Gestão da Informação e Business Intelligence e Especialização em Data Science.

Também atuo como professor na área de dados. Nas horas vagas crio modelos de Machine Learning 🤖 com Python em desafios do Kaggle e escrevo no Dados ao Cubo sobre o mundo dos dados 🎲 !

Compartilhando conhecimentos sempre 🚀