Fala galera do mundo dos dados, dando continuidade às consultas de banco de dados com SQL, hora de avançar um pouco mais. SQL é prática diariamente, o mais importante é conhecer as funções e saber como aplicá-las. aqui você vai aprender mais algumas outras funções SQL, como With, o Having, algumas funções com data e assim vai elevando o seu conhecimento na principal linguagem de banco de dados.
Lembrando que os dados que iremos consultar aqui devem ser da Base de Dados do LinkedIn e depois Importar CSV no PostgreSQL com o DBeaver. Sem dados não há consultas. Abaixo uma prévia desses dados!
Agora que já sabemos de onde vêm os dados e com eles no banco de dados vamos a prática com o Dados ao Cubo.
Às vezes, você só precisa organizar as tabelas temporariamente, para utilizar somente uma vez. “WITH” faz isso, ajudando você a organizar seus dados temporariamente. No Script SQL a seguir, iremos montar uma consulta temporária da contagem de empresas e posteriormente verificar as empresas com mais de 250 conexões no Linkedin.
WITH count_company AS ( SELECT company, COUNT(*) AS qtd FROM connections GROUP BY company ) SELECT * FROM count_company WHERE qtd > 250 ORDER BY qtd ASC
E então, temos o resultado na imagem abaixo.
Fizemos essa verificação com uma tabela temporária, mas podemos fazer com uma outra função também.
Suponha que você queira fazer um filtro depois de um agrupamento. HAVING faz isso depois de agrupar. Utilizando o mesmo exemplo da quantidade de conexões por empresa, após esse agrupamento se quiser verificar as empresas com maior, menor ou igual determinada quantidade, podemos utilizar a função HAVING como no Script SQL abaixo.
SELECT company, COUNT(*) AS qtd FROM connections GROUP BY company HAVING COUNT(*) > 250 ORDER BY COUNT(*) DESC
Confere a imagem a seguir, com o mesmo resultado que conseguimos com o script anterior utilizando o WITH.
Com SQL é assim, podemos chegar ao mesmo resultado com mais de um caminho. Na sequência, confere como transformar o tipo do dado.
Às vezes, você quer ler um dado em outro formato. CAST ajuda a transformar seus dados em um formato diferente. Importante ressaltar, que essa transformação só acontece caso o dado possa ser transformado no novo formato. No exemplo a seguir, iremos transformar os dados no formato de data e inteiro para string.
Primeiro, faremos uma seleção das conexões utilizando a data de conexão e a contagem.
SELECT "Connected On", count(*) FROM connections GROUP BY "Connected On"
Então temos a imagem abaixo onde podemos verificar o tipo do dado de cada coluna.
Em seguida, utilizamos a função CAST com o tipo do dado que queremos transformar, neste caso varchar.
SELECT CAST("Connected On" AS VARCHAR), CAST(count(*) AS VARCHAR) FROM connections GROUP BY "Connected On"
Observe agora que as colunas tem um novo tipo de dado exibidos como texto.
Já que falamos de data, veremos algumas funções de data com SQL.
Às vezes, queremos verificar qual ano? Quanto tempo? Qual dia?. Funções com data ajudam a fazer isso. Aqui irá aprender duas funções de datas para começar a date_trunc e a date_part. As duas funções selecionam uma parte da data (dia, mês e ano), porém a date_trunc permanece no formato de data e a date_part extrai o número inteiro da parte da data. Vamos ver na prática essa diferença com o script SQL abaixo.
SELECT "Connected On", DATE_TRUNC('year', "Connected On"), DATE_PART('year', "Connected On") FROM connections
Utilizamos a mesma coluna para aplicar as funções de data e extrair o ano de cada uma delas. Confere na imagem abaixo a diferença entre as duas funções.
Agora que aprendemos a função, podemos utilizar para um para um problema real uma contagem da quantidade de conexões por ano, como o script SQL a seguir.
SELECT DATE_PART('year', "Connected On") AS ano, COUNT(*) AS qtd FROM connections GROUP BY 1 ORDER BY 1
E Então temos, a quantidade de conexões do LinkedIn ano após ano como na imagem abaixo.
Com essas ferramentas simples, você pode personalizar suas visualizações, organizar temporariamente, filtrar após agrupar, mudar formatos e até brincar com as datas! Espero que esta jornada tenha tornado o mundo do SQL um pouco mais claro para você.
E então chegamos ao fim! Aprendemos a consultar banco de dados com SQL, com este passo a passo bem detalhado. Assim podemos avançar na série SQL na prática! Na sequência você vai aprender mais sobre as consultas de transformar as consultas SQL em visualizações no Metabase. Um abraço e até a próxima, não esquece de compartilhar o conteúdo para aquele amigo que quer aprender a linguagem SQL na prática.
Então, se você curtiu o conteúdo, aqui no Dados ao Cubo tem muito mais. Então, deixo algumas sugestões de conteúdos que você pode encontrar. Sempre falando sobre o mundo dos dados!
Para finalizar, se torne também Parceiro de Publicação Dados ao Cubo. Escreva o próximo artigo e compartilhe conhecimento para toda a comunidade de dados.
Apaixonado por dados e tecnologia ❤️ , criando soluções com dados 📊 📈 , desde 2015, sempre buscando tornar os processos orientados! Com formação em Engenharia da Computação 💾 , MBA Gestão da Informação e Business Intelligence e Especialização em Data Science.
Também atuo como professor na área de dados. Nas horas vagas crio modelos de Machine Learning 🤖 com Python em desafios do Kaggle e escrevo no Dados ao Cubo sobre o mundo dos dados 🎲 !
Compartilhando conhecimentos sempre 🚀
Fala Galera do mundo dos dados, hora de manipular dados no MongoDB com Python. Dessa…
Fala Galera do mundo dos dados, hora de manipular dados no Cassandra com Python. Dessa…
Fala galera do mundo dos dados, hoje é dia de aprender a função Select do Spark.…
Fala galera do mundo dos dados, hoje é dia de transformar consultas SQL em visualizações…
Fala galera do mundo dos dados, hora de conhecer os bancos de dados NoSQL com…
Fala galera do mundo dos dados, hoje é dia de aprender as funções Spark joins,…