Data Science Python

Leitura de Textos com Emoji

Fala galera do mundo dos dados! Espero que estejam todos bem e se cuidando, no mais vamos de conteúdo novo. Você conhece o que são os emojis? Sabe onde moram? E o que fazem para viver? Se não conhece, vou te apresentar hoje! Se já conhece, vem comigo que vou te mostrar uma coisa bacana que podemos fazer com o Python! Vou te apresentar um biblioteca Python para ler Emoji. 

Pensa nas conversas das redes sociais, tipo: Eu ❤️ o 🎲 ao 3️⃣ !!! No último artigo que escrevi aqui extraindo dados do twitter com Python, dá para observar que os tweets vem com muitos emojis. Se, às vezes, pode ser confuso até para nós, imagina para as análises de dados das soluções de linguagem natural (se não sabe o que é linguagem natural, confere o artigo NLP com scikit-learn, aqui no Dados ao Cubo). Então vamos brincar um pouco, e transformar esses lindos desenhos em texto.

O que são Emoji?

Os emojis são ideogramas (“é um símbolo gráfico utilizado para representar uma palavra ou conceito abstrato”) com origem japonesa usados em mensagens eletrônicas e páginas web. Apesar da sua origem, é popular no mundo todo, e as redes sociais foram um dos seus principais propulsores. E dá para ler os emojis utilizando o Python?

Biblioteca Python Emoji

A lib emoji é um simples pacote para Python com funções para transformar os emojis em texto e textos em emojis. A explicação é tão simples quanto a biblioteca, vamos ao código!

Emoji ao Cubo

Primeiramente, faremos a instalação da biblioteca, com o código pip install emoji. Dessa forma, já podemos utilizar a biblioteca emoji no Python.

Importando Bibliotecas

Agora podemos fazer o import da lib usando import emoji. Com o pacote instalado e importado, podemos começar a transformar os emojis.

Transformando Emojis

Agora é horas das transformações: emoji em texto e texto em emoji.

No exemplo abaixo temos 3 funções. A emojize, que vai transformar o texto em um emoji, um detalhe é que a transformação só vai ocorrer nas palavras com “:” no início e no fim. Temos também a função demojize, que vai encontrar o emoji e transformar em texto. E por fim a função is_emoji, que identifica se é ou não um emoji. Um detalhe para o parâmetro use_aliases que utiliza ou não os apelidos dos emojis, é isso mesmo kkkk, eles podem ter apelidos.

Todos os exemplos acima estão no idioma Inglês, mas o portuga não está de fora não. O parâmetro language pode ser definido para alguns idiomas suportados inclusive o “pt”. Confere os exemplos abaixo.

E para melhorar essa transformação de emoji, coloquei tudo isso em uma função.

Transformando Textos com Emoji

A função emoji_transform, recebe como entrada um texto, encontrar os emojis e transforma eles em texto. De quebra removo os “:” e os “_” para deixar o texto mais bonito 😎 .

E então, chegamos ao fim de como ler emoji utilizando o Python.

Ler Emoji com Python ao Cubo

Portanto, vimos como brincar como os emojis utilizando o Python. Sendo assim, tivemos exemplos de como converter um emoji em texto e também de como converter um texto em emoji, tudo isso utilizando a biblioteca emoji do Python.

Portanto, é isso que temos para hoje! Então, se gostou, compartilhe nosso conteúdo, se não, mande seu feedback para nós. O código completo no lá no GitHub, um abraço e até a próxima.

Conteúdos ao Cubo

Por fim, deixo sugestões de outros conteúdos que você vai encontrar no Dados ao Cubo, sempre trazendo um pouco do mundo dos dados.

Então, finalizo com um convite para você ser Parceiro de Publicação Dados ao Cubo e escrever o próximo artigo, compartilhando conhecimento para toda a comunidade de dados. Mas, não esqueça de assinar a nossa Newsletter para ficar por dentro de todas as novidades. 

Gostou? Compartilhe!

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *