Análise de sentimentos do Twitter com Naïve Bayes e NLTK

Augusto Weiand, Fernanda Rodrigues Ribeiro Weiand

Resumo


Este artigo propõe um algoritmo de análise de sentimentos dos tweets do microblog Twitter, utilizando o modelo probabilístico de Naïve Bayes, de modo a classificá-los em positivos ou negativos. Foram utilizados os dados pré-analisados de Sanders (2011) para a construção do corpus e posterior aplicação da análise e validação cruzada. Após, demonstramos o desenvolvimento do algoritmo seguindo a metodologia estudada nos artigos relacionados, utilizando, também, as bibliotecas NLTK e Scikit-Learn para o auxílio na aplicação do algoritmo com a linguagem de programação python, medidas de acurácia e validação cruzada dos dados. Neste momento da pesquisa, foi possível obter um índice acurácia relativamente alto, de 91% no dataset mencionado. Organizamos este artigo em sessões que abordam os trabalhos relacionados, a metodologia utilizada, o sistema de coleta de dados, a biblioteca NLTK, o modelo probabilístico Naïve Bayes e, por fim, os resultados e os trabalhos futuros, nesta ordem.


Palavras-chave


Twitter; Sentimentos; Naïve Bayes.

Texto completo:

PDF

Apontamentos



Capa · Sobre · Pesquisa · Atual · Anteriores

ScientiaTec: Revista de Educação, Ciência e Tecnologia do IFRS

Rua Cel. Vicente, 281 | Bairro Centro | CEP 90.030-041 | Porto Alegre/RS

E-mail: revista.scientiatec@poa.ifrs.edu.br

 

Licença Creative Commons

Esta revista está licenciada com uma Licença Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Internacional

 

Apoio: Pró-Reitoria de Pesquisa, Pós-Graduação e Inovação (PROPPI) do IFRS.