Análise de sentimentos do Twitter com Naïve Bayes e NLTK
DOI:
https://doi.org/10.35819/scientiatec.v4i3.2188Resumo
Este artigo propõe um algoritmo de análise de sentimentos dos tweets do microblog Twitter,
utilizando o modelo probabilístico de Naïve Bayes, de modo a classificá-los em positivos ou negativos.
Foram utilizados os dados pré-analisados de Sanders (2011) para a construção do corpus e posterior
aplicação da análise e validação cruzada. Após, demonstramos o desenvolvimento do algoritmo
seguindo a metodologia estudada nos artigos relacionados, utilizando, também, as bibliotecas NLTK e
Scikit-Learn para o auxílio na aplicação do algoritmo com a linguagem de programação python,
medidas de acurácia e validação cruzada dos dados. Neste momento da pesquisa, foi possível obter
um índice acurácia relativamente alto, de 91% no dataset mencionado. Organizamos este artigo em
sessões que abordam os trabalhos relacionados, a metodologia utilizada, o sistema de coleta de dados,
a biblioteca NLTK, o modelo probabilístico Naïve Bayes e, por fim, os resultados e os trabalhos futuros,
nesta ordem.
Downloads
Publicado
Edição
Seção
Licença
O(s) autor(es) cujos trabalhos forem aceitos para publicação na revista Scientia Tec aceitam AUTOMATICAMENTE ceder os direitos autorais para a mencionada revista, assinando o termo de Cessão de direitos autorais (vide modelo anexo).