A quantidade expressiva de dados e informações que os usuários da internet geram diariamente possui potencial de uso em atividades de mineração de dados e reconhecimento de padrões. Considerando que a tomada de decisão humana é altamente influenciada por opiniões externas, as informações geradas pelos usuários de blogs, sites de avalição e redes sociais podem ser utilizadas em tarefas de análise de sentimentos. Este trabalho compara a acurácia de diferentes técnicas para representação de sentenças em números, chamadas de word embeddings, utilizando uma rede neural convolucional como classificador. Os experimentos realizados utilizaram o conjunto de avaliações de filmes em língua inglesa chamado “Large Movie Review Dataset v1.0”. Com a abordagem proposta obtivemos 90,30% de acurácia com o melhor experimento.
The significant amount of data and information that Internet users generate daily has the potential to be used in data mining and pattern recognition activities. Considering that human decision-making is highly influenced by external opinions, the information generated by users of blogs, rating and review sites and social networks can be used in sentiment analysis tasks. This paper compares the accuracy of different techniques for representing sentences in numbers, called word embeddings, using a convolutional neural network as classifier. The experiments used the set of film reviews called “Large Movie Review Dataset v1.0”. With the proposed approach, we obtained 90.30% accuracy with the best experiment.