dc.contributor.advisor |
Pereira, Fernando Roberto |
|
dc.contributor.author |
Ziger, Gustavo |
|
dc.date.accessioned |
2021-05-24T12:12:07Z |
|
dc.date.available |
2021-05-24T12:12:07Z |
|
dc.date.issued |
2021-03-21 |
|
dc.identifier.uri |
https://repositorio.ifsc.edu.br/handle/123456789/2056 |
|
dc.description |
ZIGER, Gustavo. Comparação de técnicas de Word embedding na análise de sentimentos. 2021. Trabalho de Conclusão de Curso (Tecnologia em Análise e Desenvolvimento de Sistemas) – Instituto Federal de Educação, Ciência e Tecnologia de Santa Catarina, Canoinhas, 2021. |
pt_BR |
dc.description.abstract |
A quantidade expressiva de dados e informações que os usuários da internet geram diariamente possui potencial de uso em atividades de mineração de dados e reconhecimento de padrões. Considerando que a tomada de decisão humana é altamente influenciada por opiniões externas, as informações geradas pelos usuários de blogs, sites de avalição e redes sociais podem ser utilizadas em tarefas de análise de sentimentos. Este trabalho compara a acurácia de diferentes técnicas para representação de sentenças em números, chamadas de word embeddings, utilizando uma rede neural convolucional como classificador. Os experimentos realizados utilizaram o conjunto de avaliações de filmes em língua inglesa chamado “Large Movie Review Dataset v1.0”. Com a abordagem proposta obtivemos 90,30% de acurácia com o melhor experimento. |
pt_BR |
dc.description.abstract |
The significant amount of data and information that Internet users generate daily has the potential to be used in data mining and pattern recognition activities. Considering that human decision-making is highly influenced by external opinions, the information generated by users of blogs, rating and review sites and social networks can be used in sentiment analysis tasks. This paper compares the accuracy of different techniques for representing sentences in numbers, called word embeddings, using a convolutional neural network as classifier. The experiments used the set of film reviews called “Large Movie Review Dataset v1.0”. With the proposed approach, we obtained 90.30% accuracy with the best experiment. |
en |
dc.language.iso |
pt_BR |
pt_BR |
dc.subject |
Processamento de linguagem natural (Computação) |
pt_BR |
dc.subject |
Mineração de opinião |
pt_BR |
dc.subject |
Word embedding |
en |
dc.title |
Comparação de técnicas de word embedding na análise de sentimentos |
pt_BR |
dc.title.alternative |
Comparison of word embedding techniques in sentiment analysis |
en |
dc.type |
Final Paper |
en |
local.institution.discipline |
Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas |
pt_BR |
local.institution.campus |
Canoinhas |
pt_BR |
local.institution |
Instituto Federal de Santa Catarina |
pt_BR |