Use este identificador para citar ou linkar para este item:
https://repositorio.unipampa.edu.br/jspui/handle/riu/1602
Tipo: | Trabalho de Conclusão de Curso |
Título: | Análise de sentimentos para o português usando redes neurais recursivas |
Autor(es): | Brum, Henrico Bertini |
Primeiro Orientador: | Kepler, Fábio Natanael |
Resumo: | Neste trabalho apresentamos um modelo de treinamento para análise de sentimentos em sentenças para o idioma português brasileiro. Utilizamos uma implementação de Rede Neural Recursiva com Tensor desenvolvida pela Universidade de Stanford que consegue resultados do estado da arte na análise de sentenças para o idioma inglês. Criamos um treebank de sentimentos com sentenças em português para o treinamento de um modelo de análise de sentimentos, usando como base um conjunto já existente de resenhas de livros marcadas quanto à polaridade. Esse treebank possui 12.512 sentanças em formato Penn Treebank, com marcações de polaridades associadas para cada sentença em três classes - Positiva, Neutra e Negativa. Para a geração do treebank, extraímos árvores sintáticas das sentenças do córpus utilizando os parsers sintáticos da Universidade de Stanford e da Universidade de Berkeley treinados com córpus sintáticos em português brasileiro. Nosso trabalho documenta toda a construção do córpus e o uso do mesmo para o treinamento de um modelo de análise de sentimentos para as três classes. O modelo desenvolvido no trabalho foi submetido a análises seguindo a metodologia de 10-Fold Cross-Validation e obteve 51, 18% de acurácia levando em consideração somente sentenças positivas e negativas e 69, 08% de acurácia sobre a marcação completa de todas as sentenças. |
Abstract: | In this work we present a trained model for sentiment analysis in Brazilian Portuguese sentences. We used a recursive neural tensor network implementation developed by the University of Stanford team that achieved state-of-the-art results on sentiment analysis on English sentences. A sentiment Treebank for sentiment analysis in Portuguese was formed based on a previous data set of book reviews. The Treebank is formed by 12.512 sentences in Penn Treebank format containing associated polarities for each sentence distributed in three classes - Positive, Neutral and Negative. In order to generate the Treebank, syntactic trees were extracted from the corpus sentences using parsers developed by the University of Stanford and the University of Berkeley trained with a Portuguese data set. Our work describes the construction of the corpus and the use of it on the training of a sentiment analysis model. This model was tested following 10-fold cross-validation method and obtained 51, 18% of accuracy on positive and negative prediction and 69, 08% of accuracy on the prediction of all the sentences. |
Palavras-chave: | Computer science Artificial intelligence Neural networks Sentiment Portuguese language |
Editor: | Universidade Federal do Pampa |
Citação: | teste |
Tipo de Acesso: | Attribution-NonCommercial-NoDerivs 3.0 Brazil |
Licença: | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
URI: | http://dspace.unipampa.edu.br/jspui/handle/riu/1602 |
Data do documento: | 10-Jul-2015 |
Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Análise de sentimentos para o português usando redes neurais recursivas.pdf | 7.09 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons