Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.unipampa.edu.br/jspui/handle/riu/6849
Tipo: Monografia de Especialização
Título : Uma ferramenta computacional para obtenção da matriz termo ocorrência em corpus textuais
Autor(es): Seixas, Paulo Henrique Leite
Primeiro Orientador: Ferreira, Vera Lúcia Duarte
1° Membro da banca: Ferreira, Vera Lúcia Duarte
2° Membro da banca: Dias, Fernando Luis
3° Membro da banca: Duarte Filho, Paulo Fernando Marques
Resumo: O presente trabalho apresenta a primeira versão de ferramenta computacional para análise de dados não estruturados, desenvolvida em linguagem Python e embasada em técnicas de mineração de texto e processamento de linguagem natural. A ferramenta proposta tem centralidade na análise lexical através de frequência das palavras e na posterior determinação da matriz termo ocorrência de um corpus textual. A aplicação do experimento valeu-se de um corpus textual do gênero notícias compostas de sites de notícias da internet. Os resultados mostraram a eficiência da referida ferramenta para análise lexicográfica dos verbos dicendi utilizados como descritores, o gênero notícias, por meio de gráficos apresentados com a frequência de palavras, nuvem de palavras, produzidos a partir da matriz de ocorrência saída da ferramenta computacional.
Resumen : This work presents the first version of a computational tool for analyzing unstructured data, developed in Python language and based on text mining and natural language processing techniques. The proposed tool has centrality in the lexical analysis through the frequency of the words and in the subsequent determination of the term occurrence matrix of a textual corpus. The Application of the Experiment used a textual news corpus composed of internet news sites. The results required the efficiency of the tool for lexicographical analysis of the dicendi verbs used as descriptors, the news genre, through graphics, with the frequency of words, word cloud, bootable from the output matrix of the computational tool.
Palabras clave : Mineração Textual
Ferramenta Computacional
Frequência de Palavras
Textual Mining
Computational Tool
Word Frequency
CNPQ: CNPQ::ENGENHARIAS
Idioma: por
metadata.dc.publisher.country: Brasil
Editorial : Universidade Federal do Pampa
Sigla da Instituição: UNIPAMPA
Campus: Campus Bagé
Curso: Especialização em Modelagem Computacional em Ensino, Experimentação e Simulação
Citación : LEITE, Paulo Henrique Seixas. Uma ferramenta computacional para obtenção da matriz termo ocorrência em corpus textuais. 39 f.: il. 2021. Monografia (Especialização) – Curso de Pós-Graduação Modelagem Computacional em Ensino, Experimentação e Simulação, Universidade Federal do Pampa, Universidade Federal do Pampa, Campus Bagé, Bagé, 2021.
Tipo de acesso: Acesso Aberto
URI : https://repositorio.unipampa.edu.br/jspui/handle/riu/6849
Fecha de publicación : 6-dic-2021
Aparece en las colecciones: Especialização em Modelagem Computacional em Ensino, Experimentação e Simulação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
_Versao_Revisao_Monografia_MCEES_Paulo_Henrique_paulo.pdf704 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.