Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.unipampa.edu.br/jspui/handle/riu/6849
Tipo: | Monografia de Especialização |
Título : | Uma ferramenta computacional para obtenção da matriz termo ocorrência em corpus textuais |
Autor(es): | Seixas, Paulo Henrique Leite |
Primeiro Orientador: | Ferreira, Vera Lúcia Duarte |
1° Membro da banca: | Ferreira, Vera Lúcia Duarte |
2° Membro da banca: | Dias, Fernando Luis |
3° Membro da banca: | Duarte Filho, Paulo Fernando Marques |
Resumo: | O presente trabalho apresenta a primeira versão de ferramenta computacional para análise de dados não estruturados, desenvolvida em linguagem Python e embasada em técnicas de mineração de texto e processamento de linguagem natural. A ferramenta proposta tem centralidade na análise lexical através de frequência das palavras e na posterior determinação da matriz termo ocorrência de um corpus textual. A aplicação do experimento valeu-se de um corpus textual do gênero notícias compostas de sites de notícias da internet. Os resultados mostraram a eficiência da referida ferramenta para análise lexicográfica dos verbos dicendi utilizados como descritores, o gênero notícias, por meio de gráficos apresentados com a frequência de palavras, nuvem de palavras, produzidos a partir da matriz de ocorrência saída da ferramenta computacional. |
Resumen : | This work presents the first version of a computational tool for analyzing unstructured data, developed in Python language and based on text mining and natural language processing techniques. The proposed tool has centrality in the lexical analysis through the frequency of the words and in the subsequent determination of the term occurrence matrix of a textual corpus. The Application of the Experiment used a textual news corpus composed of internet news sites. The results required the efficiency of the tool for lexicographical analysis of the dicendi verbs used as descriptors, the news genre, through graphics, with the frequency of words, word cloud, bootable from the output matrix of the computational tool. |
Palabras clave : | Mineração Textual Ferramenta Computacional Frequência de Palavras Textual Mining Computational Tool Word Frequency |
CNPQ: | CNPQ::ENGENHARIAS |
Idioma: | por |
metadata.dc.publisher.country: | Brasil |
Editorial : | Universidade Federal do Pampa |
Sigla da Instituição: | UNIPAMPA |
Campus: | Campus Bagé |
Curso: | Especialização em Modelagem Computacional em Ensino, Experimentação e Simulação |
Citación : | LEITE, Paulo Henrique Seixas. Uma ferramenta computacional para obtenção da matriz termo ocorrência em corpus textuais. 39 f.: il. 2021. Monografia (Especialização) – Curso de Pós-Graduação Modelagem Computacional em Ensino, Experimentação e Simulação, Universidade Federal do Pampa, Universidade Federal do Pampa, Campus Bagé, Bagé, 2021. |
Tipo de acesso: | Acesso Aberto |
URI : | https://repositorio.unipampa.edu.br/jspui/handle/riu/6849 |
Fecha de publicación : | 6-dic-2021 |
Aparece en las colecciones: | Especialização em Modelagem Computacional em Ensino, Experimentação e Simulação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
_Versao_Revisao_Monografia_MCEES_Paulo_Henrique_paulo.pdf | 704 kB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.