Use este identificador para citar ou linkar para este item:
https://repositorio.unipampa.edu.br/jspui/handle/riu/6849
Tipo: | Monografia de Especialização |
Título: | Uma ferramenta computacional para obtenção da matriz termo ocorrência em corpus textuais |
Autor(es): | Seixas, Paulo Henrique Leite |
Primeiro Orientador: | Ferreira, Vera Lúcia Duarte |
1° Membro da banca: | Ferreira, Vera Lúcia Duarte |
2° Membro da banca: | Dias, Fernando Luis |
3° Membro da banca: | Duarte Filho, Paulo Fernando Marques |
Resumo: | O presente trabalho apresenta a primeira versão de ferramenta computacional para análise de dados não estruturados, desenvolvida em linguagem Python e embasada em técnicas de mineração de texto e processamento de linguagem natural. A ferramenta proposta tem centralidade na análise lexical através de frequência das palavras e na posterior determinação da matriz termo ocorrência de um corpus textual. A aplicação do experimento valeu-se de um corpus textual do gênero notícias compostas de sites de notícias da internet. Os resultados mostraram a eficiência da referida ferramenta para análise lexicográfica dos verbos dicendi utilizados como descritores, o gênero notícias, por meio de gráficos apresentados com a frequência de palavras, nuvem de palavras, produzidos a partir da matriz de ocorrência saída da ferramenta computacional. |
Abstract: | This work presents the first version of a computational tool for analyzing unstructured data, developed in Python language and based on text mining and natural language processing techniques. The proposed tool has centrality in the lexical analysis through the frequency of the words and in the subsequent determination of the term occurrence matrix of a textual corpus. The Application of the Experiment used a textual news corpus composed of internet news sites. The results required the efficiency of the tool for lexicographical analysis of the dicendi verbs used as descriptors, the news genre, through graphics, with the frequency of words, word cloud, bootable from the output matrix of the computational tool. |
Palavras-chave: | Mineração Textual Ferramenta Computacional Frequência de Palavras Textual Mining Computational Tool Word Frequency |
CNPq: | CNPQ::ENGENHARIAS |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal do Pampa |
Sigla da Instituição: | UNIPAMPA |
Campus: | Campus Bagé |
Curso: | Especialização em Modelagem Computacional em Ensino, Experimentação e Simulação |
Citação: | LEITE, Paulo Henrique Seixas. Uma ferramenta computacional para obtenção da matriz termo ocorrência em corpus textuais. 39 f.: il. 2021. Monografia (Especialização) – Curso de Pós-Graduação Modelagem Computacional em Ensino, Experimentação e Simulação, Universidade Federal do Pampa, Universidade Federal do Pampa, Campus Bagé, Bagé, 2021. |
Tipo de Acesso: | Acesso Aberto |
URI: | https://repositorio.unipampa.edu.br/jspui/handle/riu/6849 |
Data do documento: | 6-Dez-2021 |
Aparece nas coleções: | Especialização em Modelagem Computacional em Ensino, Experimentação e Simulação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
_Versao_Revisao_Monografia_MCEES_Paulo_Henrique_paulo.pdf | 704 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.