???jsp.display-item.identifier??? https://repositorio.unipampa.edu.br/jspui/handle/riu/1593
Tipo: Trabalho de Conclusão de Curso
metadata.dc.title: Análise sintática semi-supervisionada por constituência aplicada ao português e inglês
Autor(es): Costa, Pablo Botton da
Primeiro Orientador: Kepler, Fábio Natanael
Resumo: Este trabalho apresenta resultados em análise sintática semi-supervisionada para o português e inglês. O nosso modelo induz estruturas gramaticais através da modelagem do contexto, span e etiqueta sendo esta terna(contexto, span e etiqueta) utilizada para induzir os mais prováveis constituintes e etiquetas de uma sentença teste. O nosso modelo de analise sintática semi-supervisionada induz gramaticas através da constituência das palavras. O modelo apresenta também resultados para etiquetagem sintática, pois o nosso modelo induz os constituintes das frases e suas etiquetas se existirem. Como resultados obtivemos para o português uma medida-F não etiquetada em média geral de 17, 30% em relação ao melhor resultado possível para o córpus Tycho Brahe. Já para o inglês obtivemos resultados em média de 28, 95% abaixo do melhor resultado possível. Para a etiquetagem sintática nosso modelo obteve 20, 79% de alcance das frases de cada córpus do português, e dentre as que ele preenche obtém um acerto de 1, 09%. Para etiquetagem aplicada ao inglês obtivemos 9, 61% das frases de cada córpus foram etiquetadas, e deste obtivemos um acerto de 1, 71% das etiquetas certas. Este trabalho apresentam resultados relevantes para córpus não etiquetado e também percebemos que o tamanho dos córpus tanto treinamento e de teste influenciam negativamente nos resultados, isto é se comprarmos o córpus Tycho Brahe e WSJ levando em consideração seu tamanho e resultados veremos que se tivermos uma grande quantidade de treinamento e teste o nosso modelo apresenta resultados baixos. Para resultados em etiquetagem sintática percebemos que o nosso modelo não foi muito efetivo, pois o modelo simplesmente seleciona a etiqueta com maior probabilidade ao invés de modelá-la como uma nova dimensão. Também apresentamos resultados dos modelos propostos por Klein e Manning (2004) aplicados ao português, quê não foram encontrados resultados na bibliografia.
Abstract: This paper presents results on semi-supervised for Portuguese and English syntactic analysis. Our model induces grammatical structures through context modeling, span and label this triple(context,span and label) being used to induce the most likely constituents and labels of a test sentence. Our model of semi-supervised syntactic analysis induces grammars through the constituency of words. The model also presents results for syntactic tagging, because our model induces the constituents of sentences and their labels if they exist. As a result we obtained a measure-F for the Portuguese unlabelled overall average of 17.30% for the best results of corpus Tycho Brahe. Have we obtained results for the English average of 28.95% below the best possible result. For the syntactic tagging our model got 20.79% of the reach of sentences of each corpus of Portuguese, and among those he meets gets a hit of 1.09%. For labeling applied to the English got 9.61% of the sentences of each corpus were tagged, and this obtained a settlement of 1.71% of certain labels. This work presents results relevant to unlabeled corpus and also realize that the size of the corpus both training and testing negatively influence the results, ie if we buy the WSJ corpus Tycho Brahe and taking into account its size and results we see that if we have a large amount of training and testing our model shows lower results. For results in syntactic tagging realized that our model was not very effective because the model simply selects the label most likely rather than model it as a new dimension. We also presente results of the models proposed by Klein e Manning (2004) applied to the Portuguese, what results were not found in the bibliography.
metadata.dc.subject: Computer science
Machine learning
Computational linguistics
Natural language processing
CNPQ: CNPQ::CIENCIAS EXATAS E DA TERRA
metadata.dc.publisher: Universidade Federal do Pampa
Campus: Campus Alegrete
Tipo de acesso: Attribution-NonCommercial-NoDerivs 3.0 Brazil
Licença: http://creativecommons.org/licenses/by-nc-nd/3.0/br/
metadata.dc.identifier.uri: http://dspace.unipampa.edu.br/jspui/handle/riu/1593
metadata.dc.date.issued: 17-Mar-2014
???org.dspace.app.webui.jsptag.ItemTag.appears???Ciência da Computação

???org.dspace.app.webui.jsptag.ItemTag.files???
???org.dspace.app.webui.jsptag.ItemTag.file??? ???org.dspace.app.webui.jsptag.ItemTag.description??? ???org.dspace.app.webui.jsptag.ItemTag.filesize??????org.dspace.app.webui.jsptag.ItemTag.fileformat??? 
Análise sintática semi-supervisionada por constituência aplicada ao português e inglês.pdf815.61 kBAdobe PDF???org.dspace.app.webui.jsptag.ItemTag.view???


???jsp.display-item.text3??? ???jsp.display-item.license??? Creative Commons