???jsp.display-item.identifier???
https://repositorio.unipampa.edu.br/jspui/handle/riu/5382
???org.dspace.app.webui.jsptag.ItemTag.full???
???org.dspace.app.webui.jsptag.ItemTag.dcfield??? | ???org.dspace.app.webui.jsptag.ItemTag.value??? | ???org.dspace.app.webui.jsptag.ItemTag.lang??? |
---|---|---|
dc.contributor.advisor1 | Thielo, Marcelo Resende | - |
dc.creator | Ferreira, Wesley Ferreira de | - |
dc.date.accessioned | 2021-03-11T22:05:39Z | - |
dc.date.available | 2021-03-11 | - |
dc.date.available | 2021-03-11T22:05:39Z | - |
dc.date.issued | 2020-12-11 | - |
dc.identifier.citation | FERREIRA, Wesley Ferreira de. Um sistema para organização de acervos baseado em visão computacional. Orientador: Marcelo Resende Thielo. 2020. 79p. Trabalho de Conclusão de Curso (Bacharel em Ciência da Computação) - Universidade Federal do Pampa, Curso de Ciência da Computação, Alegrete, 2020. | pt_BR |
dc.identifier.uri | http://dspace.unipampa.edu.br:8080/jspui/handle/riu/5382 | - |
dc.description.abstract | Search engines have become essential with the massive increase in the amount of information generated everyday in the internet. According to Cisco (2019) 82% of these information consists of images and videos. Therefore the development of robusts mechanisms to index this type of information, extract characteristics and search this visual information is necessary. Individually, each person has their personal needs for producing images and videos, depending on their lifestyle, but many have a smartphone in hand. For people with busy lives, who have memory problems or many things to remember, having a tool quickly available can be very useful in remembering things, like the date of a meeting or where you left your car keys. The objectives of this work are the development and implementation of a prototype of an application for the indoor organization of personal collections using computer vision and auxiliary tools for text and voice processing. The application was designed to be an easy and practical tool for using to organize personal belongings, whether or not consisting of a collection. In a literature search for a starting point to the design of this prototype, several methods and tools that could assist in its feasibility were found, however, no work with a similar proposal was identified. Therefore, many of the methods in this work had to be investigated, implemented and tested during the development of the prototype. The methods selected for the composition of the prototype are: ORB feature extractor, the vocabulary tree structure for storing descriptors and Google Speech-To-Text for speech processing. The validation was carried out with a large number of combinations of test cases so that one could have an idea of the capabilities and imperfections of the tool that was developed. Among them, what stands out is the ability to accept several consecutive insertions without the need for retraining at each insertion, however needing a regrouping of the tree descriptors, so that the processing time does not increase and the level of quality achieved , of more than 80 %, remain in an environment with an immense number of variables, such as: camera focus, motion blur, lighting, shadow, etc. As a conclusion of this work, which, although it still has many points for improvement, we have that the proposed objective was fulfilled and that, given the required improvements, the prototype developed could be turned into a real product capable of generating a positive impact on the life of the target audience. | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal do Pampa | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Ciência da computação | pt_BR |
dc.subject | Arquivos de imagem | pt_BR |
dc.subject | Textos | pt_BR |
dc.subject | Text | pt_BR |
dc.subject | Image | pt_BR |
dc.subject | Computer science | pt_BR |
dc.title | Um sistema para organização de acervos baseado em visão computacional | pt_BR |
dc.type | Trabalho de Conclusão de Curso | pt_BR |
dc.publisher.initials | UNIPAMPA | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA | pt_BR |
dc.description.resumo | Mecanismos de busca são fundamentais com o aumento massivo de informação que é gerada todos os dias pela internet. De acordo com Cisco (2018), 82% destes dados estão no formato de imagens e vídeos. Portanto, é necessário o desenvolvimento de mecanismos robustos para indexação desse tipo de informação e também de extração de características e busca desta informação visual. Individualmente, cada um tem suas necessidades pessoais de produção de imagens e vídeos, a depender do estilo de vida, mas muitas delas têm um smartphone na mão. Para pessoas com vidas agitadas, que têm problemas de memória ou muito para lembrar, publico alvo do trabalho, o fato de ter uma ferramenta dessas disponível pode ser de grande utilidade para recordar oque é importante, como a data de uma reunião ou onde deixou as chaves do carro, por exemplo. Os objetivos deste trabalho foram o desenvolvimento e a implementação de um protótipo de uma aplicação de organização de acervo pessoal em ambientes internos usando visão computacional e ferramentas auxiliares de processamento de texto e voz. O uso da ferramenta foi pensada para que seja possível, de forma rápida e prática, a organização dos pertences pessoais, consistindo ou não de uma coleção. Em uma investigação na literatura, foram encontrados diversos métodos e ferramentas que poderiam auxiliar viabilidade do trabalho, portanto, muitos desses tiveram que ser investigados e testados durante o desenvolvimento do protótipo. Dentre os métodos escolhidos para a composição do protótipo estão: o extrator de características ORB, a estrutura de árvore de vocabulário para armazenamento dos descritores e o Google Speech-To-Text para o processamento de voz. A validação foi realizada com uma grande quantidade de combinações de casos de teste para que se pudesse ter a noção das capacidades e imperfeições dos métodos escolhidos e da ferramenta que foi desenvolvida. Dentre elas o que se destaca é a capacidade de aceitar diversas inserções consecutivas sem a necessidade de retreinamento a cada inserção, necessitando, no entanto, de um reagrupamento dos descritores da árvore, para que o tempo de processamento não cresça e o nível de qualidade alcançado, de mais de 80%, se mantenha em um ambiente com um imenso número de variáveis, como: foco da câmera, desfoque de movimento, iluminação, sombra, etc. Como conclusão deste trabalho, o qual, apesar de possuir ainda muitos pontos de melhoria, temos que o objetivo proposto foi cumprido e que, com as devidas melhorias, o protótipo desenvolvido viabiliza um produto real capaz de gerar um impacto positivo na vida do público alvo. | pt_BR |
dc.publisher.department | Campus Alegrete | pt_BR |
???org.dspace.app.webui.jsptag.ItemTag.appears??? | Ciência da Computação |
???org.dspace.app.webui.jsptag.ItemTag.files???
???org.dspace.app.webui.jsptag.ItemTag.file??? | ???org.dspace.app.webui.jsptag.ItemTag.description??? | ???org.dspace.app.webui.jsptag.ItemTag.filesize??? | ???org.dspace.app.webui.jsptag.ItemTag.fileformat??? | |
---|---|---|---|---|
Wesley Ferreira de Ferreira - 2020.pdf | 15.52 MB | Adobe PDF | ???org.dspace.app.webui.jsptag.ItemTag.view??? |
???jsp.display-item.copyright???