Redução de Complexidade no Affine Motion Estimation do Padrão VVC

Sagrilo, Fernando Funghetto

???jsp.display-item.identifier??? https://repositorio.unipampa.edu.br/jspui/handle/riu/7826

Tipo:	Dissertação
metadata.dc.title:	Redução de Complexidade no Affine Motion Estimation do Padrão VVC
Autor(es):	Sagrilo, Fernando Funghetto
Primeiro Orientador:	Sanchez, Gustavo Freitas
Resumo:	No atual estado-da-arte da codificação de vídeos está o Versatile Video Coding (VVC), desenvolvido com o objetivo de atender a necessidade cada vez maior por compressão de dados de vídeo decorrente do aumento do consumo desses conteúdos, além disso, traz no seu nome a versatilidade, com a proposta de suportar diversos conteúdos de vídeo incluindo as novidades que estão surgindo no mercado, como realidade virtual, realidade aumentada, vídeos em 360o entre outros, possibilita ainda suporte para altas resoluções além da 4k UHD. Em 2015 um grupo de experts em codificação de vídeo chamado Joint Video Exploration Team (JVET) se uniram para criação de um novo padrão de codificador de vídeo. Então em julho de 2020 o novo padrão de codificação VVC foi finalizado buscando alcançar uma taxa de redução de bits de 50% sobre seu antecessor High Efficiency Video Coding (HEVC). VVC foi implementado baseado no seu antecessor HEVC, do qual herdou a maioria das ferramentas, das quais muitas foram aprimoradas e outras novas foram adicionadas, isso possibilitou uma redução na taxa de bits média em relação ao seu antecessor de 44%. Porém esses aprimoramentos vieram com uma consequência, o aumento da complexidade computacional o que dificulta que esse novo padrão possa ser utilizado em determinadas situações como transmissão de vídeo em tempo real ou utilizado em dispositivos portáteis que possuam capacidade de energia limitada. Umas das novidades, que possui um alto custo computacional, implementadas no VVC é a Affine, seu propósito é realizar a predição mais eficiente de movimentos complexos como zoom, rotação e cisalhamento, que por utilizar técnicas mais sofisticadas acaba aumentando o tempo para codificar esses movimentos, podendo chegar a representar 54,75% do tempo total da Motion Estimation (ME). Pensando na redução do tempo de codificação, são apresentadas duas propostas para reduzir o esforço computacional do VVC, uma proposta baseada em hardware e outra em otimização de software. A proposta baseada em hardware apresenta uma heurística configurável para a etapas de Estimação de Movimento Unidirecional, Bidirecional e Affine do VVC. A heurística é de fácil implementação em hardware e se baseia na avaliação adaptativa de tamanhos de unidade de codificação (CU) para reduzir o consumo de energia. Três pontos de operação são suportados, alcançando um redução entre 7,7% e 30% do consumo de energia, com uma perda da qualidade de imagem entre 0,04% e 1%. A proposta baseada em software apresenta uma Estimação de Movimento Affine (AME) rápida para o VVC. Essa abordagem utiliza Aprendizado de Máquina com o método classificador Florestas Aleatórias (RF). O trabalho desenvolve um modelo de RF para cada tamanho de CU. Os modelos são treinados utilizando informações extraídas das CU atual, pai e vizinhas. Casa modelo é utilizado para definir se determinado tamanho de CU deverá ser ignorada pela AME ou não. A solução proposta alcança uma redução média tempo de 20% na AME e 3% no tempo total de codificação, com uma perda de qualidade de imagem de 0,07%. Palavras-chave: VVC, Inter-quadros, Affine, Machine Learning, Random Forest
Abstract:	The current state-of-the-art of video coding is Versatile Video Coding (VVC), which developed the purpose of the growing need for video data compression resulting from the increased consumption of these contents. In addition, it brings versatility, with the proposal to support various video contents, including the news that is emerging in the market, such as virtual reality, augmented reality, and 360o videos, among others, also enabling support for high resolutions beyond 4k UHD. In 2015 a group of video encoding experts called the Joint Video Exploration Team (JVET) came together to create a new video encoder standard. So in July 2020, the new VVC encoding standard was finalized, aiming to achieve a 50% bitrate reduction over its predecessor High-Efficiency Video Coding (HEVC). VVC was implemented based on its predecessor HEVC, from which it inherited most of the tools, some were improved, and others added, enabling a reduction in the average bitrate compared to its predecessor of 44%. However, these improvements came with a consequence, the increase in computational complexity, which makes it impossible for this new standard to be used in certain situations, such as real-time video transmission or used in portable devices that have limited energy capacity. Affine is one of the new tools implemented in VVC to make a more efficient prediction of complex movements such as zooming, rotation, and shearing. However, the tool uses more sophisticated techniques, increasing the time to encode these movements, which may represent 54.75% of the total Motion Estimation (ME) time. Two proposals are presented, aiming at reducing the computational effort of the VVC, one hardware-friendly and the other in software optimization. The hardware-friendly proposal presents a configurable heuristic for the Unidirectional, Bidirectional, and Affine Motion Estimation steps of the VVC. The hardware-friendly heuristic is based on the adaptive evaluation of CU sizes to reduce power consumption. Three operation points are supported, achieving a reduction of between 7,7% and 30% in energy consumption, with a loss of image quality between 0,04% and 1%. The software-based proposal presents a fast Affine Motion Estimation (AME) for the VVC. This approach uses Machine Learning with the Random Forests (RF) classifier method, developing an RF model for each CU size. Information extracted from the current, parent, and neighbors CUs is used to train the models. Each model is used to define whether a given CU size should be ignored by AME or not. The proposed solution achieves an average time reduction of 20% in the AME and 3% in the total encoding time, with an image quality loss of 0,07%. Keywords: VVC, Inter-frames, Affine, Machine Learning, Random Forest
metadata.dc.subject:	Engenharia elétrica Vídeo digital Aprendizado do computador Electrical engineering Digital video Machine learning
CNPQ:	CNPQ::ENGENHARIAS
Idioma:	por
metadata.dc.publisher.country:	Brasil
metadata.dc.publisher:	Universidade Federal do Pampa
Sigla da Instituição:	UNIPAMPA
Campus:	Campus Alegrete
Curso:	Mestrado Acadêmico em Engenharia Elétrica
metadata.dc.identifier.citation:	SAGRILO, Fernando Funghetto. Redução de Complexidade no Affine Motion Estimation do Padrão VVC. Orientador: Gustavo Freitas Sanchez. 2022. 79p. Alegrete. Dissertação (Mestrado em Engenharia Elétrica) – Universidade Federal do Pampa, Campus Alegrete, Alegrete, 2022.
Tipo de acesso:	Acesso Aberto
metadata.dc.identifier.uri:	https://repositorio.unipampa.edu.br/jspui/handle/riu/7826
metadata.dc.date.issued:	13-Dec-2022
???org.dspace.app.webui.jsptag.ItemTag.appears???	Mestrado em Engenharia Elétrica

???org.dspace.app.webui.jsptag.ItemTag.files???

???org.dspace.app.webui.jsptag.ItemTag.file???	???org.dspace.app.webui.jsptag.ItemTag.description???	???org.dspace.app.webui.jsptag.ItemTag.filesize???	???org.dspace.app.webui.jsptag.ItemTag.fileformat???
Fernando Funghetto Sagrilo-2022.pdf		2.36 MB	Adobe PDF	???org.dspace.app.webui.jsptag.ItemTag.view???

???jsp.display-item.text2??? ???jsp.display-item.display-statistics???

???jsp.display-item.copyright???