Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: https://bdtd.unifal-mg.edu.br:8443/handle/tede/1419
Tipo do documento: Dissertação
Título: Revisitando a estimação de coeficiente de determinação
Autor: PALA, Luiz Otávio de Oliveira
Primeiro orientador: FERREIRA, Eric Batista
Primeiro coorientador: GOMES, Davi Butturi
Primeiro membro da banca: PEREIRA, Gislene Araújo
Segundo membro da banca: SILVA, Washington Santos da
Terceiro membro da banca: PASCOA, Marcelino Alves Rosa de
Resumo: O coeficiente de determinação (R2) é uma métrica muito utilizada para a análise de qualidade de ajuste de modelos lineares. Este coeficiente assume valores no intervalo entre 0 e 1, de modo que quanto mais próximo de 1, maior parte da variação da variável resposta está sendo explicada pelo modelo. Há outras métricas com o mesmo objetivo, como o coeficiente de determinação ajustado, o erro absoluto e erro quadrático médio, por exemplo. Mesmo sendo muito utilizado, o R2 é tratado com cautela na literatura, pois este pode ser viesado em modelos com poucas observações ou inflacionado quando se acrescentam covariáveis ao modelo. Neste sentido, autores sugerem tratá-lo como uma estatística que estima um parâmetro populacional ( 2), sendo este entendido como a qualidade de ajuste que um modelo possuiria se as infinitas observações do fenômeno viessem a ser coletadas. Desta forma, sendo 2 um parâmetro e R2 um estimador pontual, é natural pensar em estimação intervalar e testes de hipóteses para possibilitar a tomada de decisão sobre a adequação do modelo candidato ao fenômeno no qual deseja-se descrever. Entretanto, essa questão inferencial ainda não é considerada fechada na literatura, pois autores discutem distribuições de probabilidade para a modelagem deste em diferentes cenários e regiões do espaço paramétrico. Desta forma, este trabalho estudou a estimação do coeficiente de determinação paramétrico ( 2) a partir de cinco estimadores intervalares paramétricos. Para compará-los, foi realizado um estudo de simulação Monte Carlo, computando precisão e acurácia em diferentes cenários compostos pela combinação do número de covariáveis do modelo (k), tamanho amostral (n) e o verdadeiro valor paramétrico ( 2). Em conjunto a isso, elaborouse um índice de desempenho de estimação intervalar que valoriza simultaneamente precisão e acurácia com importâncias relativas previamente fixadas. Os resultados permitiram a recomendação do melhor estimador para cada região do espaço paramétrico. Com isso, verificou-se que os estimadores propostos apresentaram qualidade similar aos indicados na literatura ao longo do espaço paramétrico. Por fim, foi construído um pacote R, possibilitando que o usuário estime de forma intervalar a qualidade do ajuste utilizando o estimador com melhor desempenho.
Abstract: The coefficient of determination (R2) is a widely used metric to analyze the quality of adjustment of linear models. This coefficient assumes values in the range between 0 and 1, so that the closer to 1, most of the capacity variation is being explained by the model. R2 is treated with caution in the literature, as it can be biased in models with few observations or inflated when covariates are added to the model. In this sense, authors suggest treating it as a statistic that estimates a population parameter ( 2), which is understood as the quality of fit that a model would have if the infinite observations of the phenomenon were to be collected. Thus, we study the estimation of the parametric coefficient of determination ( 2) from five parametric interval estimators. For comparison, a Monte Carlo simulation study was performed, computing precision and accuracy in the different combinations to model the number of model variables (k), sample size (n) and the value of the parameter ( 2). The results allowed the recommendation of the best estimator for each region of the parametric space. Thus, it was found that the proposed estimators presented similar quality to those indicated in the literature in the parametric space. Finally, an R package was built, allowing the user to estimate the quality of the model using the best performing estimator.
Palavras-chave: Intervalos de Confiança
Estatística como Assunto
Método de Monte Carlo
Área(s) do CNPq: PROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADAS
Idioma: por
País: Brasil
Instituição: Universidade Federal de Alfenas
Sigla da instituição: UNIFAL-MG
Departamento: Instituto de Ciências Exatas
Programa: Programa de Pós-Graduação em Estatística Aplicada e Biometria
Citação: PALA, Luiz Otávio de Oliveira. Revisitando a estimação de coeficiente de determinação. 2019. 112 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Alfenas, Alfenas, MG, 2019.
Tipo de acesso: Acesso Aberto
Endereço da licença: http://creativecommons.org/licenses/by-nc-nd/4.0/
URI: https://bdtd.unifal-mg.edu.br:8443/handle/tede/1419
Data de defesa: 6-Set-2019
Aparece nas coleções:Mestrado

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertação de Luiz Otávio de Oliveira Pala.pdf3,29 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Este item está licenciada sob uma Licença Creative Commons Creative Commons