@MASTERSTHESIS{ 2019:1428931067, title = {Revisitando a estimação de coeficiente de determinação}, year = {2019}, url = "https://bdtd.unifal-mg.edu.br:8443/handle/tede/1419", abstract = "O coeficiente de determinação (R2) é uma métrica muito utilizada para a análise de qualidade de ajuste de modelos lineares. Este coeficiente assume valores no intervalo entre 0 e 1, de modo que quanto mais próximo de 1, maior parte da variação da variável resposta está sendo explicada pelo modelo. Há outras métricas com o mesmo objetivo, como o coeficiente de determinação ajustado, o erro absoluto e erro quadrático médio, por exemplo. Mesmo sendo muito utilizado, o R2 é tratado com cautela na literatura, pois este pode ser viesado em modelos com poucas observações ou inflacionado quando se acrescentam covariáveis ao modelo. Neste sentido, autores sugerem tratá-lo como uma estatística que estima um parâmetro populacional ( 2), sendo este entendido como a qualidade de ajuste que um modelo possuiria se as infinitas observações do fenômeno viessem a ser coletadas. Desta forma, sendo 2 um parâmetro e R2 um estimador pontual, é natural pensar em estimação intervalar e testes de hipóteses para possibilitar a tomada de decisão sobre a adequação do modelo candidato ao fenômeno no qual deseja-se descrever. Entretanto, essa questão inferencial ainda não é considerada fechada na literatura, pois autores discutem distribuições de probabilidade para a modelagem deste em diferentes cenários e regiões do espaço paramétrico. Desta forma, este trabalho estudou a estimação do coeficiente de determinação paramétrico ( 2) a partir de cinco estimadores intervalares paramétricos. Para compará-los, foi realizado um estudo de simulação Monte Carlo, computando precisão e acurácia em diferentes cenários compostos pela combinação do número de covariáveis do modelo (k), tamanho amostral (n) e o verdadeiro valor paramétrico ( 2). Em conjunto a isso, elaborouse um índice de desempenho de estimação intervalar que valoriza simultaneamente precisão e acurácia com importâncias relativas previamente fixadas. Os resultados permitiram a recomendação do melhor estimador para cada região do espaço paramétrico. Com isso, verificou-se que os estimadores propostos apresentaram qualidade similar aos indicados na literatura ao longo do espaço paramétrico. Por fim, foi construído um pacote R, possibilitando que o usuário estime de forma intervalar a qualidade do ajuste utilizando o estimador com melhor desempenho.", publisher = {Universidade Federal de Alfenas}, scholl = {Programa de Pós-Graduação em Estatística Aplicada e Biometria}, note = {Instituto de Ciências Exatas} }