Entenda porque o R² não é medida de qualidade

Observem a imagem abaixo. Nela, nós geramos o vetor x com 200 números aleatórios entre 0 e 1.

Já na segunda imagem, geramos y com distribuição normal, cuja média se relaciona com x através da relação linear y = 2x+3 e com a variância igual para todo mundo.

Agora vamos para a terceira imagem e vejamos o que ocorre se rodarmos um modelo de regressão de y para x. Observe que os parâmetros estimados estão incrivelmente próximos dos valores reais e que o intervalo de confiança de 95% para os valores estimados contém os valores reais. Porém, algo salta aos olhos: o R² da regressão está com um valor baixo (cerca de 0,31).

Este exemplo simulado bem simples mostra como o R² não é a única métrica para se avaliar uma modelo de regressão e não pode ser interpretado como um “grau de qualidade” de um modelo. O R² tão somente explica qual fração da variabilidade da variável dependente pode ser explicada pelos regressores. Um R² baixo significa apenas que há outros fatores (inclusive a aleatoriedade) que afetam a variabilidade da variável explicada. Não que as estimações estejam incorretas.

Por isso, cuidado ao julgar trabalhos por terem R² alto ou baixos. Lembre-se que ele não é medida de qualidade.