Estatística
Reta de regressão
Em estudos de distribuições bidimensionais, quando há correlação entre as variáveis, muitas vezes interessa prever o valor de uma das variáveis quando se conhece o valor correspondente da outra variável.
O processo que se vai utilizar consiste em traçar uma reta que "melhor" se ajuste (aproxime) aos pontos do diagrama de dispersão.
Há processos matemáticos para a determinação da equação dessa reta chamada reta de regressão. Prova-se que essa reta passa pelo ponto médio da nuvem de pontos e o declive tem sinal igual ao do coeficiente de correlação.
Quando a disposição dos pontos do diagrama de dispersão se faz «ao longo» de uma reta, a correlação diz-se linear.
A reta que apresentar menores «desvios quadrados» em relação aos pontos chama-se reta de regressão linear.
A reta de regressão permite estimar o valor de y, para um dado valor de x.
Exemplo:
Numa operação de fiscalização de viaturas, estiveram envolvidos 10 agentes da polícia.
O número de viaturas fiscalizadas e o número de infratores identificados por cada um dos agentes estão representados na tabela seguinte.
Qual é o número de infratores que se prevê que sejam identificados por um agente que fiscalize sete viaturas?
Começa-se por construir o diagrama de dispersão e por determinar o centro de gravidade :
Passando por este ponto, traça-se uma reta que "melhor" se ajuste à nuvem de pontos. Encontra-se assim uma reta que nos permite fazer estimativas.
Com a ajuda da calculadora é possível conhecer uma equação da reta de regressão, o que traz maior rigor ao processo.
Por observação do gráfico conclui-se que a ordenada do ponto da reta de regressão que tem abcissa 7 é aproximadamente 3,2. Assim, prevê-se que haja três infratores.
A reta de regressão de y em x pode ser representada por uma equação do tipo y = ax + b, e permite descrever como se refletem em y (variável dependente) – variável resposta -, as modificações produzidas na variável x (variável independente) – variável explicativa.