Uma análise de regressão tem como objetivo descrever a relação do valor médio esperado de uma variável resposta aleatória dado o conjunto de outras variáveis explicaticas. A regressão linear tem como tem como objetivo analisar a relação (função) linear entre essas variáveis.
As duas funções de uma análise de regressão são:
i. Exploratória: Análise da relação entre variáveis aleatórias, respostas e preditoras.
ii. Preditiva - Previsãoo dos dados futuros não observados em função das variáveis preditoras.
O modelos mais simples de uma relação linear entre variáveis é explicita da seguinte forma:
$y= \beta_0 + \beta_1x$
*Assumindo que não haja erro
Na presença de erro o modelo deve ser descrito como:
$y=\beta_0 + \beta_1x + \varepsilon$
Os termos da equação $\beta_0$ e $\beta_1$ são os parâmetros que definem a relação linear entre as duas variáveis enquanto o $\varepsilon$ é o termo aleatório do modelos.