O que é Homoskastic?
Homoskedastic (também escrito “homoscedastic”) refere-se a uma condição na qual a variância do termo residual, ou termo de erro, em um modelo de regressão é constante. Ou seja, o termo de erro não varia muito, pois o valor da variável preditora muda. Outra forma de dizer isto é que a variância dos pontos de dados é aproximadamente a mesma para todos os pontos de dados. Isto sugere um nível de consistência e facilita a modelagem e o trabalho com os dados através da regressão. Entretanto, a falta de homoskedasticidade pode sugerir que o modelo de regressão pode precisar incluir variáveis preditoras adicionais para explicar o desempenho da variável dependente.
Key Takeaways
- Homoskedasticidade ocorre quando a variância do termo de erro em um modelo de regressão é constante.
- Se a variância do termo de erro for homoskedasticidade, o modelo foi bem definido. Se houver demasiada variância, o modelo pode não estar bem definido.
- Adicionar variáveis preditoras adicionais pode ajudar a explicar o desempenho da variável dependente.
- Oppositely, heteroskedasticity occurs when the variance of the error term is not constant.
How Homoskedasticity Works
Homoskedasticity is one assumption of linear regression modeling and data of this type works well with the least squares method. Se a variância dos erros em torno da linha de regressão varia muito, o modelo de regressão pode ser mal definido. O oposto de homoskedasticidade é heteroskedasticidade, assim como o oposto de “homogêneo” é “heterogêneo”. Heteroskedasticidade (também chamada “heteroscedasticidade”) refere-se a uma condição na qual a variância do termo de erro em uma equação de regressão não é constante.Ao considerar que a variância é a diferença medida entre o resultado previsto e o resultado real de uma determinada situação, a determinação da homosquemasticidade pode ajudar a determinar quais fatores precisam ser ajustados para a precisão.
Considerações Especiais
Um modelo de regressão simples, ou equação, consiste em quatro termos. No lado esquerdo, está a variável dependente. Ela representa o fenômeno que o modelo procura “explicar”. Do lado direito estão uma constante, uma variável preditora, e um termo residual, ou erro. O termo erro mostra a quantidade de variabilidade na variável dependente que não é explicada pela variável preditora.
Exemplo de Homoskastic
Por exemplo, suponha que você quisesse explicar as notas do teste do estudante usando a quantidade de tempo que cada estudante passou estudando. Neste caso, as notas do teste seriam a variável dependente e o tempo gasto no estudo seria a variável preditora.
O termo de erro mostraria a quantidade de variação nas notas do teste que não foi explicada pela quantidade de tempo de estudo. Se essa variância for uniforme, ou homoskedastic, então isso sugere que o modelo pode ser uma explicação adequada para o desempenho do teste – explicando-o em termos de tempo de estudo.
Mas a variância pode ser heteroskedastic. Um gráfico dos dados do termo de erro pode mostrar uma grande quantidade de tempo de estudo correspondendo muito bem com altos escores de teste, mas que os baixos escores de teste de tempo de estudo variaram muito e até incluíram alguns escores muito altos. Portanto, a variância dos resultados não seria bem explicada simplesmente por uma variável preditora-a quantidade de tempo de estudo. Neste caso, algum outro fator provavelmente está em ação, e o modelo pode precisar ser aprimorado para identificá-lo ou eles.
Outras investigações podem revelar que alguns estudantes tinham visto as respostas ao teste antes do tempo ou que tinham feito um teste semelhante anteriormente, e portanto não precisavam estudar para este teste em particular. Para isso, pode acontecer que os alunos tenham tido diferentes níveis de aproveitamento independentemente do tempo de estudo e do desempenho nos testes anteriores, independentemente do assunto.
Para melhorar o modelo de regressão, o pesquisador teria de experimentar outras variáveis explicativas que pudessem fornecer um ajuste mais preciso aos dados. Se, por exemplo, alguns estudantes tivessem visto as respostas antes do tempo, o modelo de regressão teria então duas variáveis explicativas: tempo de estudo, e se o estudante tinha conhecimento prévio das respostas. Com estas duas variáveis, mais da variância dos resultados do teste seria explicada e a variância do termo de erro poderia então ser homoskedastic, sugerindo que o modelo estava bem definido.