What is Homoskedastic?
ホモスケダス(「homoscedastic」とも表記される)とは、回帰モデルにおける残差または誤差項の分散が一定である状態を指します。 つまり、予測変数の値が変化しても、誤差項はあまり変化しないのです。 別の言い方をすれば、どのデータポイントでも分散がほぼ同じであることです。 これは一貫性のレベルを示唆し、回帰によるデータのモデル化と作業を容易にします。 しかし、ホモスケダシティの欠如は、従属変数のパフォーマンスを説明するために、回帰モデルが追加の予測変数を含む必要があることを示唆しているかもしれません。
Key Takeaways
- Homoskedasticity は回帰モデルにおける誤差項の分散が一定のときに発生します。
- 誤差項の分散がホモスケダスティックである場合、モデルはよく定義されました。 分散が大きすぎる場合は、モデルがうまく定義されていない可能性があります。
- 追加の予測変数を追加すると、従属変数のパフォーマンスを説明するのに役立ちます。
- エラー項の分散が一定でない場合、異種分散が発生します。
How Homoskedasticity Works
Homoskedasticity is one assumption of linear regression modeling and data of this type works well with the least squares method(等質退行性は線形回帰モデリングにおけるひとつの仮定であり、このタイプのデータは最小二乗法がうまく機能します。 回帰線の周りの誤差の分散が大きく変化する場合、回帰モデルはうまく定義できない可能性があります。 “均質 “の反対が “不均質 “であるように、均質性の反対は不均質性である。 異次元性(”heteroscedasticity “とも表記される)とは、回帰式における誤差項の分散が一定でない状態を指します。
分散が予測された結果と与えられた状況の実際の結果の間の測定された差であることを考慮すると、ホモスケダスティックを決定すると、正確さのためにどの要因を調整する必要があるかを決定するのに役立ちます。
特別な考察
単純回帰モデルまたは方程式は 4 項から成ります。 左側は従属変数です。 これは、モデルが「説明」しようとする現象を表します。 右側は、定数、予測変数、および残差、または誤差の項です。 誤差項は、予測変数によって説明されない従属変数の変動量を示します。
ホモスケダスの例
たとえば、各学生の勉強時間の量を使用して、学生のテストのスコアを説明したいとします。 この場合、テストのスコアは従属変数で、勉強に費やした時間は予測変数になります。
誤差項は、勉強時間によって説明されなかったテスト スコアの分散量を示すでしょう。
しかし、分散は異種分散である可能性があります。
しかし、分散が異種分散である可能性があります。誤差項のデータのプロットは、大量の勉強時間が高いテストスコアと非常に密接に対応しているが、低い勉強時間のテストスコアは大きく異なり、いくつかの非常に高いスコアを含むことさえあることを示すかもしれないのです。 つまり、得点のばらつきは、単に1つの予測変数(勉強時間)だけではうまく説明できないのです。
さらなる調査により、一部の学生は事前にテストの答えを見ていた、または以前に同様のテストを受けたことがあり、そのためこの特定のテストのために勉強する必要がないことが判明するかもしれません。
回帰モデルを改善するために、研究者は、データにより正確にフィットする他の説明変数を試してみる必要があるでしょう。 たとえば、一部の学生が前もって答えを見ていた場合、回帰モデルには、勉強時間と、学生が答えについて予備知識を持っていたかどうかという 2 つの説明変数があります。 これらの 2 つの変数で、テスト スコアの分散のより多くが説明され、エラー項の分散はホモスケダスになり、モデルがうまく定義されたことを示唆します。