Homoskedastický

Co je to homoskedastický?

Homoskedastický (psáno též „homoskedastický“) označuje stav, kdy je rozptyl reziduí neboli chybového členu v regresním modelu konstantní. To znamená, že chybový člen se při změně hodnoty predikční proměnné příliš nemění. Jiný způsob, jak to říci, je, že rozptyl datových bodů je zhruba stejný pro všechny datové body. To naznačuje určitou míru konzistence a usnadňuje modelování a práci s daty pomocí regrese. Nedostatek homoskedasticity však může naznačovat, že regresní model možná bude muset obsahovat další predikční proměnné, aby vysvětlil výkon závislé proměnné.

Klíčové poznatky

  • Homoskedasticita nastává, když je rozptyl chybového členu v regresním modelu konstantní.
  • Je-li rozptyl chybového členu homoskedastický, byl model dobře definován. Pokud je rozptyl příliš velký, model nemusí být dobře definován.
  • Přidání dalších predikčních proměnných může pomoci vysvětlit výkonnost závislé proměnné.
  • K heteroskedasticitě naopak dochází, když rozptyl chybového členu není konstantní.

Jak funguje homoskedasticita

Homoskedasticita je jedním z předpokladů lineárního regresního modelování a data tohoto typu dobře fungují s metodou nejmenších čtverců. Pokud se rozptyl chyb v okolí regresní přímky velmi liší, může být regresní model špatně definován. Opakem homoskedasticity je heteroskedasticita, stejně jako opakem slova „homogenní“ je „heterogenní“. Heteroskedasticita (psáno též „heteroskedasticita“) označuje stav, kdy rozptyl chybového členu v regresní rovnici není konstantní.

Pokud uvážíme, že rozptyl je naměřený rozdíl mezi předpovídaným výsledkem a skutečným výsledkem dané situace, může určení homoskedasticity pomoci určit, které faktory je třeba upravit pro přesnost.

Zvláštní úvahy

Jednoduchý regresní model neboli rovnice se skládá ze čtyř členů. Na levé straně je závislá proměnná. Představuje jev, který se model snaží „vysvětlit“. Na pravé straně je konstanta, predikční proměnná a reziduální neboli chybový člen. Chybový člen udává množství variability závislé proměnné, které není vysvětleno prediktivní proměnnou.

Příklad homoskedastického

Předpokládejme například, že chcete vysvětlit výsledky studentů v testech pomocí množství času, které každý student strávil studiem. V tomto případě by výsledky testů byly závislou proměnnou a čas strávený studiem by byl prediktivní proměnnou.

Chybový člen by ukazoval množství rozptylu v testových výsledcích, které nebylo vysvětleno množstvím času stráveného studiem. Pokud je tento rozptyl rovnoměrný nebo homoskedastický, pak by to naznačovalo, že model může být adekvátním vysvětlením výkonu v testu – vysvětluje ho z hlediska času stráveného studiem.

Rozptyl však může být heteroskedastický. Graf údajů o chybovém členu může ukázat, že velké množství času věnovaného studiu velmi těsně koresponduje s vysokými výsledky v testech, ale že výsledky v testech s malým množstvím času věnovaného studiu se značně liší a zahrnují i některé velmi vysoké výsledky. Rozptyl skóre by tedy nebyl dobře vysvětlen pouze jednou prediktivní proměnnou – množstvím času stráveného studiem. V tomto případě pravděpodobně působí nějaký další faktor a k jeho identifikaci nebo identifikaci těchto faktorů bude možná třeba model rozšířit.

Další zkoumání může odhalit, že někteří studenti viděli odpovědi na test předem nebo že již dříve psali podobný test, a proto se na tento konkrétní test nemuseli učit. Když na to přijde, může se prostě ukázat, že studenti měli různou úroveň schopností zvládnout test nezávisle na době studia a na výsledcích v předchozích testech bez ohledu na předmět.

Aby výzkumník vylepšil regresní model, musel by vyzkoušet další vysvětlující proměnné, které by mohly poskytnout přesnější shodu s daty. Pokud by například někteří studenti viděli odpovědi předem, regresní model by pak měl dvě vysvětlující proměnné: dobu studia a to, zda student předem znal odpovědi. S těmito dvěma proměnnými by bylo možné vysvětlit větší část rozptylu výsledků testu a rozptyl chybového členu by pak mohl být homoskedastický, což by naznačovalo, že model je dobře definovaný.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *