GO-gazdagodási elemzés

A GO egyik fő felhasználási területe a génkészletek gazdagodási elemzésének elvégzése. Például, ha adott egy olyan génkészlet, amely bizonyos körülmények között felfelé szabályozott, egy gazdagodási elemzés meg fogja találni, hogy mely GO-terminusok vannak túlreprezentálva (vagy alulreprezentálva) az adott génkészlet annotációi alapján.

Gazdagodási elemzés eszköze

A felhasználók közvetlenül a GOC honlap kezdőlapjáról végezhetnek gazdagodási elemzéseket. Ez a szolgáltatás a PANTHER osztályozási rendszer elemző eszközéhez csatlakozik, amelyet naprakészen tartanak a GO annotációkkal. A PANTHER osztályozási rendszert részletesen ismerteti a Mi H et al, PMID: 23868073. A támogatott génazonosítók listája a PANTHER weboldalán érhető el.

A GO-gazdagodási elemzőeszközök használata

1. Illessze be vagy gépelje be az elemzendő gének nevét, soronként egyet vagy vesszővel elválasztva. Az eszköz képes kezelni mind a MOD-specifikus génneveket, mind az UniProt azonosítókat (pl. Rad54 vagy P38086).

2. Válassza ki a GO szempontot (molekuláris funkció, biológiai folyamat, sejtkomponens) az elemzéshez (a biológiai folyamat az alapértelmezett).

3. Válassza ki a gének faját (a Homo sapiens az alapértelmezett).

4. Nyomja meg a submit gombot. Vegye figyelembe, hogy egy későbbi lépésben feltölthet egy REFERENCELISTÁT (más néven “háttér”).

5. A rendszer átirányítja Önt a PANTHER weboldalán található eredményekhez. Ezek az eredmények a 3. lépésben kiválasztott genom összes fehérjekódoló génjéhez viszonyított gazdagodáson alapulnak.

6. (opcionális, de NAGYON AJÁNLOTT) Adjon hozzá egy egyéni REFERENCELISTÁT, és futtassa le újra az elemzést. Nyomja meg a “Módosítás” gombot az eredményoldal tetején található PANTHER-elemzés összefoglalójának “Referencia lista” sorában, töltse fel a referencia lista fájlt, majd az elemzés újrafuttatásához nyomja meg a “Launch analysis” gombot. A referencialistának az összes olyan gén listájának kell lennie, amelyből a kisebb elemzési lista kiválasztásra került. Például a differenciálisan expresszált gének listájában a referencialistának csak olyan géneket kell tartalmaznia, amelyeket a kísérletben egyáltalán észleltek, és így potenciálisan szerepelhettek volna a kísérletből származó gének listáján.

Az eredménytáblázat értelmezése

Az eredményoldalon megjelenik egy táblázat, amely felsorolja a felhasználók által az előző oldalon megadott génkészlet leírására használt jelentős közös GO-terminusokat (vagy GO-terminusok szüleit), a háttérfrekvenciát, a mintafrekvenciát, a várható p-értéket, az egyes terminusok túl/alulreprezentáltságának jelzését és a p-értéket. Ezenkívül az eredményoldalon megjelenik az elemzés során használt összes kritérium. A fel nem oldott génnevek a táblázat tetején szerepelnek.

Háttérfrekvencia és mintafrekvencia

A háttérfrekvencia a teljes háttérkészletben egy GO-terminushoz annotált gének száma, míg a mintafrekvencia az adott GO-terminushoz annotált gének száma a bemeneti listában. Például, ha a bemeneti lista 10 gént tartalmaz, és a dúsítás biológiai folyamatra történik S. cerevisiae-ben, amelynek háttérkészlete 6442 gént tartalmaz, akkor ha a 10 bemeneti génből 5 van annotálva a GO terminushoz: DNS-javítás, akkor a DNS-javítás mintafrekvenciája 5/10 lesz. Míg ha a teljes S. cerevisiae genomban 100 gént annotáltak a DNS-javításhoz, akkor a háttérfrekvencia 100/6442 lesz.

Túlreprezentált vagy alulreprezentált

A + és – szimbólumok egy kifejezés túl- vagy alulreprezentáltságát jelzik.

P-érték

A P-érték annak a valószínűsége vagy esélye, hogy a listában szereplő összes n génből legalább x számú gént találunk egy adott GO-terminushoz annotálva, figyelembe véve a teljes genomban az adott GO-terminushoz annotált gének arányát. Vagyis a felhasználó listájában szereplő gének által osztott GO-terminusokat összehasonlítjuk az annotáció háttéreloszlásával. Minél közelebb van a p-érték a nullához, annál szignifikánsabb az adott géncsoporthoz társított GO termin (azaz annál kevésbé valószínű, hogy az adott GO termin megfigyelt annotációja egy géncsoporthoz véletlenszerűen történik).

Más szóval, a folyamatontológiában való keresés során, ha egy csoport összes génje a “DNS-javítás”-hoz kapcsolódna, akkor ez a termin szignifikáns lenne. Mivel azonban a genomban minden gén (GO-annotációval) közvetve a “biológiai_folyamat” legfelső szintű kifejezéshez kapcsolódik, ez nem lenne szignifikáns, ha egy csoport összes génje ehhez a nagyon magas szintű kifejezéshez kapcsolódna.

Külső eszközök

Egy sor különböző eszköz kínál gazdagítási lehetőségeket. Ezek közül néhány webalapú, míg másokhoz a felhasználónak le kell töltenie egy alkalmazást vagy telepítenie kell egy helyi környezetet. Az eszközök különböznek az általuk használt algoritmusok, az általuk végzett statisztikai tesztek és a mögöttes GO-adatok frissítésének gyakorisága tekintetében. A felhasználóknak ezért óvatosnak kell lenniük a külső eszközök használatakor, különösen akkor, ha a GO verziója nem azonosítható azonnal.

Egyes GO által támogatott gazdagító eszközök a következők:

  • BiNGO
  • GeneWeaver
  • gProfiler
  • GOrilla
  • Ontologizer

.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük