Analiza de îmbogățire GO

Una dintre principalele utilizări ale GO este de a efectua o analiză de îmbogățire a seturilor de gene. De exemplu, având în vedere un set de gene care sunt suprareglementate în anumite condiții, o analiză de îmbogățire va găsi ce termeni GO sunt suprareprezentați (sau subreprezentați) folosind adnotările pentru acel set de gene.

Strument de analiză a îmbogățirii

Utilizatorii pot efectua analize de îmbogățire direct de pe pagina principală a site-ului GOC. Acest serviciu se conectează la instrumentul de analiză din Sistemul de clasificare PANTHER, care este menținut la zi cu adnotările GO. Sistemul de clasificare PANTHER este explicat cu lux de amănunte în Mi H et al, PMID: 23868073. Lista ID-urilor de gene acceptate este disponibilă pe site-ul PANTHER.

Utilizarea instrumentelor de analiză a îmbogățirii GO

1. Lipiți sau tastați numele genelor care urmează să fie analizate, unul pe rând sau separate prin virgulă. Instrumentul poate gestiona atât nume de gene specifice MOD, cât și ID-uri UniProt (de exemplu, Rad54 sau P38086).

2. Selectați aspectul GO (funcție moleculară, proces biologic, componentă celulară) pentru analiza dvs. (procesul biologic este implicit).

3. Selectați specia din care provin genele dvs. (Homo sapiens este implicit).

4. Apăsați butonul de trimitere. Rețineți că veți putea încărca o LISTĂ DE REFERINȚĂ (aka „fundal”) la o etapă ulterioară.

5. Veți fi redirecționat către rezultatele de pe site-ul PANTHER. Aceste rezultate se bazează pe îmbogățirea în raport cu setul de toate genele codificatoare de proteine din genomul pe care l-ați selectat în etapa 3.

6. (opțional, dar FOARTE RECOMANDAT) Adăugați o LISTĂ DE REFERINȚĂ personalizată și reluați analiza. Apăsați butonul „change” de pe linia „Reference list” din rezumatul analizei PANTHER din partea de sus a paginii de rezultate, încărcați fișierul cu lista de referință și apăsați butonul „Launch analysis” pentru a relua analiza. Lista de referință ar trebui să fie lista tuturor genelor din care a fost selectată lista dvs. de analiză mai mică. De exemplu, într-o listă de gene exprimate diferențiat, lista de referință ar trebui să conțină doar genele care au fost detectate în experiment și, prin urmare, ar fi putut să se regăsească pe o listă de gene derivate din experiment.

Interpretarea tabelului de rezultate

Pagina de rezultate afișează un tabel care enumeră termenii GO (sau părinții termenilor GO) semnificativi împărtășiți (sau părinții termenilor GO) utilizați pentru a descrie setul de gene pe care utilizatorii l-au introdus în pagina anterioară, frecvența de fond, frecvența eșantionului, valoarea p preconizată, o indicație a suprareprezentării/subreprezentării pentru fiecare termen și valoarea p. În plus, pagina de rezultate afișează toate criteriile utilizate în cadrul analizei. Orice nume de gene nerezolvate vor fi enumerate în partea de sus a tabelului.

Frecvența de fond și frecvența eșantionului

Frecvența de fond este numărul de gene adnotate la un termen GO în întregul set de fond, în timp ce frecvența eșantionului este numărul de gene adnotate la acel termen GO în lista de intrare. De exemplu, în cazul în care lista de intrare conține 10 gene, iar îmbogățirea se face pentru un proces biologic în S. cerevisiae, al cărui set de bază conține 6442 de gene, atunci dacă 5 din cele 10 gene de intrare sunt adnotate la termenul GO: Repararea ADN, atunci frecvența de eșantionare pentru repararea ADN va fi de 5/10. În timp ce dacă există 100 de gene adnotate la repararea ADN-ului în tot genomul S. cerevisiae, atunci frecvența de fond va fi de 100/6442.

Supra-reprezentată sau subreprezentată

Simbolurile + și – indică suprareprezentarea sau subreprezentarea unui termen.

P-value

P-value este probabilitatea sau șansa de a vedea cel puțin un număr x de gene din totalul de n gene din listă adnotate la un anumit termen GO, având în vedere proporția de gene din întregul genom care sunt adnotate la acel termen GO. Altfel spus, termenii GO împărtășiți de genele din lista utilizatorului sunt comparați cu distribuția de bază a adnotărilor. Cu cât valoarea p este mai aproape de zero, cu atât este mai semnificativ termenul GO particular asociat grupului de gene (adică cu atât este mai puțin probabil ca adnotarea observată a termenului GO particular la un grup de gene să apară din întâmplare).

Cu alte cuvinte, atunci când se caută în ontologia proceselor, dacă toate genele dintr-un grup sunt asociate cu „repararea ADN-ului”, acest termen ar fi semnificativ. Cu toate acestea, deoarece toate genele din genom (cu adnotări GO) sunt asociate indirect cu termenul de nivel superior „biological_process”, acest lucru nu ar fi semnificativ dacă toate genele dintr-un grup ar fi asociate cu acest termen de nivel foarte înalt.

Instrumente externe

Există o serie de instrumente diferite care oferă capacități de îmbogățire. Unele dintre acestea sunt bazate pe web, în timp ce altele pot necesita ca utilizatorul să descarce o aplicație sau să instaleze un mediu local. Instrumentele diferă în ceea ce privește algoritmii pe care îi utilizează, testele statistice pe care le efectuează și frecvența cu care sunt actualizate datele GO subiacente. Prin urmare, utilizatorii ar trebui să dea dovadă de prudență atunci când utilizează instrumente externe, în special dacă versiunea GO nu este imediat identificabilă.

Câteva instrumente de îmbogățire aprobate de GO sunt:

  • BiNGO
  • GeneWeaver
  • gProfiler
  • GOrilla
  • Ontologizer

.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *