Main Text
Cromozomul Y uman este transmis direct de la tată la fiu pe cea mai mare parte a lungimii sale, generând un model de moștenire specific bărbaților, care este diferit de restul genomului. Astfel, trăsăturile fenotipice ale cromozomului Y ar trebui să fie ușor de recunoscut din moștenirea lor pe linie masculină, iar primele studii au susținut că au identificat mai multe astfel de trăsături, inclusiv exemple notabile precum „urechile păroase”. Cu toate acestea, încă din 1957, examinarea critică a acestor afirmații nu a reușit să găsească susținere pentru niciuna dintre cele 17 trăsături luate în considerare,1 o constatare întărită de analiza genetică moleculară ulterioară a „urechilor păroase” în sine.2 Această lipsă poate surprinzătoare a trăsăturilor cromozomiale Y poate fi înțeleasă, cel puțin în parte, ca o consecință a doi factori. În primul rând, atunci când, în 2003, a fost generată o secvență de referință pentru regiunea specifică masculină a cromozomului Y uman3 , aceasta a arătat că cromozomul poartă puține gene specifice bărbaților și codifică doar 23 de proteine distincte. Lucrări ulterioare au constatat că trei dintre acestea sunt absente la aproximativ 2% dintre bărbații din Asia de Sud, ai căror cromozomi Y codifică astfel doar 20 de proteine specifice bărbaților.4 În al doilea rând, cromozomul Y are funcții specializate în determinarea sexului masculin și a fertilității, în care variația mendeliană ar fi puțin probabil să fie ereditară. Astfel, la începutul anului 2004, se putea scrie că „analiza pedigree-ului nu a dezvăluit încă o singură genă legată de Y. „5 Cu toate acestea, mai târziu în același an, a fost raportată deficiența de auz legată de Y (DFNY1, MIM 400043) într-o familie chineză6 și rămâne singura tulburare mendeliană documentată care prezintă o legătură cu Y la om. Prin urmare, baza sa pare a fi probabil neobișnuită și prezintă un interes considerabil. Aici, investigăm această bază prin examinarea secvenței cromozomului Y al DFNY1 și compararea acesteia cu cromozomul Y al unei ramuri a familiei strâns înrudite, dar neafectate.
În pedigree-ul DFNY1 de șapte generații raportat în 2004, toți bărbații adulți au fost afectați.6 Ulterior, pedigree-ul a fost urmărit încă două generații și au fost identificați descendenți suplimentari pe linie masculină ai unui strămoș anterior.7 În mod surprinzător, auzul lor nu a fost afectat (Figura 1). Demonstrasem anterior identitatea cromozomilor Y din cele două ramuri ale familiei la 67 de loci Y-STR și, prin urmare, am motivat că diferența fenotipică dintre ramuri trebuie să fie asociată cu o variantă genetică purtată în mod specific de cromozomul Y al ramurii afectate. Am sortat un cromozom Y reprezentativ din fiecare ramură prin citometrie în flux și apoi l-am secvențiat. Între cromozomi au fost identificate doar patru diferențe de bază-substitut între cromozomi.8 Trei dintre acestea au apărut pe ramura neafectată. Cea de-a patra a apărut pe ramura afectată și a segregat cu fenotipul, dar a oferit un candidat slab pentru mutația cauzală, deoarece se afla în afara oricărei gene adnotate. Deși această analiză nu a putut evalua regiunile repetate ale cromozomului, genele repetate cunoscute sunt implicate în principal în spermatogeneză,3,9 astfel încât, în studiul actual, am explorat posibilitatea ca mutația cauzală să nu fie o mutație punctiformă. Acest studiu a fost aprobat de către donatorii de eșantioane, care au oferit consimțământul informat în scris, și de către Comitetul de etică medicală al Spitalului General al APL din China, Beijing, China.
Pedigree-ul DFNY1
Bărbații, pătrate; femelele, cercuri; linia diagonală, decedat. Simbolurile umplute indică deficiențe de auz (inclusiv din registrele de familie); semnele de întrebare indică doi indivizi al căror fenotip auditiv este necunoscut; iar asteriscurile indică indivizi care se află pe ramura afectată, dar care nu aveau vârsta de debut a simptomelor la momentul examinării. Săgețile indică cei doi indivizi ai căror cromozomi Y au fost secvențiați. Rearanjarea structurală a avut loc în timpul uneia dintre cele patru meioze marcate cu stele roșii. Soții sunt omisi în generațiile VII-IX și în generația VI pe ramura neafectată.
Am examinat adâncimea relativă de citire de-a lungul cromozomului prin alinierea citirilor de înaltă calitate filtrate prin duplicat la secvența de referință chrY utilizând Sequence Search and Alignment by Hashing Algorithm 2 (SSAHA2)10 și comparând numărul de citiri per bin de 10 kb între cromozomii Y de la individul afectat VIII-2 (Figura 1) și de la individul neafectat VII-24 (Figura 1). Acest lucru a evidențiat trei segmente discontinue duplicate în cromozomul afectat și toate proveneau din regiunea limitată dintre grupul de gene TSPY1 (MIM 480100) care se termină la ∼9,3 Mb și decalajul centromeric la ∼10,1 Mb (Figura 2A). Aceste duplicații au fost confirmate prin hibridizare genomică comparativă (CGH) convențională cu matrice de oligonucleotide convenționale cu o matrice Agilent de 1 milion care acoperă întregul genom și o matrice NimbleGen 385K personalizată care acoperă pozițiile chrY: 2.000.000-10.715.000 (1.990.000-10.105.000 hg19) la o rezoluție ridicată (∼20 bp) (Figura 2B). Deoarece au inclus o parte din clusterul de gene TSPY1, am verificat o creștere a numărului de gene TSPY1 prin qPCR (Tabelul S1 în datele suplimentare disponibile online) și prin electroforeză în gel cu câmp pulsat (PFGE; Figura S1). Aceste analize au arătat că duplicarea a fost împărtășită de toți membrii afectați ai familiei testate și a fost absentă la toți membrii neafectați și, de asemenea, că duplicarea se afla într-un fragment de restricție separat de clusterul TSPY1 original și, prin urmare, nu era contiguă. Deși dovezile combinate au confirmat o duplicare complexă a regiunii de 9,3-10,1 Mb, acestea nu au furnizat informații despre locul în care au fost inserate secvențele duplicate. Hibridizarea fluorescentă in situ (FISH) în metafază cu o sondă TSPY1 a arătat un singur semnal (nu este prezentat), așa că am folosit fiber-FISH, așa cum a fost descris anterior11 , pentru o rezoluție mai mare. Sondele cromozomiale Y au fost clone BAC care acoperă cea mai mare parte din ∼9,3-10,1 Mb din secvența de referință: RP11-334D2 (inclusiv TSPY1), RP11-182H20, RP11-155J5, RP11-160K17 și RP11-108I14 (inclusiv secvențele centromerice). Rezultatele (figura 2C) au arătat că cromozomul neafectat a fost organizat în același mod ca și secvența de referință, care poate fi rezumată ca TSPY1-182H20-centromer. În schimb, cromozomul afectat (Figura 2D) a fost întrerupt în cadrul secvenței 182H20 pentru a produce organizarea TSPY1-partial 182H20-gap-duplicare centromerică-duplicare TSPY1-182H20-centromere. Rezultatele fiber-FISH au demonstrat astfel că secvențele Y duplicate au fost reintroduse local într-o formă rearanjată, dar au dezvăluit, de asemenea, prezența unui segment care nu s-a hibridizat cu nicio sondă din regiunea TSPY1-centrumera.
Caracterizarea rearanjamentului structural purtat de cromozomul Y DFNY1
(A) Adâncimea relativă de citire (afectată/neafectată) în intervale de 10 kb mapate pe secvența de referință a cromozomului Y între 9,3 și 10,1 Mb. Observați lacunele de asamblare la fiecare capăt al acestei regiuni.
(B) Raportul CGH log2 (afectat/neafectat) pentru aceeași regiune.
(C) Fiber-FISH a celor trei clone BAC indicate la cromozomul Y neafectat, care arată că acesta poartă structura de referință în această regiune. Atât 334D2, cât și 108I14 detectează matrici în tandem mai mari decât dimensiunea clonei BAC.
(D) Fiber-FISH a acelorași clone BAC la cromozomul Y afectat. Acest cromozom poartă o inserție care întrerupe regiunea de hibridizare 182H20 și conține duplicații parțiale ale ambelor secvențe de hibridizare 334D2- și 108I14.
(E) Adâncimea absolută de citire a citirilor de pe cromozomul Y neafectat și afectat la 160.15-160,35 Mb din secvența de referință a cromozomului 1.
(F) Raportul CGH log2 (afectat/neafectat) pentru aceeași regiune a cromozomului 1.
(G) FISH în metafază a clonei BAC 179G5 a cromozomului 1 pe cromozomul Y neafectat (galben). Hibridizarea este observată doar la locația de referință de pe cromozomul 1.
(H) FISH în metafază a aceleiași sonde de cromozom 1 pe cromozomul Y afectat (galben). Hibridizarea este observată la un locus suplimentar de pe cromozomul Y.
(I) Fiber-FISH a celor două clone BAC Y indicate plus clonele cromozomului 1 574F21, 179G5 și 1365F20 la cromozomul Y neafectat. Nu se detectează niciun semnal al cromozomului 1 pe Y.
(J) Fiber-FISH a acelorași clone la cromozomul Y neafectat. Clonele cromozomului 1 detectează un semnal pe Y între semnalul parțial 182H20 și semnalul 108I14. Coordonatele genomului se referă la GRCh37/hg19.
Pentru a identifica aceste secvențe necunoscute, am efectuat PCR termică asimetrică intercalată (TAIL-PCR)12 pe segmentul care se extinde de la punctul de ruptură 182H20 în decalaj, utilizând primerii prezentați în tabelul S2. În amplificări consecutive, această procedură împerechează amorsele imbricate specifice secvenței cunoscute cu amorse degenerate care se așteaptă să amorseze în secvența flancată necunoscută. Produsele de joncțiune candidate sunt recunoscute deoarece diferențele de mărime ale acestora în reacțiile consecutive reflectă pozițiile amorselor cunoscute. Secvențele adiacente, confirmate cu primeri specifici punctului de rupere (tabelul S3 și figurile S2 și S3), au fost derivate din cromozomul 1 (160,16 Mb), iar examinarea adâncimii de citire, a profilelor CGH (figurile 2E și 2F) și a secvenței a sugerat implicarea unei regiuni contigue de ∼160 kb; o astfel de implicare a fost susținută de identificarea unei a doua joncțiuni mai complexe a cromozomului 1-Y la 160,32 Mb. Translocarea secvențelor cromozomului 1 în Y afectat a fost confirmată prin FISH în metafază (figurile 2G și 2H), iar localizarea acestora în cadrul decalajului din duplicarea Y a fost confirmată prin fiber-FISH (figurile 2I și 2J) cu BAC-urile RP11-574F21, RP11-179G5 și W12-1365F20 din cromozomul 1 ca sonde. Astfel, datele combinate au evidențiat o structură complexă de duplicare constând atât dintr-un fragment de cromozom 1, cât și din mai multe segmente de ADN Y (tabelul S4 și figurile S2 și S3). Niciunul dintre punctele de rupere secvențiate nu a prezentat lungimi extinse de omologie, dar toate au dezvăluit microhomologie, un model care indică FoSTeS (fork stalling and template switching), care este un mecanism care combină fragmente genomice disparate în timpul replicării.13
Structura duplicată observată aici nu a fost raportată în altă parte și trebuie să fi apărut în timpul uneia dintre cele doar patru meioze, care cuprinde meioza în care a apărut mutația DFNY1 însăși (Figura 1). Prin urmare, este probabil să fie cauzală. Secvențele duplicate ale cromozomului Y codifică doar o singură proteină cunoscută, TSPY1, dintr-o matrice tandem de ∼10 gene TSPY1, în timp ce secvențele cromozomului 1 poartă cinci gene RefSeq (CASQ1 , PEA15 , DCAF8 , PEX19 și COPA ) și capătul 5′ al unei alte gene, NCSTN (MIM 605254) (exonii 1-3; figura 3). Mecanismele prin care duplicarea ar putea duce la fenotipul surdității includ o creștere a numărului de copii ale genei, o expresie necorespunzătoare rezultată din ADN-ul flancat nou sau formarea unui produs alterat prin trunchiere, fuziune sau mutație punctiformă. Nu sunt disponibile date de expresie din familia DFNY1 și nu au fost găsite mutații nesinonime în genele RefSeq ale cromozomului 1 (tabelul S5). Numărul de copii TSPY1 este polimorfic în cadrul populației14 , iar un număr mai mare de copii TSPY1 a fost găsit fără să se raporteze surditate, inclusiv la indivizi 47,XYY; un studiu a asociat numărul mare de copii TSPY1 cu un fenotip diferit, infertilitatea.15 Numărul crescut de copii TSPY1 oferă astfel un candidat slab pentru surditate. În schimb, regiunea cromozomului 1 se află în întregime în interiorul unui interval de aproximativ 900 kb, DFNA49 (MIM %608372), asociat anterior cu pierderea auzului; mutația cauzală din acest interval rămâne necunoscută.16 Prin urmare, propunem că aceeași genă sau aceleași gene ar putea sta la baza atât a fenotipurilor DFNA49, cât și a DFNY1. Mecanismul cel mai parcimonios ar fi sensibilitatea la doză a uneia sau mai multora dintre aceste gene, astfel încât o expresie crescută rezultată din trei copii duce la pierderea auzului, deși nu sunt excluse alte mecanisme.
Structura și conținutul genetic al cromozomilor Y neafectați și afectați
(A) Structura cromozomului Y neafectat (VII-24 în figura 1). Gri și negru: erori și, respectiv, lacune, în ansamblul GRCH37. Albastru: regiunea care corespunde secvenței de referință la nivelul de rezoluție utilizat. Sunt prezentate mai jos o parte din matricea TSPY1 (vârfuri de săgeată albastre) și locația semnalelor clonei BAC identificate în figura 2.
(B) Structura cromozomului Y afectat (VIII-2 în figura 1). Acest cromozom conține un segment care nu se regăsește în cromozomul neafectat; acest segment este derivat din duplicări de secvențe atât din cromozomul 1 (galben), cât și din cromozomul Y (albastru). Din nou, conținutul genetic și semnalele BAC sunt prezentate mai jos. Capetele de săgeată de mai sus indică orientarea segmentelor duplicate în raport cu secvența de referință.
(C) Vedere detaliată a celor două joncțiuni ale cromozomului 1-Y studiate la nivel de secvență (figurile S2 și S3), care arată diferența dintre structura simplă a joncțiunii 1 și structura complexă a joncțiunii 2.
Am constatat că cauza tulburării mendeliene umane legate de Y a fost asociată cu inserția de secvențe ale cromozomului 1, mai degrabă decât cu mutația unei gene cromozomiale Y. Acest lucru este în concordanță cu observațiile conform cărora nici duplicarea (cariotipul 47,XYY), nici deleția (cariotipul 45,X) a întregului cromozom Y și, prin urmare, a tuturor genelor sale nu este asociată cu deficiența de auz, ceea ce implică faptul că este puțin probabil ca pierderea funcției sau duplicarea unei gene cromozomiale Y să stea la baza fenotipului DFNY1. Complexitatea rearanjamentului este, de asemenea, în concordanță cu raritatea sa: Deși surditatea pe linie masculină ar trebui să fie un fenotip ușor de recunoscut, din câte știm, a fost raportată doar o singură familie suplimentară cu un fenotip similar.17 Relația dintre cele două familii este necunoscută; cea de-a doua familie este, de asemenea, chineză, dar dintr-un grup etnic diferit (Tujia în loc de Han). Cu toate acestea, caracteristicile audiologice sunt similare și, pe baza cunoștințelor actuale, este imposibil de exclus o origine comună. În ciuda rarității acestei rearanjări specifice, considerăm totuși că achiziția de secvențe autosomale de către cromozomul Y este o parte standard a evoluției cromozomale Y, de obicei neutră și ocazional ajungând la fixare, deși în cazul DFNY1 este dezavantajoasă. Într-adevăr, este demn de remarcat faptul că cromozomul Y poartă o inserție fixă de ∼100 kb din regiunea cromozomială 1q43 în Yq proximal,18 aproape de inserția DFNY1. Această observație ridică întrebarea dacă apropierea în nucleu ar putea favoriza transferul de ADN între acești doi cromozomi.19 Mecanismul mutațional propus pentru DFNY1, FoSTeS, a fost asociat anterior numai cu rearanjamente intracromosomale,13 astfel încât studiul actual își extinde influența pentru a include rearanjamente intercromosomale; de asemenea, subliniază necesitatea unei mai bune înțelegeri a relației neglijate dintre variația numărului de copii și afectarea auzului.20
.