Testo principale
Il cromosoma Y umano viene trasmesso direttamente dal padre al figlio per la maggior parte della sua lunghezza, generando un modello di eredità specifico per il maschio che è distinto dal resto del genoma. I tratti fenotipici del cromosoma Y dovrebbero quindi essere facilmente riconoscibili dalla loro eredità maschile, e i primi studi hanno affermato di identificare diversi tratti di questo tipo, compresi esempi notevoli come le “orecchie pelose”. Tuttavia, già nel 1957, l’esame critico di queste affermazioni non riuscì a trovare supporto per nessuno dei 17 tratti in esame,1 una constatazione rafforzata dalla successiva analisi genetico-molecolare delle “orecchie pelose” stesse.2 Questa forse sorprendente mancanza di tratti cromosomici Y può essere compresa almeno in parte come conseguenza di due fattori. In primo luogo, quando nel 2003 è stata generata una sequenza di riferimento per la regione maschio-specifica del cromosoma Y umano,3 si è scoperto che il cromosoma porta pochi geni maschi-specifici e codifica solo per 23 proteine distinte. Un lavoro successivo ha scoperto che tre di questi sono assenti in circa il 2% degli uomini dell’Asia meridionale, i cui cromosomi Y codificano quindi solo 20 proteine specifiche per i maschi.4 In secondo luogo, il cromosoma Y ha funzioni specializzate nella determinazione del sesso maschile e nella fertilità, in cui la variazione mendeliana sarebbe difficilmente ereditabile. Così, all’inizio del 2004 era possibile scrivere “l’analisi dei pedigree non ha ancora rivelato un singolo gene legato al cromosoma Y. “5 Più tardi, però, quell’anno, è stato riportato il problema dell’udito legato al cromosoma Y (DFNY1, MIM 400043) in una famiglia cinese6 e rimane l’unico disordine mendeliano documentato che mostra il legame con il cromosoma Y negli esseri umani. La sua base sembra quindi probabile essere insolito ed è di notevole interesse. Qui, indaghiamo questa base esaminando la sequenza del cromosoma Y DFNY1 e confrontandolo con il cromosoma Y di un ramo della famiglia strettamente correlato ma non affetto.
Nel pedigree DFNY1 di sette generazioni riportato nel 2004, tutti i maschi adulti erano affetti.6 Successivamente, il pedigree è stato tracciato indietro di altre due generazioni, e ulteriori discendenti della linea maschile di un antenato precedente sono stati identificati.7 Sorprendentemente, il loro udito non era affetto (Figura 1). Avevamo precedentemente dimostrato l’identità dei cromosomi Y dei due rami della famiglia a 67 loci Y-STR, e quindi abbiamo ragionato che la differenza fenotipica tra i rami deve essere associata a una variante genetica portata specificamente dal cromosoma Y del ramo affetto. Abbiamo selezionato un cromosoma Y rappresentativo di ogni ramo tramite citometria a flusso e poi lo abbiamo sequenziato. Sono state identificate solo quattro differenze base-sostitutive tra i cromosomi.8 Tre di queste sono sorte sul ramo non affetto. La quarta era sorta sul ramo affetto e segregato con il fenotipo, ma ha fornito un candidato povero per la mutazione causale perché si trovava al di fuori di qualsiasi gene annotato. Anche se questa analisi non poteva valutare le regioni ripetute del cromosoma, i geni ripetuti noti sono coinvolti principalmente nella spermatogenesi,3,9 così nello studio attuale abbiamo esplorato la possibilità che la mutazione causale potrebbe non essere una mutazione puntiforme. Questo studio è stato approvato dai donatori del campione, che hanno fornito il consenso informato scritto, e dal Comitato di etica medica del Chinese PLA General Hospital, Pechino, Cina.
Il pedigree DFNY1
Maschi, quadrati; femmine, cerchi; linea diagonale, defunti. I simboli riempiti indicano un danno all’udito (anche dai registri familiari); i punti interrogativi indicano due individui il cui fenotipo uditivo è sconosciuto; e gli asterischi indicano individui che si trovano sul ramo affetto ma che erano al di sotto dell’età di insorgenza dei sintomi al momento dell’esame. Le frecce indicano i due individui i cui cromosomi Y sono stati sequenziati. Il riarrangiamento strutturale si è verificato durante una delle quattro meiosi contrassegnate da stelle rosse. I coniugi sono omessi nelle generazioni VII-IX e nella generazione VI sul ramo non affetto.
Abbiamo esaminato la profondità relativa letto lungo il cromosoma allineando alta qualità duplicato-filtrato legge alla sequenza di riferimento chrY utilizzando Sequence Search and Alignment by Hashing Algorithm 2 (SSAHA2) 10 e confrontando il numero di legge per 10 kb bin tra cromosomi Y dal VIII-2 individuo affetti (Figura 1) e l’individuo non affetti VII-24 (Figura 1). Questo ha rivelato tre segmenti discontinui duplicati nel cromosoma affetto, e tutti sono derivati dalla regione limitata tra il cluster del gene TSPY1 (MIM 480100) che termina a ∼9,3 Mb e il gap centromerico a ∼10,1 Mb (Figura 2A). Queste duplicazioni sono state confermate dall’ibridazione genomica comparativa (CGH) convenzionale con un array Agilent da 1 milione che copre l’intero genoma e un array personalizzato NimbleGen 385K che copre le posizioni chrY: 2.000.000-10.715.000 (1.990.000-10.105.000 hg19) ad alta risoluzione (∼20 bp) (Figura 2B). Poiché includevano parte del cluster di geni TSPY1, abbiamo verificato un aumento del numero di geni TSPY1 mediante qPCR (Tabella S1 nei dati supplementari disponibili online) ed elettroforesi in gel a campo pulsato (PFGE; Figura S1). Queste analisi hanno mostrato che la duplicazione era condivisa da tutti i membri della famiglia affetti testati ed era assente da tutti i membri non affetti e anche che la duplicazione si trovava in un frammento di restrizione separato dal cluster originale TSPY1 ed era quindi non contiguo. Anche se l’evidenza combinata ha confermato una duplicazione complessa della regione di 9,3-10,1 Mb, non ha fornito informazioni su dove le sequenze duplicate sono state inserite. L’ibridazione in situ a fluorescenza in metafase (FISH) con una sonda TSPY1 ha mostrato un singolo segnale (non mostrato), quindi abbiamo usato la fibra-FISH come descritto in precedenza11 per una maggiore risoluzione. Le sonde del cromosoma Y erano cloni BAC che coprivano la maggior parte di ∼9.3-10.1 Mb della sequenza di riferimento: RP11-334D2 (compreso TSPY1), RP11-182H20, RP11-155J5, RP11-160K17, e RP11-108I14 (comprese le sequenze centromeriche). I risultati (Figura 2C) hanno mostrato che il cromosoma non affetto era organizzato nello stesso modo della sequenza di riferimento, che può essere riassunto come TSPY1-182H20-centromero. Al contrario, il cromosoma affetto (Figura 2D) è stato interrotto all’interno della sequenza 182H20 per produrre l’organizzazione TSPY1-parziale 182H20-gap-centromero duplicazione-TSPY1 duplicazione-182H20-centromero. I risultati del fiber-FISH hanno quindi dimostrato che le sequenze Y duplicate sono state reinserite localmente in una forma riarrangiata, ma hanno anche rivelato la presenza di un segmento che non si è ibridato a nessuna sonda della regione TSPY1-centromero.
Caratterizzazione del riarrangiamento strutturale trasportato dal cromosoma Y DFNY1
(A) Profondità relativa di lettura (affetti/non affetti) in bins da 10 kb mappati sulla sequenza di riferimento del cromosoma Y tra 9,3 e 10,1 Mb. Notare le lacune di assemblaggio ad ogni estremità di questa regione.
(B) CGH log2 ratio (affetto/non affetto) per la stessa regione.
(C) Fiber-FISH dei tre cloni BAC indicati al cromosoma Y non affetto, mostrando che esso porta la struttura di riferimento in questa regione. Sia 334D2 che 108I14 rilevano array di tandem più grandi della dimensione del clone BAC.
(D) Fiber-FISH degli stessi cloni BAC al cromosoma Y affetto. Questo cromosoma porta un’inserzione che interrompe la regione 182H20-ibridazione e contiene duplicazioni parziali di entrambe le sequenze 334D2- e 108I14-ibridazione.
(E) Profondità assoluta di lettura del cromosoma Y non affetta e affetta legge al 160.15-160.35 Mb della sequenza di riferimento del cromosoma 1.
(F) CGH log2 ratio (affected/unaffected) per la stessa regione del cromosoma 1.
(G) FISH in metafase del cromosoma 1 clone BAC 179G5 sul cromosoma Y non affetto (giallo). L’ibridazione si vede solo nella posizione di riferimento sul cromosoma 1.
(H) FISH in metafase della stessa sonda del cromosoma 1 sul cromosoma Y affetto (giallo). L’ibridazione è vista in un ulteriore locus sul cromosoma Y.
(I) Fiber-FISH dei due cloni Y BAC indicati più i cloni del cromosoma 1 574F21, 179G5 e 1365F20 al cromosoma Y non affetto. Nessun segnale del cromosoma 1 viene rilevato sul Y.
(J) Fiber-FISH degli stessi cloni al cromosoma Y non affetto. I cloni del cromosoma 1 rilevano un segnale sull’Y tra il segnale parziale 182H20 e il segnale 108I14. Le coordinate del genoma si riferiscono a GRCh37/hg19.
Al fine di identificare queste sequenze sconosciute, abbiamo eseguito la PCR termica asimmetrica interlacciata (TAIL-PCR)12 sul segmento che si estende dal breakpoint 182H20 nel gap utilizzando i primer riportati nella tabella S2. In amplificazioni consecutive, questa procedura coppie nidificati primer specifici per la sequenza nota con primer degenerati previsto per innescare nella sequenza sconosciuto fiancheggiatore. I prodotti di giunzione candidati sono riconosciuti perché le loro differenze di dimensione nelle reazioni consecutive riflettono le posizioni note del primer. Le sequenze adiacenti, confermate con primer specifici per il breakpoint (Tabella S3 e Figure S2 e S3), sono derivate dal cromosoma 1 (160,16 Mb), e l’esame della profondità di lettura, dei profili CGH (Figure 2E e 2F) e della sequenza ha suggerito il coinvolgimento di una regione contigua di ∼160 kb; tale coinvolgimento è stato supportato dall’identificazione di una seconda giunzione cromosoma 1-Y più complessa a 160,32 Mb. La traslocazione delle sequenze del cromosoma 1 alla Y interessata è stata confermata da FISH in metafase (Figure 2G e 2H), e la loro posizione all’interno della lacuna nella duplicazione Y è stata confermata da fiber-FISH (Figure 2I e 2J) con i BAC RP11-574F21, RP11-179G5, e W12-1365F20 dal cromosoma 1 come sonde. I dati combinati hanno quindi rivelato una complessa struttura di duplicazione costituita sia da un frammento del cromosoma 1 che da segmenti multipli del DNA Y (tabella S4 e figure S2 e S3). Nessuno dei punti di rottura sequenziati ha mostrato lunghezze estese di omologia, ma tutti hanno rivelato microomologia, un modello indicativo di FoSTeS (fork stalling and template switching), che è un meccanismo che combina frammenti genomici disparati durante la replicazione.13
La struttura duplicata osservata qui non è stata riportata altrove e deve essere sorta durante una delle sole quattro meiosi, che comprendono la meiosi in cui la mutazione DFNY1 stesso si è verificato (Figura 1). È quindi probabile che sia causale. Le sequenze duplicate del cromosoma Y codificano per una sola proteina nota, TSPY1, da un array tandem di ∼10 geni TSPY1, mentre le sequenze del cromosoma 1 portano cinque geni RefSeq (CASQ1 , PEA15 , DCAF8 , PEX19 , e COPA ) e l’estremità 5′ di un altro gene, NCSTN (MIM 605254) (esoni 1-3; Figura 3). Meccanismi con cui la duplicazione potrebbe portare al fenotipo sordità includono un aumento del numero di copie del gene, espressione inappropriata derivante dal nuovo DNA fiancheggiatore, o la formazione di un prodotto alterato attraverso troncamento, fusione, o mutazione puntiforme. Non sono disponibili dati di espressione della famiglia DFNY1, e non sono state trovate mutazioni non sinonime nei geni RefSeq del cromosoma 1 (Tabella S5). Il numero di copie di TSPY1 è polimorfo all’interno della popolazione,14 e un numero maggiore di copie di TSPY1 è stato trovato senza sordità riportata, anche in individui 47,XYY; uno studio ha associato un alto numero di copie di TSPY1 con un fenotipo diverso, l’infertilità.15 L’aumento del numero di copie di TSPY1 fornisce quindi un cattivo candidato per la sordità. Al contrario, la regione del cromosoma 1 si trova interamente all’interno di un intervallo di circa 900 kb, DFNA49 (MIM %608372), precedentemente associato alla perdita dell’udito; la mutazione causale in questo intervallo rimane sconosciuta.16 Proponiamo quindi che lo stesso gene o gli stessi geni possano essere alla base dei fenotipi DFNA49 e DFNY1. Il meccanismo più parsimonioso sarebbe la sensibilità al dosaggio di uno o più di questi geni, in modo tale che l’aumento di espressione risultante da tre copie porta alla perdita dell’udito, anche se altri meccanismi non sono esclusi.
Struttura e contenuto genico dei cromosomi Y non affetti e affetti
(A) La struttura del cromosoma Y non affetto (VII-24 nella Figura 1). Grigio e nero: errori e lacune, rispettivamente, nell’assemblaggio GRCH37. Blu: regione corrispondente alla sequenza di riferimento al livello di risoluzione utilizzato. In basso sono mostrati parte dell’array TSPY1 (punte di freccia blu) e la posizione dei segnali del clone BAC identificati nella Figura 2.
(B) Struttura del cromosoma Y interessato (VIII-2 nella Figura 1). Questo cromosoma contiene un segmento che non si trova nel cromosoma non affetto; questo segmento deriva da duplicazioni di sequenze sia dal cromosoma 1 (giallo) che dal cromosoma Y (blu). Di nuovo, il contenuto del gene e i segnali BAC sono mostrati sotto. Le frecce in alto indicano l’orientamento dei segmenti duplicati rispetto alla sequenza di riferimento.
(C) Vista dettagliata delle due giunzioni cromosoma 1-Y studiate a livello di sequenza (Figure S2 e S3), mostrando la differenza tra la struttura semplice della giunzione 1 e la struttura complessa della giunzione 2.
Abbiamo trovato che la causa del disordine mendeliano legato all’Y umano era associato all’inserimento di sequenze del cromosoma 1 piuttosto che alla mutazione di un gene del cromosoma Y. Questo è coerente con le osservazioni che né la duplicazione (cariotipo 47,XYY) né la delezione (cariotipo 45,X) dell’intero cromosoma Y e quindi di tutti i suoi geni è associata a problemi di udito, implicando che la perdita di funzione o la duplicazione di un gene Y-cromosomico è improbabile alla base del fenotipo DFNY1. La complessità del riarrangiamento è anche coerente con la sua rarità: Anche se la sordità maschile dovrebbe essere un fenotipo facilmente riconoscibile, a nostra conoscenza è stata riportata solo un’altra famiglia con un fenotipo simile.17 La relazione tra le due famiglie è sconosciuta; anche la seconda famiglia è cinese, ma di un gruppo etnico diverso (Tujia invece di Han). Tuttavia, le caratteristiche audiologiche sono simili, e sulla base delle conoscenze attuali è impossibile escludere un’origine comune. Nonostante la rarità di questo specifico riarrangiamento, consideriamo comunque l’acquisizione di sequenze autosomiche da parte del cromosoma Y come una parte standard dell’evoluzione del cromosoma Y, solitamente neutra e occasionalmente che raggiunge la fissazione, anche se nel caso DFNY1 è svantaggiosa. Infatti, è degno di nota che il cromosoma Y porta un’inserzione fissa di ∼100 kb dalla regione cromosomica 1q43 in Yq prossimale,18 vicino all’inserzione DFNY1. Questa osservazione solleva la questione se la vicinanza nel nucleo possa favorire il trasferimento di DNA tra questi due cromosomi.19 Il meccanismo mutazionale proposto per DFNY1, FoSTeS, è stato precedentemente associato solo a riarrangiamenti intracromosomici,13 quindi lo studio attuale espande la sua influenza per includere i riarrangiamenti intercromosomici; inoltre evidenzia la necessità di una migliore comprensione della relazione trascurata tra variazione del numero di copie e problemi di udito.20