Main Text
Ludzki chromosom Y jest przekazywany bezpośrednio z ojca na syna przez większość swojej długości, generując specyficzny dla mężczyzn wzór dziedziczenia, który różni się od reszty genomu. Y-chromosomalne cechy fenotypowe powinny być zatem łatwo rozpoznawalne z ich męskiej linii dziedziczenia, a wczesne badania twierdziły, że zidentyfikować kilka takich cech, w tym godne uwagi przykłady, takie jak „owłosione uszy”. Jednakże, już w 1957 roku, krytyczna analiza tych twierdzeń nie znalazła potwierdzenia dla żadnej z 17 rozpatrywanych cech,1 co zostało wzmocnione przez późniejszą analizę molekularno-genetyczną samych „włochatych uszu”.2 Ten być może zaskakujący brak cech chromosomalnych Y może być rozumiany przynajmniej częściowo jako konsekwencja dwóch czynników. Po pierwsze, kiedy w 2003 roku wygenerowano sekwencję referencyjną dla męskiego regionu ludzkiego chromosomu Y,3 okazało się, że chromosom ten zawiera niewiele genów specyficznych dla mężczyzn i koduje tylko 23 różne białka. Późniejsze prace wykazały, że trzy z nich są nieobecne u około 2% mężczyzn z Azji Południowej, których chromosomy Y kodują zatem tylko 20 białek specyficznych dla mężczyzn.4 Po drugie, chromosom Y ma wyspecjalizowane funkcje w męskiej determinacji płci i płodności, w których jest mało prawdopodobne, aby zmienność mendlowska była dziedziczna. Dlatego na początku 2004 roku można było napisać, że „analiza rodowodów nie ujawniła jeszcze pojedynczego genu sprzężonego z chromosomem Y „5 . Jednak jeszcze w tym samym roku w chińskiej rodzinie6 odnotowano zaburzenie słuchu sprzężone z chromosomem Y (DFNY1, MIM 400043), które pozostaje jedynym udokumentowanym zaburzeniem mendlowskim wykazującym sprzężenie z chromosomem Y u ludzi. Jego podstawa wydaje się więc prawdopodobnie niezwykła i jest przedmiotem dużego zainteresowania. Tutaj badamy to podłoże poprzez badanie sekwencji chromosomu Y DFNY1 i porównanie go z chromosomem Y blisko spokrewnionej, ale nie dotkniętej chorobą gałęzi rodziny.
W siedmiopokoleniowym rodowodzie DFNY1 opisanym w 2004 roku, wszyscy dorośli mężczyźni byli dotknięci chorobą.6 Następnie rodowód został prześledzony o dwa pokolenia wstecz i zidentyfikowano dodatkowych potomków linii męskiej wcześniejszego przodka.7 Co uderzające, ich słuch nie był dotknięty chorobą (rysunek 1). Wcześniej wykazaliśmy identyczność chromosomów Y z dwóch gałęzi rodziny w 67 loci Y-STR, a zatem uznaliśmy, że różnica fenotypowa między gałęziami musi być związana z wariantem genetycznym przenoszonym konkretnie przez chromosom Y dotkniętej gałęzi. Posortowaliśmy reprezentatywny chromosom Y z każdej gałęzi za pomocą cytometrii przepływowej, a następnie sekwencjonowaliśmy go. Zidentyfikowano tylko cztery różnice bazowo-substytucjonalne między chromosomami.8 Trzy z nich powstały na gałęzi nie dotkniętej chorobą. Czwarta powstała na dotkniętej gałęzi i segregowała z fenotypem, ale stanowiła słabego kandydata na mutację przyczynową, ponieważ leżała poza jakimkolwiek opisanym genem. Chociaż ta analiza nie mogła ocenić powtarzających się regionów chromosomu, znane powtarzające się geny są zaangażowane głównie w spermatogenezę,3,9 więc w obecnym badaniu zbadaliśmy możliwość, że mutacja przyczynowa może nie być mutacją punktową. Badanie to zostało zatwierdzone przez dawców próbek, którzy dostarczyli pisemną świadomą zgodę, oraz przez Komitet Etyki Medycznej Chińskiego Szpitala Ogólnego PLA, Pekin, Chiny.
Rodowód DFNY1
Mężczyźni – kwadraty; kobiety – koła; linia ukośna – zmarły. Wypełnione symbole oznaczają upośledzenie słuchu (w tym z dokumentów rodzinnych); znaki zapytania wskazują dwa osobniki, których fenotyp słuchu jest nieznany; a gwiazdki wskazują osobników, którzy znajdują się w dotkniętej gałęzi, ale byli poniżej wieku wystąpienia objawów w czasie badania. Strzałki wskazują dwóch osobników, których chromosomy Y zostały zsekwencjonowane. Strukturalna rearanżacja wystąpiła podczas jednej z czterech mejoz oznaczonych czerwonymi gwiazdami. Małżonkowie są pominięci w pokoleniach VII-IX i w pokoleniu VI na gałęzi nie dotkniętej chorobą.
Zbadaliśmy względną głębokość odczytu wzdłuż chromosomu, wyrównując wysokiej jakości odczyty filtrowane przez duplikaty do sekwencji referencyjnej chrY za pomocą Sequence Search and Alignment by Hashing Algorithm 2 (SSAHA2)10 i porównując liczbę odczytów na 10 kb bin między chromosomami Y z dotkniętego osobnika VIII-2 (Figura 1) i niedotkniętego osobnika VII-24 (Figura 1). Ujawniło to trzy nieciągłe segmenty zduplikowane w dotkniętym chromosomie, a wszystkie pochodziły z ograniczonego regionu między klasterem genu TSPY1 (MIM 480100) kończącym się na ∼ 9,3 Mb i przerwą centromerową na ∼ 10,1 Mb (Figura 2A). Te duplikacje zostały potwierdzone przez konwencjonalną oligonukleotydową porównawczą hybrydyzację genomową (CGH) z macierzą Agilent 1 milion pokrywającą cały genom i niestandardową macierzą NimbleGen 385K obejmującą pozycje chrY: 2,000,000-10,715,000 (1,990,000-10,105,000 hg19) w wysokiej rozdzielczości (∼20 bp) (Figura 2B). Ponieważ obejmowały one część klastra genów TSPY1, zweryfikowaliśmy wzrost liczby genów TSPY1 za pomocą qPCR (Tabela S1 w danych uzupełniających dostępnych online) i elektroforezy żelu z polem pulsacyjnym (PFGE; Figura S1). Analizy te wykazały, że duplikacja była wspólna dla wszystkich dotkniętych chorobą członków rodziny poddanych badaniu i była nieobecna u wszystkich niedotkniętych chorobą członków, a także, że duplikacja leżała w oddzielnym fragmencie restrykcyjnym od oryginalnego klastra TSPY1, a zatem nie była kontinuum. Chociaż połączone dowody potwierdziły złożoną duplikację regionu 9,3-10,1 Mb, nie dostarczyły informacji o tym, gdzie zduplikowane sekwencje zostały wstawione. Metafazowa fluorescencyjna hybrydyzacja in situ (FISH) z sondą TSPY1 wykazała pojedynczy sygnał (nie pokazano), więc użyliśmy fiber-FISH, jak opisano wcześniej11, aby uzyskać wyższą rozdzielczość. Sondami chromosomalnymi Y były klony BAC obejmujące większość ∼9,3-10,1 Mb sekwencji referencyjnej: RP11-334D2 (w tym TSPY1), RP11-182H20, RP11-155J5, RP11-160K17 i RP11-108I14 (w tym sekwencje centromeryczne). Wyniki (Rysunek 2C) wykazały, że chromosom nieuszkodzony był zorganizowany w taki sam sposób jak sekwencja referencyjna, co można podsumować jako TSPY1-182H20-centromer. Z kolei chromosom dotknięty chorobą (Rysunek 2D) został przerwany w obrębie sekwencji 182H20, tworząc organizację TSPY1-partial 182H20-gap-centromeric duplication-TSPY1 duplication-182H20-centromere. Wyniki fiber-FISH wykazały zatem, że zduplikowane sekwencje Y zostały ponownie wprowadzone lokalnie w zmienionej formie, ale ujawniły również obecność segmentu, który nie hybrydyzował do żadnej sondy z regionu TSPY1-centromerowego.
Charakterystyka rearanżacji strukturalnej przenoszonej przez chromosom Y DFNY1
(A) Względna głębokość odczytu (dotknięta/niedotknięta) w 10 kb binach zmapowanych do sekwencji referencyjnej chromosomu Y pomiędzy 9,3 a 10,1 Mb. Należy zwrócić uwagę na luki montażowe na każdym końcu tego regionu.
(B) Stosunek log2 CGH (dotknięty/niedotknięty) dla tego samego regionu.
(C) Fiber-FISH trzech klonów BAC wskazanych do niedotkniętego chromosomu Y, pokazując, że przenosi on strukturę referencyjną w tym regionie. Zarówno 334D2 jak i 108I14 wykrywają tandemowe tablice większe niż rozmiar klonu BAC.
(D) Fiber-FISH tych samych klonów BAC do chromosomu Y dotkniętego chorobą. Chromosom ten zawiera insercję, która przerywa region hybrydyzujący 182H20 i zawiera częściowe duplikacje sekwencji hybrydyzujących 334D2- i 108I14.
(E) Bezwzględna głębokość odczytu odczytów z chromosomu Y nie dotkniętego i dotkniętego do regionu 160.15-160.35 Mb sekwencji referencyjnej chromosomu 1.
(F) Stosunek log2 CGH (dotknięty/niedotknięty) dla tego samego regionu chromosomu 1.
(G) Metafazowe FISH klonu 179G5 BAC chromosomu 1 na niedotkniętym chromosomie Y (żółty). Hybrydyzacja jest widoczna tylko w miejscu referencyjnym na chromosomie 1.
(H) Metafazowe FISH tej samej sondy chromosomu 1 na chromosomie Y dotkniętym chorobą (żółty). Hybrydyzacja jest widoczna w dodatkowym locus na chromosomie Y.
(I) Fiber-FISH dwóch wskazanych klonów Y BAC oraz klonów chromosomu 1 574F21, 179G5 i 1365F20 na nieuszkodzonym chromosomie Y. Żaden sygnał chromosomu 1 nie jest wykrywany na chromosomie Y.
(J) Fiber-FISH tych samych klonów do nieuszkodzonego chromosomu Y. Klony chromosomu 1 wykrywają sygnał na chromosomie Y pomiędzy częściowym sygnałem 182H20 a sygnałem 108I14. Współrzędne genomu odnoszą się do GRCh37/hg19.
W celu identyfikacji tych nieznanych sekwencji przeprowadziliśmy termiczną asymetryczną PCR z przeplotem (TAIL-PCR)12 na segmencie rozciągającym się od punktu przerwania 182H20 do luki, stosując startery przedstawione w Tabeli S2. W kolejnych amplifikacjach, procedura ta łączy zagnieżdżone startery specyficzne dla znanej sekwencji ze zdegenerowanymi starterami, które mają za zadanie prymować w nieznanej sekwencji flankującej. Kandydackie produkty łączenia są rozpoznawane, ponieważ ich różnice wielkości w kolejnych reakcjach odzwierciedlają znane pozycje starterów. Sąsiadujące sekwencje, potwierdzone przy użyciu starterów specyficznych dla punktów przerwania (Tabela S3 i Rysunki S2 i S3), pochodziły z chromosomu 1 (160,16 Mb), a badanie głębokości odczytu, profili CGH (Rysunki 2E i 2F) i sekwencji sugerowało zaangażowanie przyległego regionu ∼160 kb; takie zaangażowanie zostało poparte identyfikacją drugiego, bardziej złożonego połączenia chromosom 1-Y w 160,32 Mb. Translokacja sekwencji chromosomu 1 do dotkniętego Y została potwierdzona przez metafazowe FISH (Figury 2G i 2H), a ich lokalizacja w obrębie luki w duplikacji Y została potwierdzona przez fiber-FISH (Figury 2I i 2J) z BACs RP11-574F21, RP11-179G5 i W12-1365F20 z chromosomu 1 jako sondami. Połączone dane ujawniły zatem złożoną strukturę duplikacji składającą się zarówno z fragmentu chromosomu 1, jak i wielu segmentów Y DNA (Tabela S4 i Rysunki S2 i S3). Żaden z sekwencjonowanych punktów przerwania nie wykazywał rozległych długości homologii, ale wszystkie ujawniły mikrohomologię, wzór wskazujący na FoSTeS (fork stalling and template switching), który jest mechanizmem łączącym różne fragmenty genomowe podczas replikacji.13
Zaobserwowana tutaj zduplikowana struktura nie została zgłoszona gdzie indziej i musiała powstać podczas jednej z zaledwie czterech mejoz, które obejmują mejozę, w której wystąpiła mutacja DFNY1 (Rysunek 1). Jest zatem prawdopodobne, że jest ona przyczynowa. Zduplikowane sekwencje chromosomalne Y kodują tylko jedno znane białko, TSPY1, z tandemowej tablicy ∼10 genów TSPY1, podczas gdy sekwencje chromosomu 1 przenoszą pięć genów RefSeq (CASQ1 , PEA15 , DCAF8 , PEX19 , i COPA ) i 5′ koniec innego genu, NCSTN (MIM 605254) (eksony 1-3; Figura 3). Mechanizmy, dzięki którym duplikacja może prowadzić do fenotypu głuchoty, obejmują wzrost liczby kopii genu, niewłaściwą ekspresję wynikającą z nowego flankującego DNA lub tworzenie zmienionego produktu poprzez trunkcję, fuzję lub mutację punktową. Nie są dostępne dane dotyczące ekspresji w rodzinie DFNY1, a w genach RefSeq chromosomu 1 nie znaleziono mutacji nonsynonimicznych (Tabela S5). Liczba kopii TSPY1 jest polimorficzna w populacji,14 a większa liczba kopii TSPY1 została znaleziona bez zgłoszonej głuchoty, w tym u osób 47,XYY; jedno badanie powiązało wysoką liczbę kopii TSPY1 z innym fenotypem, niepłodnością.15 Zwiększona liczba kopii TSPY1 stanowi zatem słabego kandydata do głuchoty. W przeciwieństwie do tego, region chromosomu 1 leży całkowicie w obrębie około 900 kb interwału DFNA49 (MIM %608372), wcześniej związanego z utratą słuchu; mutacja przyczynowa w tym interwale pozostaje nieznana.16 Proponujemy zatem, że ten sam gen lub geny mogą leżeć u podstaw zarówno fenotypu DFNA49, jak i DFNY1. Najbardziej prawdopodobnym mechanizmem byłaby wrażliwość na dawkę jednego lub więcej z tych genów, tak że zwiększona ekspresja wynikająca z trzech kopii prowadzi do utraty słuchu, chociaż inne mechanizmy nie są wykluczone.
Structure and Gene Content of the Unaffected and Affected Y Chromosomes
(A) Struktura nieuszkodzonego (VII-24 na rycinie 1) chromosomu Y. Szary i czarny: odpowiednio błędy i luki w asocjacji GRCH37. Niebieski: region pasujący do sekwencji referencyjnej na zastosowanym poziomie rozdzielczości. Poniżej pokazano część tablicy TSPY1 (niebieskie groty strzałek) oraz lokalizację sygnałów klonów BAC zidentyfikowanych na Rysunku 2.
(B) Struktura zaatakowanego (VIII-2 na Rysunku 1) chromosomu Y. Chromosom ten zawiera segment, którego nie ma w chromosomie niezakażonym; segment ten pochodzi z duplikacji sekwencji zarówno z chromosomu 1 (żółty), jak i chromosomu Y (niebieski). Ponownie, zawartość genów i sygnały BAC są pokazane poniżej. Groty strzałek powyżej wskazują orientację zduplikowanych segmentów w stosunku do sekwencji referencyjnej.
(C) Szczegółowy widok dwóch węzłów chromosomu 1Y badanych na poziomie sekwencji (Figury S2 i S3), pokazujący różnicę między prostą strukturą węzła 1 i złożoną strukturą węzła 2.
Stwierdziliśmy, że przyczyna ludzkiego zaburzenia mendlowskiego związanego z chromosomem Y była związana raczej z insercją sekwencji chromosomu 1 niż mutacją genu chromosomu Y. Jest to zgodne z obserwacjami, że ani duplikacja (kariotyp 47,XYY), ani delecja (kariotyp 45,X) całego chromosomu Y, a zatem wszystkich jego genów, jest związana z upośledzeniem słuchu, sugerując, że utrata funkcji lub duplikacja genu chromosomu Y jest mało prawdopodobna, aby leżeć u podstaw fenotypu DFNY1. Złożoność rearanżacji jest również zgodna z jej rzadkością: Chociaż głuchota linii męskiej powinna być łatwo rozpoznawalnym fenotypem, według naszej wiedzy zgłoszono tylko jedną dodatkową rodzinę z podobnym fenotypem.17 Związek między tymi dwiema rodzinami jest nieznany; druga rodzina jest również chińska, ale z innej grupy etnicznej (Tujia zamiast Han). Jednak cechy audiologiczne są podobne i na podstawie obecnej wiedzy nie można wykluczyć wspólnego pochodzenia. Pomimo rzadkości tej specyficznej rearanżacji, mimo wszystko postrzegamy nabywanie sekwencji autosomalnych przez chromosom Y jako standardową część ewolucji chromosomu Y, zwykle neutralną, a czasami osiągającą fiksację, chociaż w przypadku DFNY1 jest to niekorzystne. Istotnie, warto zauważyć, że chromosom Y zawiera stałą insercję ∼ 100 kb z regionu chromosomalnego 1q43 w proksymalnym Yq,18 blisko insercji DFNY1. Obserwacja ta nasuwa pytanie, czy bliskość w jądrze może sprzyjać transferowi DNA pomiędzy tymi dwoma chromosomami.19 Proponowany mechanizm mutacji DFNY1, FoSTeS, był wcześniej związany tylko z rearanżacjami wewnątrzchromosomalnymi,13 więc obecne badanie rozszerza jego wpływ na rearanżacje międzychromosomalne; podkreśla ono również potrzebę lepszego zrozumienia zaniedbanego związku między zmianami liczby kopii a upośledzeniem słuchu.20
.