Hlavní text
Lidský chromozom Y se po většině své délky přenáší přímo z otce na syna, což vytváří specifický vzor dědičnosti pro muže, který se liší od zbytku genomu. Fenotypové znaky chromozomu Y by tedy měly být snadno rozpoznatelné na základě jejich dědičnosti po mužské linii a první studie tvrdily, že identifikovaly několik takových znaků, včetně pozoruhodných příkladů, jako jsou „chlupaté uši“. Již v roce 1957 se však při kritickém zkoumání těchto tvrzení nepodařilo nalézt podporu pro žádný ze 17 uvažovaných znaků1 , což bylo umocněno pozdější molekulárně-genetickou analýzou samotných „chlupatých uší“.2 Tento možná překvapivý nedostatek Y-chromozomálních znaků lze přinejmenším částečně chápat jako důsledek dvou faktorů. Za prvé, když byla v roce 2003 vytvořena referenční sekvence pro mužsky specifickou oblast lidského chromozomu Y,3 ukázalo se, že chromozom nese jen málo mužsky specifických genů a kóduje pouze 23 různých proteinů. Následná práce zjistila, že tři z nich chybějí asi u 2 % jihoasijských mužů, jejichž chromozom Y tak kóduje pouze 20 proteinů specifických pro muže.4 Za druhé, chromozom Y má specializované funkce při určování mužského pohlaví a plodnosti, u nichž by mendelovská variabilita pravděpodobně nebyla dědičná. Proto bylo možné na začátku roku 2004 napsat, že „rodokmenová analýza zatím neodhalila jediný gen vázaný na chromozom Y“.5 Ještě téhož roku však byla v čínské rodině hlášena porucha sluchu vázaná na chromozom Y (DFNY1, MIM 400043),6 která zůstává jedinou zdokumentovanou mendelovskou poruchou vykazující vazbu na chromozom Y u lidí. Zdá se tedy, že její základ je pravděpodobně neobvyklý a je předmětem značného zájmu. Zde tento základ zkoumáme zkoumáním sekvence Y chromozomu DFNY1 a jeho porovnáním s Y chromozomem blízce příbuzné, ale nepostižené větve rodiny.
V sedmigeneračním rodokmenu DFNY1, který byl popsán v roce 2004, byli postiženi všichni dospělí muži.6 Následně byl rodokmen vysledován o dvě další generace zpět a byli identifikováni další potomci mužské linie dřívějšího předka.7 Je pozoruhodné, že jejich sluch nebyl postižen (obrázek 1). Již dříve jsme prokázali totožnost chromozomů Y obou větví rodiny na 67 Y-STR lokusech, a proto jsme usoudili, že fenotypový rozdíl mezi větvemi musí souviset s genetickou variantou nesenou právě chromozomem Y postižené větve. Vytřídili jsme reprezentativní chromozom Y z každé větve pomocí průtokové cytometrie a poté jsme jej sekvenovali. Mezi chromozomy byly identifikovány pouze čtyři bazické rozdíly.8 Tři z nich vznikly na nepostižené větvi. Čtvrtý vznikl na postižené větvi a segregoval s fenotypem, ale byl špatným kandidátem na příčinnou mutaci, protože ležel mimo jakýkoli anotovaný gen. Ačkoli tato analýza nemohla vyhodnotit opakované oblasti chromozomu, známé opakované geny se podílejí především na spermatogenezi,3,9 proto jsme v této studii zkoumali možnost, že kauzální mutace nemusí být bodovou mutací. Tato studie byla schválena dárci vzorků, kteří poskytli písemný informovaný souhlas, a Výborem pro lékařskou etiku Čínské všeobecné nemocnice PLA v Pekingu, Čína.
Rodokmen DFNY1
Samci – čtverce; samice – kolečka; diagonální čára – zemřelí. Vyplněné symboly označují postižení sluchu (i z rodinných záznamů); otazníky označují dva jedince, jejichž fenotyp sluchu není znám; hvězdičky označují jedince, kteří jsou na postižené větvi, ale v době vyšetření byli mladší než věk nástupu příznaků. Šipky označují dva jedince, jejichž chromozomy Y byly sekvenovány. Ke strukturní přestavbě došlo během jedné ze čtyř meióz označených červenými hvězdičkami. Manželé jsou vynecháni v generacích VII-IX a v generaci VI na nepostižené větvi.
Zkoumali jsme relativní hloubku čtení podél chromozomu zarovnáním vysoce kvalitních duplicitně filtrovaných čtení k referenční sekvenci chrY pomocí algoritmu Sequence Search and Alignment by Hashing Algorithm 2 (SSAHA2)10 a porovnáním počtu čtení na 10 kb bin mezi chromozomy Y od postiženého jedince VIII-2 (obr. 1) a nepostiženého jedince VII-24 (obr. 1). To odhalilo tři nespojité úseky duplikované v postiženém chromozomu a všechny pocházely z ohraničené oblasti mezi shlukem genů TSPY1 (MIM 480100) končícím na ∼9,3 Mb a centromerickou mezerou na ∼10,1 Mb (obrázek 2A). Tyto duplikace byly potvrzeny pomocí konvenční oligonukleotidové array komparativní genomické hybridizace (CGH) s 1 milionovou array Agilent pokrývající celý genom a vlastní array NimbleGen 385K pokrývající pozice chrY: 2 000 000-10 715 000 (1 990 000-10 105 000 hg19) s vysokým (∼20 bp) rozlišením (obr. 2B). Protože zahrnovaly část klastru genů TSPY1, ověřili jsme zvýšení počtu genů TSPY1 pomocí qPCR (tabulka S1 v doplňkových údajích dostupných online) a gelové elektroforézy s pulzním polem (PFGE; obrázek S1). Tyto analýzy ukázaly, že duplikace byla společná všem testovaným postiženým členům rodiny a chyběla u všech nepostižených členů a také že duplikace ležela v odděleném restrikčním fragmentu od původního klastru TSPY1, a nebyla tedy spojitá. Ačkoli kombinované důkazy potvrdily komplexní duplikaci oblasti 9,3-10,1 Mb, neposkytly žádné informace o tom, kam byly duplikované sekvence vloženy. Metafázová fluorescenční in situ hybridizace (FISH) se sondou TSPY1 ukázala jediný signál (není uvedeno), proto jsme pro vyšší rozlišení použili vláknovou FISH, jak bylo popsáno dříve11. Y-chromozomální sondy byly BAC klony pokrývající většinu ∼9,3-10,1 Mb referenční sekvence: RP11-334D2 (včetně TSPY1), RP11-182H20, RP11-155J5, RP11-160K17 a RP11-108I14 (včetně centromerických sekvencí). Výsledky (obr. 2C) ukázaly, že nepostižený chromozom byl uspořádán stejným způsobem jako referenční sekvence, což lze shrnout jako TSPY1-182H20-centromera. Naproti tomu postižený chromozom (Obrázek 2D) byl přerušen v rámci sekvence 182H20, čímž vznikla organizace TSPY1-částečná 182H20-gap-centromerická duplikace-TSPY1 duplikace-182H20-centromera. Výsledky fiber-FISH tedy prokázaly, že duplikované sekvence Y byly lokálně znovu vloženy v přeuspořádané podobě, ale také odhalily přítomnost úseku, který nehybridizoval s žádnou sondou z oblasti TSPY1-centromera.
Characterization of the Structural Rearrangement Carried by the DFNY1 Y Chromosome
(A) Relative read depth (affected/unaffected) in 10 kb bins mapped to the Y chromosome reference sequence between 9.3 and 10.1 Mb. Všimněte si mezer v sestavě na obou koncích této oblasti.
(B) Poměr log2 CGH (postižený/nepostižený) pro stejnou oblast.
(C) Fiber-FISH tří klonů BAC uvedených k nepostiženému chromozomu Y, který ukazuje, že v této oblasti nese referenční strukturu. Jak 334D2, tak 108I14 detekují tandemová pole větší, než je velikost klonu BAC.
(D) Fiber-FISH stejných klonů BAC k postiženému Y chromozomu. Tento chromozom nese inzert, který přerušuje 182H20-hybridizační oblast a obsahuje částečné duplikace 334D2- i 108I14-hybridizačních sekvencí.
(E) Absolutní hloubka čtení nepostiženého a postiženého Y chromozomu ke 160.15-160,35 Mb oblasti referenční sekvence chromozomu 1.
(F) Poměr CGH log2 (postižený/nepostižený) pro stejnou oblast chromozomu 1.
(G) Metafázová FISH chromozomu 1 BAC klonu 179G5 na nepostiženém chromozomu Y (žlutě). Hybridizace je patrná pouze v referenčním místě na chromozomu 1.
(H) Metafázová FISH stejné sondy chromozomu 1 na postiženém chromozomu Y (žlutá). Hybridizace je patrná na dalším místě na chromozomu Y.
(I) Fiber-FISH dvou uvedených klonů BAC Y plus klonů 574F21, 179G5 a 1365F20 chromozomu 1 na nepostiženém chromozomu Y. Na chromozomu Y není detekován žádný signál chromozomu 1.
(J) Fiber-FISH stejných klonů k nepostiženému chromozomu Y. U klonů na chromozomu 1 je detekován signál na Y mezi částečným signálem 182H20 a signálem 108I14. Souřadnice genomu se vztahují k GRCh37/hg19.
Pro identifikaci těchto neznámých sekvencí jsme provedli termální asymetrickou prokládanou PCR (TAIL-PCR)12 na úseku sahajícím od bodu zlomu 182H20 do mezery pomocí primerů uvedených v tabulce S2. Při tomto postupu se v po sobě jdoucích amplifikacích párují vnořené primery specifické pro známou sekvenci s degenerovanými primery, u nichž se očekává, že budou primovat v neznámé doprovodné sekvenci. Kandidátní produkty spojení jsou rozpoznány, protože jejich rozdíly ve velikosti v po sobě jdoucích reakcích odrážejí pozice známých primerů. Sousední sekvence, potvrzené pomocí primerů specifických pro bod zlomu (tabulka S3 a obrázky S2 a S3), pocházely z chromozomu 1 (160,16 Mb) a zkoumání hloubky čtení, profilů CGH (obrázky 2E a 2F) a sekvence naznačilo zapojení souvislé oblasti ∼160 kb; toto zapojení bylo podpořeno identifikací druhého složitějšího spoje chromozomu 1-Y na 160,32 Mb. Translokace sekvencí chromozomu 1 do postiženého Y byla potvrzena metafázovou metodou FISH (obrázky 2G a 2H) a jejich umístění v rámci mezery v duplikaci Y bylo potvrzeno metodou fiber-FISH (obrázky 2I a 2J) s BAC RP11-574F21, RP11-179G5 a W12-1365F20 z chromozomu 1 jako sondami. Kombinovaná data tak odhalila komplexní duplikační strukturu sestávající jak z fragmentu chromozomu 1, tak z více segmentů DNA Y (tabulka S4 a obrázky S2 a S3). Žádný ze sekvenovaných zlomových bodů nevykazoval rozsáhlou délku homologie, ale všechny odhalily mikrohomologii, což je vzorec svědčící o FoSTeS (fork stalling and template switching), což je mechanismus, který kombinuje nesourodé genomové fragmenty během replikace.13
Duplikační struktura zde pozorovaná nebyla nikde jinde popsána a musela vzniknout během jedné z pouhých čtyř meióz, které zahrnují meiózu, v níž došlo k samotné mutaci DFNY1 (obr. 1). Je proto pravděpodobné, že je kauzální. Duplikované sekvence chromozomu Y kódují pouze jeden známý protein, TSPY1, z tandemové řady ∼10 genů TSPY1, zatímco sekvence chromozomu 1 nesou pět genů RefSeq (CASQ1 , PEA15 , DCAF8 , PEX19 a COPA ) a 5′ konec dalšího genu, NCSTN (MIM 605254) (exony 1-3; obrázek 3). Mechanismy, kterými by duplikace mohla vést k fenotypu hluchoty, zahrnují zvýšení počtu kopií genu, nevhodnou expresi v důsledku nové doprovodné DNA nebo vytvoření změněného produktu zkrácením, fúzí nebo bodovou mutací. Z rodiny DFNY1 nejsou k dispozici žádné údaje o expresi a v genech RefSeq chromozomu 1 nebyly nalezeny žádné nesynonymní mutace (tabulka S5). Počet kopií TSPY1 je v populaci polymorfní14 a větší počet kopií TSPY1 byl nalezen bez hlášené hluchoty, včetně jedinců 47,XYY; jedna studie spojovala vysoký počet kopií TSPY1 s jiným fenotypem, neplodností.15 Zvýšený počet kopií TSPY1 tak představuje slabého kandidáta na hluchotu. Naproti tomu oblast chromozomu 1 leží celá uvnitř přibližně 900 kb intervalu DFNA49 (MIM %608372), který byl dříve spojován se ztrátou sluchu; kauzální mutace v tomto intervalu zůstává neznámá.16 Navrhujeme proto, že stejný gen nebo geny mohou být základem fenotypů DFNA49 i DFNY1. Nejjednodušším mechanismem by byla citlivost jednoho nebo více těchto genů na dávku, takže zvýšená exprese vyplývající ze tří kopií vede ke ztrátě sluchu, i když nejsou vyloučeny ani jiné mechanismy.
Struktura a obsah genů nepostiženého a postiženého chromozomu Y
(A) Struktura nepostiženého chromozomu Y (VII-24 na obrázku 1). Šedá a černá barva: chyby, resp. mezery v sestavě GRCH37. Modře: oblast odpovídající referenční sekvenci na použité úrovni rozlišení. Níže je znázorněna část sestavy TSPY1 (modré šipky) a umístění signálů klonů BAC identifikovaných na obrázku 2.
(B) Struktura postiženého (VIII-2 na obrázku 1) chromozomu Y. Tento chromozom obsahuje segment, který se nenachází v nepostiženém chromozomu; tento segment je odvozen z duplikací sekvencí z chromozomu 1 (žlutá barva) i z chromozomu Y (modrá barva). Obsah genů a signály BAC jsou opět uvedeny níže. Šipky nahoře označují orientaci duplikovaných segmentů vzhledem k referenční sekvenci.
(C) Detailní pohled na dvě junkce chromozomu 1-Y studované na úrovni sekvence (obrázky S2 a S3), který ukazuje rozdíl mezi jednoduchou strukturou junkce 1 a komplexní strukturou junkce 2.
Zjistili jsme, že příčina lidské mendelovské poruchy vázané na chromozom Y souvisí spíše s vložením sekvencí chromozomu 1 než s mutací chromozomálního genu pro chromozom Y. To je v souladu s pozorováním, že ani duplikace (karyotyp 47,XYY), ani delece (karyotyp 45,X) celého chromozomu Y, a tedy všech jeho genů, není spojena s poruchou sluchu, z čehož vyplývá, že ztráta funkce nebo duplikace chromozomálního genu Y pravděpodobně není základem fenotypu DFNY1. Složitost přestavby také odpovídá její vzácnosti: Ačkoli by hluchota po mužské linii měla být snadno rozpoznatelným fenotypem, podle našich informací byla zaznamenána pouze jedna další rodina s podobným fenotypem.17 Příbuzenský vztah mezi oběma rodinami není znám; druhá rodina je rovněž čínská, ale z jiné etnické skupiny (Tujia místo Han). Audiologické charakteristiky jsou však podobné a na základě současných znalostí nelze vyloučit společný původ. Navzdory vzácnosti této specifické přestavby nicméně považujeme přebírání autozomálních sekvencí chromozomem Y za standardní součást chromozomální evoluce Y, obvykle neutrální a příležitostně dosahující fixace, ačkoli v případě DFNY1 je nevýhodná. Je totiž pozoruhodné, že chromozom Y nese fixní inzert ∼100 kb z chromozomální oblasti 1q43 v proximálním Yq,18 v blízkosti inzerce DFNY1. Toto pozorování vyvolává otázku, zda blízkost v jádře může podporovat přenos DNA mezi těmito dvěma chromozomy.19 Navrhovaný mutační mechanismus DFNY1, FoSTeS, byl dříve spojován pouze s intrachromozomálními přestavbami,13 takže současná studie rozšiřuje jeho vliv i na interchromozomální přestavby; zdůrazňuje také potřebu lépe pochopit opomíjený vztah mezi změnami v počtu kopií a poruchami sluchu.20