Texte principal
Le chromosome Y humain est transmis directement de père en fils sur la majeure partie de sa longueur, générant un modèle d’héritage spécifique aux hommes, distinct du reste du génome. Les traits phénotypiques du chromosome Y devraient donc être facilement reconnaissables à leur hérédité masculine, et les premières études ont prétendu identifier plusieurs de ces traits, y compris des exemples notables comme les « oreilles poilues ». Cependant, dès 1957, l’examen critique de ces affirmations n’a pas permis de confirmer l’existence de l’un ou l’autre des 17 traits considérés1, une constatation renforcée par l’analyse moléculaire-génétique ultérieure des « oreilles poilues » elles-mêmes2. Premièrement, lorsqu’une séquence de référence pour la région spécifique aux hommes du chromosome Y humain a été générée en 20033, elle a révélé que le chromosome porte peu de gènes spécifiques aux hommes et ne code que pour 23 protéines distinctes. Des travaux ultérieurs ont révélé que trois d’entre elles sont absentes chez environ 2 % des hommes d’Asie du Sud, dont les chromosomes Y ne codent donc que pour 20 protéines spécifiques aux hommes.4 Deuxièmement, le chromosome Y a des fonctions spécialisées dans la détermination du sexe masculin et la fertilité, dans lesquelles il est peu probable qu’une variation mendélienne soit héritable. Ainsi, au début de l’année 2004, il était possible d’écrire que « l’analyse du pedigree n’a pas encore révélé un seul gène lié à l’Y ».5 Plus tard cette année-là, cependant, une déficience auditive liée à l’Y (DFNY1, MIM 400043) a été signalée dans une famille chinoise6 et reste le seul trouble mendélien documenté présentant une liaison à l’Y chez l’homme. Son fondement semble donc susceptible d’être inhabituel et présente un intérêt considérable. Ici, nous étudions ce fondement en examinant la séquence du chromosome Y de DFNY1 et en la comparant au chromosome Y d’une branche de la famille étroitement apparentée mais non affectée.
Dans le pedigree DFNY1 de sept générations rapporté en 2004, tous les hommes adultes étaient affectés.6 Par la suite, le pedigree a été retracé sur deux générations supplémentaires et des descendants supplémentaires de la lignée masculine d’un ancêtre antérieur ont été identifiés.7 De manière frappante, leur audition n’était pas affectée (figure 1). Nous avions précédemment démontré l’identité des chromosomes Y des deux branches de la famille à 67 loci Y-STR, et nous avons donc pensé que la différence phénotypique entre les branches devait être associée à une variante génétique portée spécifiquement par le chromosome Y de la branche affectée. Nous avons trié un chromosome Y représentatif de chaque branche par cytométrie de flux et l’avons ensuite séquencé. Seules quatre différences de substitution de base ont été identifiées entre les chromosomes.8 Trois d’entre elles étaient apparues sur la branche non affectée. Trois d’entre elles étaient apparues sur la branche non affectée. La quatrième était apparue sur la branche affectée et ségréguait avec le phénotype, mais elle constituait un mauvais candidat pour la mutation causale car elle se trouvait en dehors de tout gène annoté. Bien que cette analyse n’ait pas permis d’évaluer les régions répétées du chromosome, les gènes répétés connus sont principalement impliqués dans la spermatogenèse,3,9 aussi, dans l’étude actuelle, nous avons exploré la possibilité que la mutation causale ne soit pas une mutation ponctuelle. Cette étude a été approuvée par les donneurs d’échantillons, qui ont fourni un consentement éclairé écrit, et par le comité d’éthique médicale de l’hôpital général de l’APL chinoise, à Beijing, en Chine.
Le pedigree DFNY1
Mâles, carrés ; femelles, cercles ; ligne diagonale, défunt. Les symboles remplis indiquent une déficience auditive (y compris à partir des dossiers familiaux) ; les points d’interrogation indiquent deux individus dont le phénotype auditif est inconnu ; et les astérisques indiquent les individus qui se trouvent sur la branche affectée mais qui étaient en dessous de l’âge d’apparition des symptômes au moment de l’examen. Les flèches indiquent les deux individus dont les chromosomes Y ont été séquencés. Le réarrangement structurel s’est produit au cours de l’un des quatre méioses marqués par des étoiles rouges. Les conjoints sont omis dans les générations VII-IX et dans la génération VI sur la branche non affectée.
Nous avons examiné la profondeur de lecture relative le long du chromosome en alignant des lectures filtrées en double de haute qualité sur la séquence de référence chrY en utilisant la recherche de séquence et l’alignement par algorithme de hachage 2 (SSAHA2)10 et en comparant le nombre de lectures par case de 10 kb entre les chromosomes Y de l’individu affecté VIII-2 (figure 1) et de l’individu non affecté VII-24 (figure 1). Cela a révélé trois segments discontinus dupliqués dans le chromosome affecté, et tous étaient dérivés de la région limitée entre le cluster de gènes TSPY1 (MIM 480100) se terminant à ∼9,3 Mb et l’écart centromérique à ∼10,1 Mb (Figure 2A). Ces duplications ont été confirmées par hybridation génomique comparative (CGH) conventionnelle par réseau d’oligonucléotides avec un réseau Agilent 1 million couvrant l’ensemble du génome et un réseau NimbleGen 385K personnalisé couvrant les positions chrY : 2 000 000-10 715 000 (1 990 000-10 105 000 hg19) à haute (∼20 pb) résolution (Figure 2B). Comme ils comprenaient une partie du cluster de gènes TSPY1, nous avons vérifié une augmentation du nombre de gènes TSPY1 par qPCR (tableau S1 dans les données supplémentaires disponibles en ligne) et par électrophorèse en champ pulsé (PFGE ; figure S1). Ces analyses ont montré que la duplication était partagée par tous les membres de la famille affectés testés et qu’elle était absente de tous les membres non affectés. Elles ont également montré que la duplication se trouvait dans un fragment de restriction distinct du groupe TSPY1 original et qu’elle n’était donc pas contiguë. Bien que les preuves combinées aient confirmé une duplication complexe de la région de 9,3-10,1 Mb, elles n’ont fourni aucune information sur l’endroit où les séquences dupliquées ont été insérées. L’hybridation in situ par fluorescence (FISH) en métaphase avec une sonde TSPY1 a montré un seul signal (non montré), nous avons donc utilisé la FISH par fibre comme décrit précédemment11 pour une résolution plus élevée. Les sondes du chromosome Y étaient des clones BAC couvrant la majeure partie de ∼9,3-10,1 Mb de la séquence de référence : RP11-334D2 (incluant TSPY1), RP11-182H20, RP11-155J5, RP11-160K17 et RP11-108I14 (incluant les séquences centromériques). Les résultats (Figure 2C) ont montré que le chromosome non affecté était organisé de la même manière que la séquence de référence, ce qui peut être résumé comme TSPY1-182H20-centromère. En revanche, le chromosome affecté (Figure 2D) a été interrompu dans la séquence 182H20 pour produire l’organisation TSPY1-partiel 182H20-gap-centromérique duplication-TSPY1 duplication-182H20-centromère. Les résultats de fiber-FISH ont donc démontré que les séquences Y dupliquées ont été réinsérées localement sous une forme réarrangée, mais ils ont également révélé la présence d’un segment qui ne s’est hybridé à aucune sonde de la région TSPY1-centromère.
Charactérisation du réarrangement structurel porté par le chromosome Y de DFNY1
(A) Profondeur de lecture relative (affectée/non affectée) dans des bins de 10 kb cartographiés sur la séquence de référence du chromosome Y entre 9,3 et 10,1 Mb. Notez les lacunes d’assemblage à chaque extrémité de cette région.
(B) Rapport CGH log2 (affecté/non affecté) pour la même région.
(C) Fiber-FISH des trois clones BAC indiqués au chromosome Y non affecté, montrant qu’il porte la structure de référence dans cette région. Les deux 334D2 et 108I14 détectent des réseaux en tandem plus grands que la taille du clone BAC.
(D) Fiber-FISH des mêmes clones BAC au chromosome Y affecté. Ce chromosome porte une insertion qui interrompt la région d’hybridation 182H20 et contient des duplications partielles des deux séquences d’hybridation 334D2- et 108I14.
(E) Profondeur de lecture absolue des lectures du chromosome Y non affecté et affecté vers la région 160.15-160,35 Mb de la séquence de référence du chromosome 1.
(F) Rapport CGH log2 (affecté/non affecté) pour la même région du chromosome 1.
(G) FISH en métaphase du clone BAC 179G5 du chromosome 1 sur le chromosome Y non affecté (jaune). Une hybridation est observée uniquement à l’emplacement de référence sur le chromosome 1.
(H) FISH en métaphase de la même sonde du chromosome 1 sur le chromosome Y affecté (jaune). L’hybridation est vue à un locus supplémentaire sur le chromosome Y.
(I) FISH en fibre des deux clones BAC Y indiqués plus les clones du chromosome 1 574F21, 179G5 et 1365F20 sur le chromosome Y non affecté. Aucun signal du chromosome 1 n’est détecté sur le Y.
(J) Fiber-FISH des mêmes clones sur le chromosome Y non affecté. Les clones du chromosome 1 détectent un signal sur le Y entre le signal partiel 182H20 et le signal 108I14. Les coordonnées du génome se réfèrent à GRCh37/hg19.
Afin d’identifier ces séquences inconnues, nous avons effectué une PCR thermique asymétrique entrelacée (TAIL-PCR)12 sur le segment s’étendant du point de cassure 182H20 dans l’écart en utilisant les amorces présentées dans le tableau S2. Dans des amplifications consécutives, cette procédure associe des amorces imbriquées spécifiques de la séquence connue à des amorces dégénérées qui devraient s’amorcer dans la séquence flanquante inconnue. Les produits de jonction candidats sont reconnus car leurs différences de taille dans les réactions consécutives reflètent les positions des amorces connues. Les séquences adjacentes, confirmées par des amorces spécifiques au point de rupture (tableau S3 et figures S2 et S3), provenaient du chromosome 1 (160,16 Mb), et l’examen de la profondeur de lecture, des profils CGH (figures 2E et 2F) et de la séquence a suggéré l’implication d’une région contiguë de ∼160 kb ; cette implication a été confirmée par l’identification d’une deuxième jonction chromosome 1-Y plus complexe à 160,32 Mb. La translocation des séquences du chromosome 1 vers le Y affecté a été confirmée par FISH en métaphase (Figures 2G et 2H), et leur localisation dans l’espace de la duplication du Y a été confirmée par fiber-FISH (Figures 2I et 2J) avec les BACs RP11-574F21, RP11-179G5, et W12-1365F20 du chromosome 1 comme sondes. Les données combinées ont donc révélé une structure de duplication complexe constituée à la fois d’un fragment du chromosome 1 et de multiples segments d’ADN Y (tableau S4 et figures S2 et S3). Aucun des points de rupture séquencés ne présentait de grandes longueurs d’homologie, mais tous ont révélé une microhomologie, un modèle indiquant un FoSTeS (fork stalling and template switching), qui est un mécanisme combinant des fragments génomiques disparates au cours de la réplication.13
La structure dupliquée observée ici n’a pas été signalée ailleurs et doit être apparue au cours de l’une des quatre méioses seulement, qui englobent la méiose au cours de laquelle la mutation DFNY1 elle-même s’est produite (figure 1). Il est donc probable qu’elle soit causale. Les séquences dupliquées du chromosome Y ne codent qu’une seule protéine connue, TSPY1, issue d’un réseau en tandem de ∼10 gènes TSPY1, alors que les séquences du chromosome 1 portent cinq gènes RefSeq (CASQ1 , PEA15 , DCAF8 , PEX19 , et COPA ) et l’extrémité 5′ d’un autre gène, NCSTN (MIM 605254) (exons 1-3 ; figure 3). Les mécanismes par lesquels la duplication pourrait conduire au phénotype de la surdité comprennent une augmentation du nombre de copies du gène, une expression inappropriée résultant d’un nouvel ADN flanquant, ou la formation d’un produit altéré par troncature, fusion ou mutation ponctuelle. Aucune donnée d’expression n’est disponible pour la famille DFNY1, et aucune mutation non synonyme n’a été trouvée dans les gènes RefSeq du chromosome 1 (tableau S5). Le nombre de copies de TSPY1 est polymorphe au sein de la population,14 et des nombres plus élevés de copies de TSPY1 ont été trouvés sans qu’une surdité soit signalée, y compris chez des individus 47,XYY ; une étude a associé un nombre élevé de copies de TSPY1 à un phénotype différent, la stérilité.15 Un nombre élevé de copies de TSPY1 constitue donc un mauvais candidat pour la surdité. En revanche, la région du chromosome 1 se trouve entièrement dans un intervalle d’environ 900 kb, le DFNA49 (MIM %608372), précédemment associé à la surdité ; la mutation causale dans cet intervalle reste inconnue.16 Nous proposons donc que le ou les mêmes gènes puissent sous-tendre les phénotypes DFNA49 et DFNY1. Le mécanisme le plus parcimonieux serait la sensibilité au dosage d’un ou de plusieurs de ces gènes, de sorte que l’expression accrue résultant de trois copies entraîne une perte auditive, bien que d’autres mécanismes ne soient pas exclus.
Structure et contenu génétique des chromosomes Y non affectés et affectés
(A) La structure du chromosome Y non affecté (VII-24 dans la figure 1). Gris et noir : erreurs et lacunes, respectivement, dans l’assemblage GRCH37. Bleu : région correspondant à la séquence de référence au niveau de résolution utilisé. Sont montrés ci-dessous une partie du réseau TSPY1 (pointes de flèche bleues) et l’emplacement des signaux des clones BAC identifiés dans la figure 2.
(B) Structure du chromosome Y affecté (VIII-2 dans la figure 1). Ce chromosome contient un segment qui ne se trouve pas dans le chromosome non affecté ; ce segment est issu de duplications de séquences provenant à la fois du chromosome 1 (jaune) et du chromosome Y (bleu). Là encore, le contenu des gènes et les signaux BAC sont indiqués ci-dessous. Les pointes de flèches ci-dessus indiquent l’orientation des segments dupliqués par rapport à la séquence de référence.
(C) Vue détaillée des deux jonctions du chromosome 1-Y étudiées au niveau de la séquence (Figures S2 et S3), montrant la différence entre la structure simple de la jonction 1 et la structure complexe de la jonction 2.
Nous avons découvert que la cause du trouble mendélien lié à l’Y humain était associée à l’insertion de séquences du chromosome 1 plutôt qu’à la mutation d’un gène du chromosome Y. Ceci est cohérent avec les observations selon lesquelles ni la duplication (caryotype 47,XYY) ni la délétion (caryotype 45,X) de l’ensemble du chromosome Y et donc de tous ses gènes n’est associée à une déficience auditive, ce qui implique que la perte de fonction ou la duplication d’un gène du chromosome Y n’est probablement pas à l’origine du phénotype DFNY1. La complexité du réarrangement est également cohérente avec sa rareté : Bien que la surdité masculine soit un phénotype facilement reconnaissable, à notre connaissance, une seule autre famille présentant un phénotype similaire a été signalée.17 La relation entre les deux familles est inconnue ; la deuxième famille est également chinoise, mais d’un groupe ethnique différent (Tujia au lieu de Han). Cependant, les caractéristiques audiologiques sont similaires, et sur la base des connaissances actuelles, il est impossible d’exclure une origine commune. Malgré la rareté de ce réarrangement spécifique, nous considérons néanmoins l’acquisition de séquences autosomiques par le chromosome Y comme une partie standard de l’évolution du chromosome Y, généralement neutre et atteignant parfois la fixation, bien que dans le cas de DFNY1, elle soit désavantageuse. En effet, il convient de noter que le chromosome Y porte une insertion fixe de ∼100 kb provenant de la région chromosomique 1q43 en Yq proximal,18 à proximité de l’insertion DFNY1. Cette observation soulève la question de savoir si la proximité dans le noyau pourrait favoriser le transfert d’ADN entre ces deux chromosomes.19 Le mécanisme mutationnel proposé pour le DFNY1, FoSTeS, n’a été précédemment associé qu’à des réarrangements intrachromosomiques,13 aussi l’étude actuelle étend son influence pour inclure les réarrangements interchromosomiques ; elle souligne également la nécessité de mieux comprendre la relation négligée entre la variation du nombre de copies et la déficience auditive20
.