本文
ヒトのY染色体は、そのほとんどの長さが父親から息子に直接伝えられ、他のゲノムとは異なる男性特有の遺伝パターンを生成します。 そのため、Y染色体の表現形質は、その男系継承から容易に認識できるはずであり、初期の研究では、「毛深い耳」のような顕著な例を含む、いくつかのそのような形質を特定することができたと主張した。 しかし、1957年の時点で、これらの主張を批判的に検討した結果、17の形質のいずれについても支持を得ることはできなかった1。このことは、その後行われた「毛深い耳」自体の分子遺伝学的解析によって補強された2。このY染色体の形質の欠如が驚くべきことであるのは、少なくとも二つの要因によるものと理解される。 まず、2003年にヒトのY染色体の男性特異的領域の参照配列が作成されたとき3、この染色体には男性特異的な遺伝子がほとんどなく、23の異なるタンパク質しかコードしていないことが明らかになった。 また、Y染色体は男性の性決定と生殖機能に特化しており、メンデルの変異が遺伝する可能性は低いと考えられています。 2004年の初めには、「血統解析の結果、Y結合遺伝子はまだ一つも見つかっていない」5と書くことができましたが、同年末、中国の一家でY結合性聴覚障害(DFNY1、MIM 400043)が報告され6、ヒトでY結合を示す唯一のメンデル性障害として記録されています。 このため、この疾患は珍しいと考えられ、非常に興味深いものです。
2004年に報告された7世代のDFNY1血統では、成人男性全員が発症していました6。その後、血統をさらに2世代さかのぼり、以前の祖先の男系子孫をさらに同定しました7。 我々は以前、この家系の2つの分家のY染色体が67のY-STR遺伝子座で同一であることを証明したので、分家間の表現型の違いは、影響を受けた分家のY染色体が特異的に持つ遺伝子変異に関連しているに違いないと推論した。 そこで、各枝から代表的なY染色体をフローサイトメトリーで選別し、その塩基配列を決定した。 このうち3つは非罹患枝に生じたものであった。 このうち3つは非罹患枝に生じたもので、4つは罹患枝に生じ、表現型と分離したが、注釈付き遺伝子の外にあったため、原因変異の候補にはなり得なかった。 この解析では染色体の繰り返し領域を評価することはできなかったが、既知の繰り返し遺伝子は主に精子形成に関与しているため、本研究では原因変異が点突然変異でない可能性を検討した。 本研究は、インフォームドコンセントを提供したサンプル提供者、および中国PLA総合病院医療倫理委員会(中国北京市)の承認を得ています。 オブジェクト名は gr1.jpg
DFNY1 Pedigree
男性:四角、女性:丸、斜線:故人です。 塗りつぶした記号は聴覚障害(家族の記録から含む)、疑問符は聴覚の表現型が不明な2人の個体、アスタリスクは患部枝上にいるが検査時に症状発現年齢以下だった個体を示す。 矢印は、Y染色体の塩基配列が決定された2人を示す。 構造再配列は赤い星印で示した4回の減数分裂のうちの1回で起こった。 VII-IX世代と非罹患枝のVI世代では配偶者は省略した。
我々は、Sequence Search and Alignment by Hashing Algorithm 2 (SSAHA2) 10を用いて、高品質の重複フィルターをかけたリードをchrY参照配列に整列させ、10kbビンあたりのリードの数を患児VIII-2(図1)と非患児VII-24(図1)からのY染色体の間で比較することによって、染色体に沿った相対リード深さを調査した。 その結果、罹患染色体には3つの不連続なセグメントが重複しており、いずれも約9.3 Mbで終わるTSPY1 (MIM 480100) 遺伝子群と約10.1 Mbのcentromeric gapの間の限られた領域に由来することがわかった(図2A)。 これらの重複は、ゲノム全体をカバーするAgilent 100万個アレイと、chrY: 2,000,000-10,715,000 (1,990,000-10,105,000 hg19) 位置にまたがるカスタムNimbleGen 385K アレイを用いて、高解像度(約 20 bp)のオリゴ核酸配列比較ゲノムハイブリッド法 (CGH) で確かめられた(図2B)。 これらはTSPY1遺伝子群の一部を含むため、qPCR(オンライン版補足データの表S1)およびパルスフィールドゲル電気泳動(PFGE;図S1)によりTSPY1遺伝子数の増加を確認した。 これらの解析から、重複は検査した全罹患家族に共有され、非罹患家族には存在しないこと、また重複は元のTSPY1クラスターとは別の制限断片に存在し、したがって非連続的であることが示された。 これらの結果から、9.3-10.1Mbの領域が複雑に重複していることが確認されたが、重複した配列がどこに挿入されたのかについての情報は得られていない。 TSPY1プローブを用いたメタフェース蛍光in situハイブリダイゼーション(FISH)では単一のシグナルしか得られなかった(図示せず)ので、より高い分解能を得るために、先に述べた11のようにファイバーFISHを使用した。 Y染色体プローブは、参照配列の∼9.3-10.1Mbの大部分にまたがるBACクローンを使用した。 RP11-334D2(TSPY1を含む)、RP11-182H20、RP11-155J5、RP11-160K17、RP11-108I14(centromeric配列を含む)である。 その結果(図2C)、非罹患染色体は参照配列と同じように整理されており、TSPY1-182H20-セントロメアとまとめることができた。 一方、影響を受けた染色体(図2D)は、182H20配列内で中断され、TSPY1-partial 182H20-gap-centromeric duplication-TSPY1 duplication-182H20-centromere という組織となった。
DFNY1 Y染色体が担う構造的再配置の特徴
(A)Y染色体参照配列にマッピングした10kbビンの相対的読み取り量(影響を受ける/受けない)9.3〜10.1Mbの間。
(B)同じ領域のCGH log2比(罹患/非罹患)。
(C)非罹患Y染色体に示された3つのBACクローンのFiber-FISHは、それがこの領域で参照構造を運ぶことを示す。 334D2と108I14はいずれもBACクローンのサイズより大きなタンデム配列を検出する。
(D)同じBACクローンの影響を受けたY染色体へのFiber-FISH。 この染色体は、182H20ハイブリダイゼーション領域を中断する挿入を持ち、334D2と108I14ハイブリダイゼーション配列の部分重複を含んでいる。
(E)1番染色体参照配列の15-160.35Mb領域に対する、非罹患および罹患Y染色体のリードの絶対深度。
(F)1番染色体領域におけるCGH log2比(罹患/非罹患)。
(G)非罹患Y染色体(黄色)上の1番染色体BAC clone 179G5 メタフェーズFISH。
(H)罹患Y染色体上の同じ1番染色体プローブのメタフェースFISH(黄色)。
(I)示した2つのY BACクローンと1番染色体クローン574F21、179G5、1365F20の非罹患Y染色体へのFiber-FISH。
(J)同じクローンを未発症のY染色体にFiber-FISH。 1番染色体は182H20の部分シグナルと108I14のシグナルの間でY染色体にシグナルを検出する。 ゲノム座標はGRCh37/hg19を参照。
これらの未知の配列を同定するために、182H20切断点からギャップに伸びるセグメントについて、表S2に示すプライマーを用いて熱非対称インターレースPCR(TAIL-PCR)12を行った。 この方法では、既知の配列に特異的なネストしたプライマーと、未知の配列のプライミングを期待する縮退したプライマーを対にして連続的に増幅を行う。 連続した反応におけるサイズの違いは、既知のプライマーの位置を反映しているため、接合候補の産物を認識することができる。 表S3、図S2、S3に示す切断点特異的プライマーで確認された隣接配列は1番染色体(160.16Mb)由来であり、読み取り深さ、CGHプロファイル(図2E、2F)、配列から約160kbの連続した領域が関与していると考えられた。この関与は、より複雑な第2染色体1-Y結合が160.32Mbに確認されてからも裏付けられている。 また、1番染色体のRP11-574F21、RP11-179G5、W12-1365F20をプローブとしたファイバーFISH(図2I、2J)により、Y重複のギャップ内にそれらの配列があることが確認された。 その結果、1番染色体断片とY DNAの複数のセグメントからなる複雑な重複構造が明らかになった(表S4、図S2、S3)。 これはFoSTeS(fork stalling and template switching)と呼ばれる、複製中に異なるゲノム断片を結合するメカニズムを示すパターンである13
今回観察された重複構造は、他では報告されておらず、DFNY1突然変異自体が生じた減数分裂を含む、わずか4回の分裂のうちのいずれかの時期に生じたはずである(図1)。 したがって、この変異が原因である可能性が高い。 重複したY染色体配列は、約10個のTSPY1遺伝子のタンデム配列から1個の既知のタンパク質TSPY1のみをコードし、一方、第1染色体配列には5個のRefSeq遺伝子(CASQ1、PEA15、DCAF8、PEX19、COPA )と別の遺伝子NCSTN(MIM 605254)の5番目の端(エクソン1-3;図3)を持っている。 重複が難聴の表現型につながるメカニズムとしては、遺伝子コピー数の増加、新規のフランキングDNAによる不適切な発現、または切断、融合、点突然変異による変化した産物の形成が考えられる。 DFNY1ファミリーからの発現データはなく、1番染色体RefSeq遺伝子には非同義変異は見つからなかった(表S5)。 TSPY1コピー数は集団内で多型であり14、TSPY1コピー数が多いほど難聴の報告がなく、47,XYY個体も含めて、ある研究ではTSPY1コピー数の多さと別の表現型、不妊が関連していた15。 一方、1番染色体領域は、以前に難聴と関連した約900kbの区間、DFNA49 (MIM %608372)に完全に含まれている。
非罹患および罹患Y染色体の構造と遺伝子内容
(A)非罹患(図1ではVII-24)Y染色体の構造です。 灰色と黒はそれぞれGRCH37のアセンブリにおけるエラーとギャップ。 青:使用した分解能のレベルで参照配列と一致する領域。 下に示すのはTSPY1アレイの一部(青い矢印)と図2で同定したBACクローンのシグナルの位置。
(B)患部(図1のVIII-2)Y染色体の構造。 この染色体は1番染色体(黄色)とY染色体(青色)の配列が重複したものである。 ここでも、遺伝子内容とBACシグナルを以下に示す。
(C)配列レベルで研究した2つの1番染色体-Y接合部の詳細図(図S2、S3)。接合部1の単純構造と接合部2の複雑構造の違いを示している。
ヒトのY連鎖性メンデル障害の原因は、Y染色体遺伝子の変異ではなく、1番染色体配列の挿入に関連していることが分かりました。 これは、Y染色体全体、つまりその全遺伝子の重複(47,XYY核型)も欠失(45,X核型)も聴覚障害と関連しないという観察と一致し、Y染色体遺伝子の機能喪失や重複がDFNY1表現型の根底にあるとは考えられないことを示唆している。 この染色体再配列の複雑さは、その希少性とも一致している。 男性型難聴は容易に認識できる表現型のはずですが、私たちの知る限り、同様の表現型を持つ家族は他に1つしか報告されていません17。2家族間の関係は不明で、2家族も中国人ですが、異なる民族(漢族ではなくツージャ族)です。 しかし、聴覚的特徴は類似しており、現在の知見では共通の起源を否定することはできない。 このような特異的な再配列は稀ですが、それでも私たちはY染色体が常染色体配列を獲得することはY染色体進化の標準的な部分であり、通常は中立的で、時には固定化に至ることもありますが、DFNY1の場合は不利であると見ています。 実際、Y染色体は染色体領域1q43から約100kbの固定挿入を近位Yqに持ち、DFNY1の挿入に近いことが注目される18。 この観察から、核内で近接していることが、この2つの染色体間のDNA移送を促進するのではないかという疑問が生じました。19 DFNY1の変異メカニズムとして提案されているFoSTeSは、これまで染色体内再配列にのみ関連していたため13、今回の研究はその影響を染色体間再配列にも拡大するものです。また、コピー数変異と聴覚障害との間で軽視されてきた関係についても理解を深める必要があることが明らかになりました20
。