子宮内膜厚が4mm以上の症候性閉経後女性における子宮内膜がん予測のためのリスクスコアリングモデル

要旨
1. はじめに
2.材料と方法
3.結果
4. 考察
5. 結論
利益相反

要旨

目的。子宮内悪性腫瘍のリスクを有する症候性閉経後女性における子宮内膜癌予測のためのリスクスコアリングモデルを開発し，検証することである。方法膣からの出血と子宮内膜厚> 4mmで診断的子宮鏡検査を受けた閉経後女性624名を前向きに検討した。子宮内膜癌のある女性、ない女性の患者特性および子宮内膜の評価を比較した。そして、子宮内膜癌の最良の予測因子を含む、リスクスコアリングモデルを検証した。一変量解析、多変量解析、およびROC曲線解析が行われた。最後に、スプリットサンプリングによる内部検証も行った。結果子宮内膜癌の最良の予測因子は、再発性膣出血（オッズ比）、高血圧内膜厚> 8mmの存在、および年齢> 65歳であった。これらの変数を用いて、子宮内悪性腫瘍の予測に用いるリスクスコアリングモデル（RHEA risk-model）を作成し、曲線下面積は0.878（95％CI 0.842～0.908; )であった。最適なカットオフ値（スコア≧4）において、感度と特異度はそれぞれ87.5％と80.1％であった。結論子宮内膜厚> 4mmの症状のある閉経後女性において、患者特性と子宮内膜厚を含むリスクスコアリングモデルは、子宮内膜癌の有無を識別する上で中程度の診断精度を示した。このモデルに基づいて、このような集団の管理のための決定アルゴリズムが開発された。

1. はじめに

子宮内膜癌の閉経後女性の約90～95％が膣からの出血体験を報告することが知られているが、一方で症状のある閉経後女性の約10％が子宮内悪性腫瘍であることが明らかになった。ですから、閉経後の膣からの出血は、過小評価してはいけないサインなのです。

通常、子宮内膜の厚さが 4 mm 未満であることが、保存的管理を採用するためのカットオフ値です。実際、後者の場合、検査後に子宮内膜がんである確率は10％から0.8％に低下する。逆に、症状のある閉経後の女性で、子宮内膜の厚さが> 4mmの場合は、がんのリスクが高くなる。このような場合、さらなる検査が必要であり、通常は子宮内膜のサンプリングや外来での子宮鏡検査が行われるべきです。しかし、悪性腫瘍のリスクがあると考えられる集団では、これらの検査の約80〜90％では、がんは発見されない。

この重要な目的を念頭に置きつつも、我々の手技の診断性能を向上させる臨床変数があるのかどうか疑問に思う。臨床的な有用性を検証するために、患者の特徴や超音波画像の特徴を含むいくつかの研究が行われました。ある著者は、膣からの出血があるすべての閉経後女性を研究対象としているが、他の著者は、子宮内悪性腫瘍のリスクのある内膜厚を持つ症状のある閉経後女性のみを研究対象としている。これらの研究の大部分は、子宮内膜癌の検出における診断性能の向上を伴う、公正な結果を示した。しかし、現在までのところ、これらのモデルはまだ外部で検証されておらず、子宮内膜の厚さは、これらのケースで評価されるべき最も重要な特徴であることに変わりはない。子宮内膜厚の評価は、さらなる予測因子とともに、高リスクの女性における子宮内悪性腫瘍の予測においてより良い結果をもたらす可能性がある。

この点から，本研究の目的は，子宮内膜厚> 4mmを有する症状のある閉経後女性において，内膜評価と患者特性を含むリスクスコアリングモデルを作成してテストし，さらに，このような集団の管理のための決定アルゴリズムを開発することであった。

2.材料と方法

この前向き観察研究では、診断子宮鏡検査を受けた子宮内膜厚> 4mmの症状のある閉経後の女性624名を対象とした。本研究は、2008年3月から2013年11月まで、イタリアのモデナにあるCesare Magati病院、産科婦人科、および大学病院、産科婦人科研究所で実施された。私たちの施設審査委員会はこの研究を承認し、各女性はインフォームドコンセントを行った。

膣からの出血があった閉経後の女性には、経膣超音波検査を実施した。後者の検査は5-9MHzの膣内トランスデューサを用い，矢状面で前後二層内膜の最も厚い部分を測定した。

子宮内膜の厚さが> 4mmであるすべてのケースでさらなる評価を提案する我々のプロトコルに基づいて、診断用子宮鏡検査を受けた女性のみを募集しました。子宮頸部、膣、外陰部の疾患による膣からの出血、およびホルモン補充療法（HRT）による膣からの出血がある症状のある閉経後女性をすべて除外した。逆に、HRTを受けている閉経後女性で、予定外の膣内出血がある人はすべて本研究の対象とした。閉経後の状態とは、40歳以降に少なくとも12ヶ月間月経がない状態と定義し、無月経の病的状態は除外した。

対象となったすべての女性は、経膣超音波検査の後、年齢、初経年齢、閉経年齢、閉経からの期間、肥満度（BMI＝体重（kg）／身長2（m2））、出産歴、高血圧または糖尿病の有無、HRT、抗凝固剤またはタモキシフェンの使用、乳癌歴、再発性膣出血または1回出血、内膜厚およびエコー原性を含む病歴についてのアンケート用紙に記入した。先行研究に基づき、再発性膣出血は7日以上続いた出血、または過去1年間に2回以上の膣出血の別エピソードと定義した。

子宮内膜厚> 4 mmの有症状閉経後女性全員に対し、外来での診断用子宮内視鏡を行い、膨張媒体として食塩水、機器直径の狭い腟鏡検査に取り組んだ。後者の検査は、超音波所見に盲検化された経験豊富な子宮鏡医によって行われた。各女性は、我々が基準としている子宮内膜のサンプリングに供された。私たちの以前の研究に基づいて、子宮内病変のない女性にはVabraによる子宮内膜サンプリングが行われ、前がん病変または悪性病変の疑いのある女性には標的生検と各子宮壁のランダム生検が行われた。非定型子宮内膜増殖症（AEH）の女性全員と子宮内悪性腫瘍の女性全員は、確定的な組織学的所見として我々の参照基準となる子宮摘出術を受けた。

正規分布の検定としてKolmogorov-Smirnov検定が用いられた。非正規分布の連続変数の比較にはノンパラメトリックなMann-Whitney検定が用いられた。カテゴリー変数は，適宜，χ2解析またはフィッシャーの正確検定で評価した。一変量解析で有意差を示した変数が、前方選択と後方選択の両方を含むステップワイズ・ロジスティック回帰分析の予測変数の候補となった。簡略化したモデルを作成するため、入口と出口の値を0.05/0.05とした。

変数の選択、変数に関する不確実性、オーバーフィットなど、ステップワイズ法のいくつかの限界を克服するため、また、サンプルサイズ（女性624人）に基づいて、分割サンプリング内部検証を実施しました。私たちのコホートを二つに分け、二つの半分のサンプルで子宮内膜癌の数を同じに保つようにし、一方の半分（トレーニングサンプル）でモデルを開発し、もう一方（バリデーションサンプル）でテストしたのである。我々は，訓練標本のステップワイズ回帰が，全データセットの回帰モデルによって生成される予測変数の同じサブセットを生成したかどうかを評価した．そして，トレーニング・サンプルと検証サンプルの決定係数（）を比較しました（50%トレーニング・サンプル-50%検証サンプル）．その結果，収縮率が2%(0.02)以下であれば，検証は成功であると判断した．その場合，完全な導出標本から最終的な予測モデルを導出した．

子宮内膜癌に関連する予測連続変数の最適なカットオフ値を決定するために、ROC（Receiver Operating Characteristic）曲線分析が使用された。多変量解析で得られた各変数の予測オッズ比に従って，有意な予測因子ごとにスコアを割り振った。そして、そのスコアを研究対象の変数として特定し、ROC曲線分析を実施した。各スコアについて、感度、特異度、陽性予測値（PPV）、陰性予測値（NPV）、陽性尤度比（LR+）、陰性尤度比（LR-）が報告されている。我々の疾患有病率（子宮内膜癌の全例）を子宮内膜癌の検査前確率と考えた後、尤度比を用いて、検査前の疾患確率から検査後確率を算出した：検査後確率＝検査前確率×尤度比。オッズと確率の関係は、odds = and = odds/()である。これらの式を用いて、試験前の疾病確率から試験後の疾病確率を計算することができた。

統計解析はMedCalc（MedCalc Software, Mariakerke, Belgium）を用いて行った。 0.05未満の値を統計的に有意であるとみなした。

3.結果

診断子宮鏡検査に紹介された子宮内膜厚> 4mmの症状のある閉経後女性648名を登録した。頸管狭窄のため、耐え難い痛みのために外来での子宮鏡検査が不可能であったため、24人の女性がこの前向き研究から除外された。

組織学的検査では、子宮内膜の萎縮が157人（25.2％）、子宮内膜ポリープが275人（44.1％）、粘膜下筋腫が58人（9.3％）、子宮内膜が62人（9.9％）、子宮内膜過形成（異型を伴う複合過形成15例、異型を伴う単純過形成9例、異型を伴わない複合過形成22例、異型を伴わない単純過形成16例）、女性72例（11.

患者特性は、初経年齢、閉経年齢、BMI、分娩数、糖尿病、タモキシフェンおよび抗凝固剤の使用、および乳癌歴に関して有意差は認められなかった（表1）。逆に、年齢（）、閉経からの時間（）、HRT使用（）、再発性膣出血（）、高血圧の有無（）、子宮内膜エコー強度（）、子宮内膜厚（）に関しては有意差が見られた（表1）。


Variables	Women with endometrial cancer (%)	Women without endometrial cancer (%)	P value

Age (years)*	69 (66–71)	59 (55–65)	<0.0001a
Age at menarche (years)*	12 (12-13)	12 (11–13)	0.29a
Age at menopause (years)*	52 (50–53)	52 (50–53)	0.86a
Time since menopause (years)*	17 (17-18)	7 (4–14)	<0.0001a
BMI*	28 (25–31)	28 (27–31)	0.16a
Parity			0.22b
Nulligravid	12 (16.6)	132 (23.9)
Parous	60 (83.4)	420 (76.1)
HRT use			0.0001b
Yes	0 (0)	108 (19.5)
No	72 (100)	444 (80.5)
Vaginal bleeding			<0.0001b
Single episode	24 (33.3)	348 (63.0)
Recurrent episode	48 (66.7)	204 (37.0)
Hypertension			<0.0001b
Yes	48 (66.7)	208 (37.6)
No	24 (33.3)	344 (62.4)
Diabetes			0.88b
Yes	12 (16.6)	84 (15.2)
No	60 (83.4)	468 (84.8)
Tamoxifen			0.097c
Current users	0 (0)	0 (0)
Past users	0 (0)	24 (4.3)
Never users	72 (100)	528 (95.7)
Anticoagulant use			0.53b
Yes	18 (25.0)	116 (21.1)
No	54 (75.0)	436 (78.9)
Breast cancer			0.097c
Yes	0 (0)	24 (4.3)
No	72 (100)	528 (95.7)
Endometrial echogenicity			<0.0001b
Uniform	0 (0)	200 (36.2)
Nonuniform	72 (100)	352 (63.8)
Endometrial thickness (mm)*	11 (9–13)	8 (6–10)	<0.0001a

The values are expressed by median and interquartile range. Using Mann-Whitney test; using Chi-square analysis; using Fisher’s exact test; BMI: body mass index; HRT: hormone replacement therapy.

Table 1

Univariate analysis comparing clinical variables and endometrial assessment between women with () or without () endometrial cancer.

The seven variables that showed significant difference in univariate analysis were included in multivariate analysis (age, time since menopause, HRT use, recurrent vaginal bleeding, presence of hypertension, endometrial echogenicity, and endometrial thickness). Then, stepwise logistic regression analysis showed the significant predictive variables associated with endometrial cancer (acronym, RHEA): R for recurrent vaginal bleeding (, confidence interval 1.32–6.66, ); H for the presence of hypertension (, confidence interval 1.10–4.50, ); E for endometrial thickness (, confidence interval 1.18–1.45, , criterion > 8 mm); and A for age (, confidence interval 1.07–1.15, , criterion > 65 years) (Table 2). To test the goodness of fit for the logistic regression model, the Hosmer-Lemeshow test was performed and showed a value of 0.218.


Variables	Odds ratio	95% CI	Criterion	P valuea

Age	1.11	1.07–1.15	>65 years	<0.0001
Recurrent vaginal bleeding	2.96	1.32–6.66	—	0.0084
Endometrial thickness	1.31	1.18–1.45	>8 mm	<0.0001
Presence of hypertension	2.01	1.10–4.50	—	0.0273

Using stepwise regression analysis. CI: confidence intervals.

Table 2

Multivariate analysis showing clinical and endometrial variables associated with intrauterine malignancy.

A split-sampling internal validation was performed. The same predictors of the full dataset (recurrent vaginal bleeding, age, endometrial thickness, and hypertension) were produced after the stepwise regression of the training sample. そして、重回帰分析を行い、トレーニングサンプルとバリデーションサンプルの決定係数()を求めた。トレーニングサンプルとバリデーションサンプルの縮約率（）は0.017（≦2％）であり、バリデーションは成功したと判断した。

多変量解析で得られた各変数の予測オッズ比に従って、有意な予測因子ごとにスコアを割り当てた：年齢>> 8 mm=1. 次に、リスクスコアリングモデルに関連するROC曲線を作成した。曲線下面積（AUC）は0.878（95％信頼区間0.842〜0.908;）であった（図1）。各スコアについて、感度、特異度、PPV、NPV、LR+、LR-を報告した（表3）。 At the best cut-off value (score ≥ 4), sensitivity and specificity were 87.5% and 80.1%, respectively; the PPV and NPV were 36.5% and 98.0%, respectively; LR+ was 4.41 (with a pretest probability of 11.5% and posttest probability of 35.1%); and LR− was 0.16 (with a pretest probability of 11.5% and posttest probability of 1.9%) (Table 3).


Cut-off score	Sensitivity (%)	Specificity (%)	PPV (%)	NPV (%)	LR+	LR−	Pretest probability	Posttest probability

≥0	100	0.0	11.5	—	—	—	11.5%	—
≥1	100	21.7	14.3	100	—	0.00	11.5%	0.0%
≥2	100	34.8	16.7	100	—	0.00	11.5%	0.0%
≥3	93.7	54.9	21.3	98.5	—	0.11	11.5%	1.3%
≥4	87.5	80.1	36.5	98.0	—	0.16	11.5%	1.9%
≥5	70.8	85.3	38.6	95.7	—	0.34	11.5%	4.0%
≥6	50.0	91.3	42.9	93.3	—	0.55	11.5%	6.3%
≥7	31.2	97.5	62.5	91.6	—	0.70	11.5%	7.9%
>7	0	100	—	88.5	—	1.00	11.5%	11.5%

≥0	100	0.0	11.5	—	1.00	—	11.5%	11.5%
≥1	100	21.7	14.3	100	1.28	—	11.5%	13.6%
≥2	100	34.8	16.7	100	1.53	—	11.5%	15.8%
≥3	93.7	54.9	21.3	98.5	2.08	—	11.5%	20.3%
≥4	87.5	80.1	36.5	98.0	4.41	—	11.5%	35.1%
≥5	70.8	85.3	38.6	95.7	4.83	—	11.5%	37.2%
≥6	50.0	91.3	42.9	93.3	5.75	—	11.5%	41.4%
≥7	31.2	97.5	62.5	91.6	12.8	—	11.5%	61.1%
>7	0	100	—	88.5	—	—	11.5%	—

PPV = positive predictive value; NPV = negative predictive value; LR+ = positive likelihood ratio; LR− = negative likelihood ratio.

Table 3

Sensitivity, specificity, PPV, NPV, LR+, LR−, pre-, and posttest probability for each score of our risk-scoring model.

Figure 1

ROC curve associated with the risk-scoring model. The area under the curve was 0.878 (95% CI to 0.908; ).

4. 考察

診断システムの精度によると、本研究では、再発性膣出血、子宮内膜厚> 8mm、高血圧の存在などのリスクスコアリングモデルが示された。と年齢> 65歳のRHEAは、子宮内膜がんのリスクを持つ症状のある閉経後女性において、子宮内悪性腫瘍の予測に中程度の診断精度を提供するものでした。カットオフスコア4以上で、検査前の確率11.5％から、検査後の確率1.9％（がんの見逃し率）、検査後の確率35.1％（がん保有率）が得られた。

研究の長所と短所。本研究では、より信頼性の高いデータを得るために、あらゆる種類の検査を標準化することができる前向き評価を実施した。さらに、すべての女性が、最適な基準で確定的な組織学的診断を受けた。

私たちは、子宮内膜厚が > 4 mm の有症状閉経後女性を選びましたが、これは子宮内膜厚が低い女性ではがんの発生率が非常に低く、通常、この施設ではさらなる検査が行われないからです。

症状のある閉経後女性を含む以前の研究で、Bruchim らは、子宮内膜の厚さが 5 ～ 9 mm の場合、わずか 10% で癌が発見されることを示しました。子宮内膜の厚さが> 9mmの場合、癌の割合は18%に達した。

非常に興味深い研究で、Opolskieneらは、膣からの出血と子宮内膜厚4.5mm以上の閉経後女性における子宮内膜癌の異なる予測モデルを比較しました。彼らは、患者の特徴に子宮内膜厚とパワードップラー情報を加えることで、予測モデルの診断性能が有意に向上するという結論に達した。この後者の研究に関して、子宮内膜厚と臨床変数を含む彼らの予測モデルのみを考慮すると、彼らのモデルのAUCは我々のリスクスコアリングモデルのそれと同様であった（0.82と0.87、それぞれ）ことに注目されたい。また、Opmeerらは、患者の特徴（年齢、閉経からの期間、BMI、糖尿病）と子宮内膜の厚さを考慮することで、手術の適切性が著しく向上することを示した。後者の場合、彼らのモデルのAUCは0.90の値に達した。

患者特性と子宮内膜厚を含む子宮内膜癌のリスクスコアリングモデル（Norwich DEFAB）を示した先行研究があった。著者らは、非常に大きなサンプルサイズ（閉経後女性3047人）を含み、子宮内膜厚< 5mmの女性はすべて子宮内癌でないという仮定で、症状のある閉経後女性すべてをリクルートした。研究対象者、サンプルサイズ、疾患の有病率など、我々の研究とは異なる点がいくつかあるものの、彼らの結果と我々の結果には多くの類似点があります。この点でも、彼らの子宮内膜癌の最良の予測因子は再発性膣出血（）であり、そのスコアは4であった。女性の年齢に関する最適なカットオフ値も我々の結果と同様であり、64歳以上の女性（スコア＝1）の方が癌のリスクが高いという結果であった。どちらのモデルでも、子宮内膜の厚さは子宮内悪性腫瘍の妥当な予測因子であったが、カットオフ値は異なっていた（14mm以上と9mm以上、それぞれ）。逆に、Burbosの研究で子宮内膜悪性腫瘍の有意な予測因子であった糖尿病とBMIは、我々の一変量解析では、子宮内膜癌のある女性とない女性の間に統計的な差はみられなかった。 Opolskieneらの研究でも同様の結果が示され、BMIと糖尿病に関しては、癌のある女性とない女性の間で一変量解析で差がなかった。

彼らのモデルと結果に基づき、Burbosらは判別のカットオフポイントとして、LR+が1.64、LR-が0.36であるスコア≧3を提案した。

私たちのリスクスコアリングモデルは、最適なカットオフスコア（≥4）で、LR-（0.16）となり、子宮内膜癌の検査後確率は1.9％であることが示されました。癌の見逃しを減らすことが第一の目的であることを考えると、このスコア値はその目的に対して十分な診断能を有しているといえる。スコア≧4は、少なくとも、子宮内膜の厚さが9mm以上で、再発性膣出血のある女性がいることを意味します。その場合、検査後の癌の確率は35.1％（）であったので、外来で子宮鏡検査またはソノヒストリーを行うことをお勧めします。後者の所見は、統計学的な観点から、子宮内膜癌の検査前確率が11.5％であることから、我々のモデルが偽陽性をも減少させることを示すものである。前述したように、癌の確率は低いが存在する（1.9％）ので、Burbosらが提案したアルゴリズムに従って、いくつかの管理オプションを提案した（図2）。もし子宮内膜の厚さが5〜8mmで、再発性膣出血（子宮内膜癌の最も強い予測因子）がなければ、外来で子宮内膜サンプリングを行い、陰性であれば、それ以上の評価を行うべきではない。子宮内膜の厚さが> 8mmの場合、外来で子宮内膜サンプリングを行い、陰性であれば、さらに超音波検査または内膜サンプリングによる精査を提案することができる；外来子宮鏡検査または超音波ヒステリー検査を行うこともできる。子宮内膜の厚さが5～8mmで、膣からの出血が再発する女性に対しても、同様の管理を採用すべきである。

図2

> 4 mmの閉経後女性症候性管理に対する決定アルゴリズムを示しているフローチャートである。

この臨床的アプローチにより、子宮内膜の評価だけでなく、より包括的な臨床評価に焦点を当てたリスク評価が可能になります。この点で、例えば、再発性膣出血と子宮内膜厚4mmの70歳の高血圧女性は、子宮内膜厚にもかかわらず、子宮内悪性腫瘍のリスクが高いため、診断用子宮鏡検査を行う必要があります

5. 結論

子宮内膜厚に患者の特徴をいくつか加えることで、子宮内膜厚> 4mmの症状のある閉経後女性における子宮内悪性腫瘍の検出において、中程度の診断精度のリスクスコアリングモデル（RHEA risk-model）を構築しました。

しかし、現時点では、我々の結果は一般化できるものではなく、外部検証のさらなる研究が必須であることを強調したい。

利益相反

著者らは、本論文の発表に関して利益相反はないことを宣言している。

要旨