ページの先頭へ

最新の研究成果に基づいて定期的に更新している、
科学的根拠に基づくがん情報の要約です。

がんスクリーニングの概要(PDQ®)

  • 原文更新日 : 2017-04-21
    翻訳更新日 : 2017-06-19

がんスクリーニングの概要(PDQ®) PDQ Screening and Prevention Editorial Board

医療専門家向けの本PDQがん情報要約では、がんスクリーニングについて包括的な、専門家の査読を経た、そして証拠に基づいた情報を提供する。本要約は、がん患者を治療する臨床家に情報を与え支援するための情報資源として作成されている。これは医療における意思決定のための公式なガイドラインまたは推奨事項を提供しているわけではない。


本要約は編集作業において米国国立がん研究所(NCI)とは独立したPDQ Screening and Prevention Editorial Boardにより定期的に見直され、随時更新される。本要約は独自の文献レビューを反映しており、NCIまたは米国国立衛生研究所(NIH)の方針声明を示すものではない。

証拠の評価 疾患のスクリーニング

がんスクリーニング

潜在的な有益性および有害性

2017年、米国では1,688,780人ががんと診断され、600,920人ががんにより死亡すると推定される。 [1] スクリーニングの実施で避けられていたであろう早期死亡の推定値は3%から35%と、仮定によって異なる。死亡回避の潜在的能力に加え、スクリーニングは、がんの罹病率を軽減させるが、それは、初期がんの治療が、多くの場合、進行がんの治療ほど積極的ではないからである。

がんスクリーニングの潜在的な有益性は、いずれについてもいくつかの潜在的な有害性を考慮する必要がある。 [2] ほとんどのがんスクリーニング検査は非浸襲性もしくは低浸襲性であるが、即時型(大腸内視鏡検査の穿孔など)や遅発型(放射線照射による可能性のある発がん)の重篤な合併症の危険性をわずかに含む検査もある。その他の害悪として偽陽性の検査結果があり、これは患者を不安にさせ、不必要な侵襲性の高い診断方法の実施につながることがある。これらの侵襲的な診断手順には、重篤な合併症のリスクがある。これに比べあまり知られていない害悪に過剰診断があり、すなわち、スクリーニングによって検出されなければ臨床的に重要ではなかった筈の状態の診断である。微小な腫瘍の検出でスクリーニングの検査感度が高くなるにつれ、このような害悪の発生頻度が高くなっている。最後に、偽陰性のスクリーニング検査は、初期の臨床的な徴候や症状のあるがん患者を誤って安心させ、それにより実際の診断や効果的な治療を遅らせることがある。

複数の全身スクリーニング技術が用いられ、2009年に日本で発表されたがんスクリーニングプロジェクトの予備的結果は、スクリーニングでの偽陽性結果および潜在的な過剰診断の問題を明確に物語っている。 [3]

このプロジェクトには、2003年8月から2004年7月にかけて35歳以上の健康なボランティア1,217人が登録した。ボランティアは、日本の浜松ホトニクスおよび関係会社の従業員であった。参加者は全社的健康保険プログラムに登録され、大部分が胸部X線、便潜血(FOB)検査、上部消化管透視、マンモグラフィスクリーニングなど、年1回の従業員向け健康診断を何年にもわたって義務的に受けた。がんの既往のある20人の志願者は除外され、残りの1,197人の参加者が評価された。従業員はすべて、スクリーニングで発見されるがんに対するリスクは低いと考えられた。 [3]

すべての参加者に対して、フッ化デオキシグルコースポジトロン放射断層撮影、胸部および腹部コンピュータ断層撮影(CT)、脳および骨盤の磁気共鳴画像法(MRI)、がん胎児性抗原、がん抗原19-9(CA19-9)、扁平上皮がん抗原、50歳以上の男性に対する前立腺特異抗原、女性に対するがん抗原125(CA-125)などの血清腫瘍マーカーの分析、およびFOB検査による年1回の全身スクリーニングが提供された。

すべての検査結果について臨床的に特に関連のある分類が標準化され、画像検査では3つの独立した測定を合わせてコンセンサスの解決が図られている(詳細については、 [3] を参照のこと)。スクリーニングでは、いずれかの検査で悪性腫瘍が示唆された場合は陽性と分類され、このような場合、被験者はさらなる検査のために地域の病院に紹介されるか、スクリーニング施設で再検査が実施された。中間期がんの発生はその後のスクリーニングまたは問診で確認された。 [3]

18例は最初のスクリーニングにより、1例は2回目のスクリーニングで確認されるなど、病理学的に22例の原発がんが確認された。3つのがんが臨床徴候および症状のために診断された。複数の検査による全身検査の全般的な感度および特異度について、検査結果が悪性腫瘍を示すと考えられるか、悪性腫瘍を決定的に除外できない場合で感度は81.8%、特異度は70.6%(偽陽性率29.4%)と報告され、悪性腫瘍のみを示すより制限を付けたスクリーニング分類では、それぞれ68.2% vs 87.4%であった。

最初のスクリーニングで発見されたがんの発生は、日本において年齢でマッチさせた年間のがん発生推定値を3~4倍上回った。スクリーニングで発見されたいくつかのがんは緩慢性であったことが明らかになっており、がん死亡率に影響することなく長期間無害であった可能性がある。 [3]

また、前立腺がん、肺がん、大腸がん、および卵巣がんスクリーニングに関するランダム化比較試験の介入群からのデータを用いて、多様式の頻回のがんスクリーニングプログラムの潜在的な有害性も評価された。計68,436人の参加者は、性別にもよるが、3種類のがんについて、前立腺特異抗原(PSA)、直腸指診、経膣超音波検査、血清CA-125、胸部X線、および/またはS状結腸内視鏡検査を用いたスクリーニングを受けた。この研究により、4つのスクリーニング検査(試験では1日で行われた)後、少なくとも1つの偽陽性の検査結果を受け取った個人の累積確率は男性で37%、女性で26%であったことが明らかにされた。14回の検査(または3年間のスクリーニング)後、この確率は男性で60%、女性で49%に上昇した。14回の検査後、偽陽性検査による直接の結果として侵襲的手技を受ける累積確率は男性で29%、女性で22%であった。 [4]

過剰診断の場合、スクリーニングを受けた本人は、本質的にその潜在的な利益をなんら得ることができないばかりか、関連する有害事象を不必要な治療によるものを含めて経験する可能性があるため、スクリーニングの有害性が特に懸念される。過剰診断には、次の2つの種類がある:1)本質的に悪性度がない病変の検出(ときには「偽疾患」と呼ばれる);および2)本人は別の競合する死因により先に死亡してしまうほど増殖が遅い病変の検出。そのため、余命が限られた人を対象にスクリーニング検査を行うことは、過剰診断の重要な原因となる可能性がある。米国における現行の診療パターンの研究により、過剰診断の可能性が高く、有益性がきわめて低い状況で、がんスクリーニング検査がかなり多く利用されていることが実証されている。例えば、既知の進行がん(IIIB期~IV期の肺がん、IV期の大腸がん、IV期の胃食道がん、IV期の乳がん、進行期の膵がんなど)の診断を受けた65歳以上の患者を対象にルーチンのがんスクリーニングの利用状況を評価するために、研究者たちは、Surveillance, Epidemiology, and End Results(SEER)がん登録のデータをメディケアの請求データと結び付けた。そこで明らかになったことは、進行がんの診断が確定した女性の9%が、ルーチンのマンモグラフィによるスクリーニングを受け、6%がルーチンのパパニコロウスメアによるスクリーニングを受けていたこと;さらに、進行がんの診断が確定した男性の15%が依然としてルーチンのPSAスクリーニングを受けていたことである。進行がんの設定でルーチンのスクリーニングを受ける個人の最強予測因子は、診断される直前に受けていたスクリーニング歴であった。 [5]

がんの診断と自殺行為(既遂または未遂)の間には、診断後1年以内では関連がある。成人患者も青年患者も相対リスク1.6~2.0でこの関連が認められている。 [6] [7]

PDQスクリーニングおよび予防編集委員会は、がんスクリーニングの概要を作成するにあたり、以下の定義を用いる:


  • スクリーニングとは、無症状の人の疾患を早期発見する手段である。

  • 通常、スクリーニングに用いた試験、検査または方法によって得られた陽性の結果を診断に用いることはできないが、がんのリスクが高く、さらに評価が必要な者を特定することができる。

  • 診断とは、スクリーニング結果陽性後に、精密検査において、生検または組織検査によって疾患の確認を行うことである。(スクリーニング結果陽性後、がんはしばしば、生検または組織検査以外の方法によって除外されうる。)

本要約の目的は、スクリーニングの概要作成に用いられる、証拠に基づく明確なアプローチを示すことである。結論を下すにあたり、リスクと利益とのバランスに関する証拠が慎重に検討される。しかしながら、費用および費用対効果は考慮に入れていない。また、このようなスクリーニング検査に関連する証拠レベルの割り当ても考察する。

PDQでは、デザインにより、いずれの臨床診療ガイドラインも対象としていない。多くの公的健康機関が医療およびスクリーニング行為に対するガイドラインを提供しているが、これらのガイドラインの質は大きくばらついており [8] 、その1つの理由として、その内容が、質がさまざまな証拠を対象にした系統的レビューを基にして、それに依存した意見であるためである。Appraisal of Guidelines for Research and Evaluation(AGREE)により評価された最良のガイドラインは、Assessment of Multiple Systematic Reviews(AMSTAR)によって評価された最良の系統的レビューに基づいたものである。

情報を与えられた上で行う医学的意思決定とその共有

がんスクリーニングのガイドラインでは、スクリーニングへの参加について個人が情報を与えられた上で意思決定を行い、意思決定を共有することの重要性について次第に言及されている。がん予防、スクリーニング、および治療の潜在的な有益性と有害性に関する偏りがなくバランスの取れた情報は、患者が情報を与えられた上で行う意思決定において重要な役割を果たす。

大腸がん、乳がん、および前立腺がんのスクリーニングについて患者と医療提供者間の話し合い中に情報を与えられた上で行う意思決定に関する全国規模の調査において、患者は情報を与えられてはいるが、スクリーニングのリスクおよび有益性に関してはしばしば知識がないと考えていた。患者は、がんスクリーニングに対する好みについて通常は質問されなかったと報告した;90%以上の話し合いでスクリーニングの良い点について取り上げられたのに対し、スクリーニングの悪い点について取り上げられたのは30%以下であった。 [9]

がんスクリーニングの意思決定の多くで、意思決定の共有が提唱されており、これにより、医療提供者は患者が2つ以上の医学的に合理的な代替案から、情報を与えられた上で価値に基づく選択を行う手助けをする。 [10] [11] このことは、スクリーニングが潜在的に有害で、有益性が限られる場合に特に重要である。共有される意思決定には、以下の3つの要素がある: [12]

  1. 医療提供者は、有益性、有害性、および不確実性に関して証拠に基づく情報とともにスクリーニングの選択肢を共有する。
  2. 患者は医療提供者と好みを共有し、医療提供者は患者がこうした選択肢と好みを評価して意思決定を行う手助けをする。
  3. 医療提供者は患者の好みを記録して実行する手伝いをする。

患者の意思決定支援ツールは、情報を提供し患者が意思決定を行う手助けをする際に役立つ可能性がある。これらは、患者が目標と関心事に照らして証拠を解釈するように勧めている。意思決定支援ツールは、リーフレット、小冊子、ビデオ、ウェブサイトなど多くのさまざまな形式で利用できる。意思決定支援ツールによっては患者の話を載せているものもある。患者によって好みの形式は異なる場合がある。ほとんどの形式では、患者が医師とともに意思決定を行うように奨励している。International Patient Decision Aid Standards(IPDAS)Collaborationでは、意思決定支援ツールの質を評価するための方法を開発している。 [13]

意思決定支援ツールによりサポートされた意思決定の共有に関して115件のランダム化比較試験のコクランレビューでは、一般的に意思決定支援ツールは選択肢およびリスクに関する患者の知識を向上させる;情報を与えられていないまたは個人の価値について不確かであると感じていることに伴う意思決定における衝突を減らす;および意思決定において患者がより積極的な役割を担うように刺激することが示された。一部の症例では、意思決定支援ツールはまた、保存的な選択肢よりも侵襲性の高い待機的大手術を選択する患者の数を減少させることが示されており、がんスクリーニングを選択する患者が減少している。意思決定支援ツール使用による相談時間への影響はさまざまであり、相談時間は短くなる場合も、変化がない場合も、長くなる場合もある。 [14]

乳がんの過剰発見に関する情報を含む意思決定支援ツール使用後は、スクリーニングを受けるべきかどうかについて情報を与えられた上で意思決定を行う女性が増加し、全般的に十分な知識の閾値を満たした。過剰発見に関する情報を含んでいない意思決定支援ツールを使用した対照と比較して、スクリーニングに対して積極的な態度を示した女性または将来スクリーニングを受ける予定の女性は少なかった。 [15] より良好な情報を与えられた個人はがんスクリーニングへの参加を選択する可能性が低くなる場合がある。

概要の展開

このがんスクリーニングの概要は、これまでに報告されたさまざまなレベルの科学的証拠および蓄積した臨床経験に基づいている。最高レベルの証拠は、ランダム化比較臨床試験における死亡率の低下と考えられる。概要を作成するにあたり、臨床研究、ケースコントロール研究およびコホート研究の結果や他の情報も検討される。さらに、がんの発生率、病期分布、治療法および死亡率も考慮した。新たな証拠が得られた場合には、要約は修正される。

科学的根拠

スクリーニングが効果的なものとなるには、少なくとも2つの要件を満たさなければならない:

  1. 検査または手技は、がんを症状の発現によって発見される場合よりも早期に発見できるものでなければならない。
  2. 証拠は、スクリーニングの結果として治療を早期に開始したことが治療成績の改善をもたらしたといえるものでなければならない。

これらの要件は必要なものではあるが、スクリーニングの効果を証明するには十分ではなく、これを明らかにするには原因別死亡率の低下が必要となる。例えば、尿中のカテコールアミン代謝物の評価による小児神経芽腫のスクリーニングの場合には、これら2つの基準の1つだけが満たされた。埼玉県では1981年から1992年までの間に、生後6ヵ月の乳児を対象にマス・スクリーニングプログラムが実施された。 [16] この12年間で1歳未満児の神経芽腫の年間発生率は100万人当たり約28人から260人に増加したが、1歳以上児の発生率が際立って低下することはなかった。神経芽腫による死亡率も低下しなかったため、この経験から、後に臨床的に診断されることがないであろう神経芽腫がスクリーニングにより診断されるという過剰診断の強い証拠が得られた。同様の経験が日本 [17] 、およびカナダのケベック州神経芽腫スクリーニング・プロジェクト(QNSP)において報告されている。 [18] 神経芽腫のスクリーニング歴もまた、新たに登場したスクリーニングの技術に対してスクリーニングプログラムの実施前にデザインの優れた評価を行うことの利点について、有用な実例を提供するものである。このような研究は非常にコストがかかるが、QNSP自体が何千人もの小児の不必要な罹患を回避することが示されており、本研究においてはコストが投資の64.5倍削減されるともっともらしく推定される利益を生む一方で、その通りとなった。 [19]

発見

がんの発見に最も広く用いられている検査は、直接目視または器具を用いた目視である。これは皮膚、網膜、口唇、口、喉頭、外陰部および子宮頸部における疑わしい病変を確認する上で有用である。

2番目に最も広く用いられている手法は触診で、乳房、口、唾液腺、甲状腺、皮下組織、肛門、直腸、前立腺、精巣、卵巣および子宮における、しこり、小結節または腫瘍のほか、頸部、腋窩または鼠径部の腫大したリンパ節を検出する。

内部のがんには内視鏡、X線、MRI、または超音波などの手技または検査が必要である。特定のがんの発見には、パパニコロウスメアまたはFOB検査のような臨床検査が用いられている。

スクリーニング検査の検出力は通常、感度、特異度、陽性反応的中度(PPV)および陰性反応的中度(NPV)に基づいて評価する。感度は、がんのある人の検査結果が陽性である確率をいう。特異度は、がんのない人の検査結果が陰性である確率をいう。PPVは、検査結果が陽性の者にがんが認められる確率をいう。NPVは、検査結果が陰性の者にがんが認められない確率をいう。スクリーニングを受診した集団の有病率はPPVのほかに、これよりは小さいがNPVにも影響を及ぼす。一定の感度および特異度のもとでは、有病率が高いほどPPVも高い。

高リスク集団

がんの既往歴またはがんの強い家族歴を有する者のように、一部の人はがんのリスクが高いことが分かっている。つまり、遺伝子突然変異および遺伝子多型が特定のがんと関係していることが明らかにされるに従って、遺伝子検査によってますます高リスクの人が同定されるようになる。高リスク集団におけるほとんどのがんに関するスクリーニングの種類、間隔および開始年齢は、科学的に実施された研究から得られた証拠よりも医師の判断が反映される。このような場合には、最も適切なスクリーニング法の適用を決定するのに医師の判断が必要である。リスクの高い集団では慎重を期して、警戒を高めることが推奨される。これは少なくとも、高リスクの者を同定し、適切に助言し、一般集団に利益があることが知られているスクリーニング検査を定期的に実施することを意味している。

がんの再発

がんの再発に関する情報については、PDQの成人の治療の概要を参照のこと。

向上した治療成績

ほとんどすべてのがんに対し、治療法の選択肢と生存率は、一般的に病変の解剖学的拡がりによって特徴付けられる病期と関連している。このことから、早い段階でのがんの検出は、より良好な治療成績につながると推測される。1940年代、長期にわたる傾向を明らかにするため限局、領域および遠隔転移の総合的な病期分類が開発され、今日でも依然として有用なものとなっている。定期的に修正される、これよりも詳細なTNMの分類では、腫瘍(Tumor)の大きさ、リンパ節(lymph Node)の状態および遠隔転移(distant Metastases)の状態を分類する。以上の要素は、生存率との関係に応じて0期、I期、II期、III期そしてIV期に分類される。一般に、原発性悪性腫瘍が大きいほど隣接するリンパ節および遠隔部位への転移率が高くなる。病期は治療成績にきわめて大きな影響をもつため、治療のためのランダム化試験はすべて、治療成績の差を評価する上でほぼ同じ病期の比較が必要となる。病期の移行は、生存率の改善および死亡率の低下の先触れとなるが、病期の移行だけで利益を確立することはできない。

例えば悪性度、ホルモン感受性、および遺伝子の過剰発現などがんの生物学的な細胞特性はがんの挙動の重要な予測因子として認識されている。例えば、悪性度の高いがんは、診断時の病期にかかわらず、成長が速く転移も早い。したがって、これらのがんを小さな状態で検出しても、治療成績には影響しないであろう。スクリーニングの有益性の判断に、ランダム化比較試験が最も決定的である。

診断時に観察されているがんの病期パターン

米国国立がん研究所のThe Surveillance, Epidemiology, and End Results(SEER)Programでは、米国の人口の約14%にあたる11地域から得られたがん発生率データを収集している。この(1973年から現在までの)長期間にわたる集団ベースのデータは、病期別の生存率を監視する上で唯一の重要な情報源である。

相対生存率における経時的変化の解釈

一定の人口集団の全症例を含むSEERのようながん登録データに基づく場合でも、経時的な生存率の増大を解釈するのは困難である。この増大は早期発見あるいは治療法の改善またはその双方による利益を反映しているかもしれないが、スクリーニングによって一般に生じるリードタイムバイアスおよび過剰診断の結果の可能性もある。

リードタイムバイアスでは、がんが臨床的に診断される以前の期間が生存の計算に含まれるため、スクリーニングによって同定されたがん患者の推定生存期間が長くなる。

過剰診断は、決して臨床的に発現しないであろうがんが、発見されることによって生じる。定義上、これらのがんは予後良好である。例えば、剖検シリーズから前立腺がん以外の原因により死亡した高齢男性に潜伏性の初期前立腺がんが高率に認められることが明らかにされている。 [20] スクリーニングによってこのようながんが発見されることにより症例数が増加し、見かけ上、病期が移行し、生存率または治癒率が増加するが、死亡率は必ずしも低下するとは限らない。SEER Programが1950年から1996年までの間に報告したデータを分析したところ、20種類の主要ながんの5年相対生存率にみる経時的変化は、同じ期間の同じがんによる死亡率の動向と必ずしも相関しないことが分かった。 [21] この著者らは、5年生存率の変化はおおむね、早期診断および臨床的に現れることのない臨床前期例の検出によるものとしている。この著者らは、早期診断または早期治療の有効性については、5年生存率の時間的な変化から推定するべきではなく、むしろ死亡率の変化から推定する必要があるという結論を下している。このように、5年生存率の変化または病期の移行は、初期がんに対するスクリーニングの有効性を評価するのに適切ではない。進行したがんの発生率の低下は、5年生存率の動向よりもスクリーニングによる向上を示す良好な指標であるが、このような証拠は死亡率の低下に比べると説得力は弱い。

研究デザイン

ある特定の概要を裏付けるためにさまざまな研究デザインを用いて実施された研究からの知見が入手可能な場合がある。最も強いデザインはランダム化比較試験である。しかしながら、スクリーニングの領域を取り巻く問題に対処するためにこのような試験を実施するのは、必ずしも現実的であるとは言えない。証拠記述の各要約には、関連する研究デザインの強さが記載される。証拠の判断に一般的に用いられる5つの研究デザインがある。デザインの強さ順に、次の5段階のレベルがある:

  1. 複数のランダム化比較試験から得られた証拠。
  2. 複数の非ランダム化比較試験から得られた証拠。
  3. 複数のコホートまたはケースコントロール研究から得られた証拠。
  4. 複数の生態学的研究および記述研究から得られた証拠(例えば、国際パターン研究、時系列研究)。
  5. 臨床経験、記述研究または専門委員会の報告に基づく権威の意見。

実験的研究は、健康上のアウトカムに対する効果を明らかにすべく検出方法をプロスペクティブに検討する場合に、選択バイアス、リードタイムバイアス、レングスバイアス、健康な志願者バイアスをはじめとするバイアスを調整するか排除するようにデザインされたものである。最も高いレベルの証拠で、スクリーニングにより得られる最大の利益は、ランダム化比較試験における死亡率の低下である。ほとんどの場合、このような証拠を入手することができない。理論的にはほとんどの介入についてランダム化試験を実施することは可能であるが、ほとんどのがんに関するこのような試験の必要とされるサンプルサイズ、費用、および実施期間の問題から、このアプローチは非現実的であることが多い。このため、多くの場合、他の方法によって得られた証拠が用いられる。

場合によっては、新たなスクリーニング方法を評価するため死亡率の低下を使用する代わりの予備的な方法として、新しい検査と「標準の」スクリーニング方法を比較するランダム化試験において観察されるがんの期間発生率(interval cancer rate)が比較的短期間(例、数年間)比較される。新しいスクリーニング検査に疾患特異的死亡率を改善する可能性があれば、その検査を別の期間に繰り返し実施することで、陰性と陰性のスクリーニング検査結果の間に(スクリーニングを受けた種類の)症状を認めるがんを発症する介入群の患者の割合が低下する筈である。つまり、早期発見と結果としての治療が増加することによって、新しいスクリーニング検査は臨床的に重要な無症状の病変の多くが顕性のがんに進行するのを防ぐ。研究の参加者が新しいスクリーニング方法と従来のスクリーニング方法の両方を受ける横断的感度比較とは異なり、この試験デザインではスクリーニング検査により生じる過診断の程度の評価が可能である。この比較は、ランダム化比較試験で実施すべきである。 [22]

ケースコントロール研究およびコホート研究により、スクリーニングの有効性について間接的な証拠が得られるが、これらの研究で明白な選択バイアスおよび健常志願者バイアスの寄与を推定することは困難である。

生態学的研究により、スクリーニングの使用と、スクリーニングの価値の間接的な証拠が得られるがんの病期のシフトとの関連が証明される可能性がある。このような証拠は、特に子宮頸がんのスクリーニングの有効性の有力な証拠となっている。 [23] 死亡率とスクリーニングの強度との生態学的相関関係が、この文脈で用いられてきた。このような研究は死亡率減少の効果を証明せず、非実験的研究による推測を無効にするか、誤解を招くような結果を生じるようなバイアスの可能性は相当大きい。 [24] [25] [26] [27] [28] [29]

個々の医師の経験、病院および非集団ベースのがん登録に基づく記述的な対照のない研究から、スクリーニングに関して何らかの情報が得られる。一般に、このような記述的研究ではまず感度、特異度およびPPVのような、種々の検査の検出力が報告される。スクリーニングが奏効したことを示す最初の証拠は、初期がんの発生率の増加および進行した転移がんの発生率の低下であり(病期の移行)、その後は、死亡率の低下である。このような記述的研究では適切な対照群が設けられていないため、効果を確立することはない。

PDQ検診および予防委員会により、スクリーニング検査の有益性と有害性に関する証拠が全体としてどのように格付けされるかのより詳しい記述は、がんのスクリーニング(検診)と予防の研究に関する証拠レベルのPDQ要約で見ることができる。

シミュレーションモデル

がんスクリーニングに関するデータを系統立てて表すための別のアプローチはモデリングである。モデルによって、経験的証拠が存在しない状況でもがんスクリーニングに関する情報を生成できる可能性がある。多くの確率モデルおよびコンピュータシミュレーションモデルが以下を行うために開発されている:


  • がん発見における傾向を分析し、こうした傾向と全国または地域のデータベースで報告されている傾向とを比較する。

  • さまざまなスクリーニング戦略の費用対効果を調査する。

  • スクリーニングの結果として起こる過剰診断の推定を試みる。

この分野における主な取り組みは、米国国立がん研究所のCancer Intervention and Surveillance Modeling Network(CISNET)プログラムによるシミュレーションモデリングである。乳がん、大腸がん、肺がん、前立腺がん、子宮頸がん、および食道がんについてスクリーニングの影響を調査するためのモデルが開発されている。例としては、前立腺がんスクリーニングのためのモデルがあり、前立腺がん治療の変化、一次治療後の疾患管理の改善、スクリーニングが組み合わさって、前立腺がん死亡率の低下に貢献したことが示唆されている。 [30] 別の例では、スクリーニングの開始年齢(40歳、45歳、または50歳)およびスクリーニング間隔(年1回、2年に1回、またはこれらの組み合わせ)の差を含めて8つのスクリーニング戦略を調査した後、乳がんスクリーニング戦略の有益性と有害性がモデル化されている。 [31] また、CTを用いる肺がんスクリーニングの有益性と有害性の調査では、さまざまな適格性基準(年齢、パック年単位での喫煙歴、禁煙年数)、スクリーニング間隔(1年、2年、または3年)、およびスクリーニング開始年齢(45歳、50歳、55歳、または60歳)と終了年齢(75歳、80歳、または85歳)による576通りの異なるシナリオが比較された。 [32]

すべてのモデルについての重大な警告は、モデルの良し悪しは、モデルの元になっている仮定(特に、対象となっている疾患の未知の自然史に関する仮定)次第であるということである。多くのモデルが複雑であるため、構成要素の相互作用および結果が生成される過程を理解するのは困難である。さらに、モデルではしばしばリードタイムバイアスおよびレングスバイアスの説明が適切ではなく、そのためスクリーニングの有益性が過大評価される。また、モデルではしばしば、モデルに入力されるべきデータの範囲を超えた外挿である結果が生成される。そのため、モデルの知見を解釈する場合には注意が必要である。

エンドポイントとしての疾患別死亡率および全原因死亡率

疾患別死亡率は、がんスクリーニングのランダム化臨床試験において最も広く受け入れられているエンドポイントである;しかしながら、このエンドポイントの妥当性は、死因を正確に決定できること、およびスクリーニングとその後の治療が他の死因に及ぼす影響を無視できるという基本的な仮定の上に成り立っている。がんスクリーニングに関するランダム化臨床試験の最近のレビューでは、死因の誤分類が重要な問題となっており、誤分類はスクリーニングの有効性の過大評価(または害の過小評価)につながると示されている。 [33] [34] [35] 疾患別死亡率とは対照的に、全死亡率は死亡および死亡時期の正確な確認のみに依存するため、死因の誤分類の影響を受けない。しかしながら、エンドポイントとしての全死亡率には、大きな制約が1つあり、それはこの介入が通常、全死亡のうちわずかな割合の死亡の原因疾患を対象とするため、がんスクリーニングによる統計的に有意な効果が明確になりにくいからである。それでも、スクリーニングの主な害(または利益)が死因の誤分類によって隠されてしまう可能性を小さくするために、全死亡率を疾患別死亡率と関連させて検討すべきである。

重要な問題(両方のエンドポイントを研究することで対処可能である)は、スクリーニングにより実際に命が救われるかどうかである。スクリーニングにより全原因死亡率が低下するかどうかを明らかにするため、いくつかのがんを含めて、死亡が一般的な転帰である疾患について、メタアナリシスおよびランダム化試験の系統的レビューが実施された。乳がんに対するマンモグラフィおよび大腸がんに対するS状結腸鏡検査および便潜血検査が、疾患特異的死亡率の低下をもたらした唯一のがんスクリーニング介入であったが、全原因死亡率の低下をもたらした検査はなかった。 [36]

リスクの尺度

がんの研究ではいくつかのリスクの評価尺度が用いられている。絶対リスクまたは絶対割合は、集団またはサブグループにおける実際のがんのリスクまたは割合を調べる(例えば、全米集団、あるいは、米国の白人またはアフリカ系アメリカ人)。例えば、SEER Programでは、米国の特定の地域におけるがんのリスクおよび割合を報告している。

時間のまたは群間の比較をより正確に行えるようにするため、割合はしばしば調整される(例、年齢調整率)。調整の目的は、結論に影響を及ぼしうる重要な特徴について、各グループをより同等にすることにある。例えば、SEER Programで米国におけるがんの割合を経時的に比較する場合、ある年齢分布に合わせて割合を調整する。もし調整が行われないと、その米国の母集団が高齢化していることおよび年齢が高いグループほどがんのリスクが高いという単純な理由で、がんの割合が時間とともに増大するかのごとくみえる。

相対リスク(RR)とは、特定の特徴をもつかまたは特定の何かに曝露している群にみられるがん発生リスクを、そうではない群のリスクと比較したものである。RRはリスクまたは率の比によって表され、この値は、無限から逆の無限(すなわち、ゼロ)まで幅がある。RRが1を超える場合には、その曝露または特徴は高いがんリスクと関連し、RRが1の場合には曝露とがんは互いに関連しない;RRが1未満の場合には曝露は低いがんリスクと関連する(すなわち、曝露によってがんが予防される)。RRは、がんリスクまたはがん死リスクの低下を推定するため、それぞれがん予防およびスクリーニングの臨床試験でしばしば使用される。

オッズ比(OR)は、RRの推定値としてしばしば用いられる。これもまた、曝露または特徴とがんとの間に関連がみられるかどうかを示すものである。これは、がん症例群の曝露または特徴のオッズをがんに罹患していない対照群のオッズと比較したものである。ORは割合(率)またはリスクほど直観的に理解されていないものの、リスクの他の尺度が妥当でないある条件において、統計的により妥当な場合があるために用いられる。オッズ比はがんの診断のような比較的まれな事象/疾患では、RRと同じように解釈することができる;しかしながら、研究対象集団において、基となる疾患の絶対リスクが10%を超えると、次第にRRの不確かな推定値となる。オッズ比は、一般的にはケースコントロール研究で、がんの潜在的危険因子または予防因子を明らかにするために用いられる。

リスク差または率差(または過剰リスク)は、重要な性質または曝露に基づき、いずれかの群のリスクまたは率をもう一方から引くことにより、2群以上の集団にみられる実際のがんリスクまたは率を比較したものである(例えば、非喫煙者にみられる肺がん率をタバコ喫煙者の肺がん率から引いたものが喫煙による肺がんの過剰リスクを推定する)。これは、公衆衛生において、当該集団で曝露が軽減ないし消失した場合に回避されうるがんの症例数を求めるのに用いることができる。

人口寄与リスクは、特定の曝露または特徴に起因すると考えられるがんの比を測定したものである。これは特定の曝露と関連するがんのRRに関する情報と、当該集団の曝露率とを組み合わせたものであり、これによって、ある集団で曝露が軽減ないし消失した場合に回避されうるがん症例の割合を求めることができる。

スクリーニングに必要な対象者数とは、定義された期間を通してがん死1例を予防するためのスクリーニングプログラムに必要な人数を推定したものである。

平均救命年数(Average life-years saved)とは、介入を受ける個人についてその介入により救われる生存年数を平均値で推定するものである。これは、死亡率の低下および延命効果(または早期の死亡の回避)を反映する。


参考文献
  1. American Cancer Society: Cancer Facts and Figures 2017. Atlanta, Ga: American Cancer Society, 2017. Available online. Last accessed January 13, 2017.[PUBMED Abstract]

  2. Kramer BS: The science of early detection. Urol Oncol 22 (4): 344-7, 2004 Jul-Aug.[PUBMED Abstract]

  3. Nishizawa S, Kojima S, Teramukai S, et al.: Prospective evaluation of whole-body cancer screening with multiple modalities including [18F]fluorodeoxyglucose positron emission tomography in a healthy population: a preliminary report. J Clin Oncol 27 (11): 1767-73, 2009.[PUBMED Abstract]

  4. Croswell JM, Kramer BS, Kreimer AR, et al.: Cumulative incidence of false-positive results in repeated, multimodal cancer screening. Ann Fam Med 7 (3): 212-22, 2009 May-Jun.[PUBMED Abstract]

  5. Sima CS, Panageas KS, Schrag D: Cancer screening among patients with advanced cancer. JAMA 304 (14): 1584-91, 2010.[PUBMED Abstract]

  6. Lu D, Fall K, Sparén P, et al.: Suicide and suicide attempt after a cancer diagnosis among young individuals. Ann Oncol 24 (12): 3112-7, 2013.[PUBMED Abstract]

  7. Baade PD, Fritschi L, Eakin EG: Non-cancer mortality among people diagnosed with cancer (Australia). Cancer Causes Control 17 (3): 287-97, 2006.[PUBMED Abstract]

  8. Burda BU, Norris SL, Holmer HK, et al.: Quality varies across clinical practice guidelines for mammography screening in women aged 40-49 years as assessed by AGREE and AMSTAR instruments. J Clin Epidemiol 64 (9): 968-76, 2011.[PUBMED Abstract]

  9. Hoffman RM, Lewis CL, Pignone MP, et al.: Decision-making processes for breast, colorectal, and prostate cancer screening: the DECISIONS survey. Med Decis Making 30 (5 Suppl): 53S-64S, 2010 Sep-Oct.[PUBMED Abstract]

  10. O'Connor AM, Llewellyn-Thomas HA, Flood AB: Modifying unwarranted variations in health care: shared decision making using patient decision aids. Health Aff (Millwood) Suppl (Variation): VAR63-72, 2004.[PUBMED Abstract]

  11. Charles C, Gafni A, Whelan T: Shared decision-making in the medical encounter: what does it mean? (or it takes at least two to tango). Soc Sci Med 44 (5): 681-92, 1997.[PUBMED Abstract]

  12. Coulter A, Collins A: Making Shared Decision-Making a Reality: No Decision About Me, Without Me. London, UK: The King's Fund, 2011. Also available online. Last accessed April 21, 2017.[PUBMED Abstract]

  13. Elwyn G, O'Connor A, Stacey D, et al.: Developing a quality criteria framework for patient decision aids: online international Delphi consensus process. BMJ 333 (7565): 417, 2006.[PUBMED Abstract]

  14. Stacey D, Hawker G, Dervin G, et al.: Decision aid for patients considering total knee arthroplasty with preference report for surgeons: a pilot randomized controlled trial. BMC Musculoskelet Disord 15: 54, 2014.[PUBMED Abstract]

  15. Hersch J, Barratt A, Jansen J, et al.: Use of a decision aid including information on overdetection to support informed choice about breast cancer screening: a randomised controlled trial. Lancet 385 (9978): 1642-52, 2015.[PUBMED Abstract]

  16. Yamamoto K, Hayashi Y, Hanada R, et al.: Mass screening and age-specific incidence of neuroblastoma in Saitama Prefecture, Japan. J Clin Oncol 13 (8): 2033-8, 1995.[PUBMED Abstract]

  17. Bessho F: Effects of mass screening on age-specific incidence of neuroblastoma. Int J Cancer 67 (4): 520-2, 1996.[PUBMED Abstract]

  18. Woods WG, Tuchman M, Robison LL, et al.: A population-based study of the usefulness of screening for neuroblastoma. Lancet 348 (9043): 1682-7, 1996 Dec 21-28.[PUBMED Abstract]

  19. Soderstrom L, Woods WG, Bernstein M, et al.: Health and economic benefits of well-designed evaluations: some lessons from evaluating neuroblastoma screening. J Natl Cancer Inst 97 (15): 1118-24, 2005.[PUBMED Abstract]

  20. Woolf SH: Screening for prostate cancer with prostate-specific antigen. An examination of the evidence. N Engl J Med 333 (21): 1401-5, 1995.[PUBMED Abstract]

  21. Welch HG, Schwartz LM, Woloshin S: Are increasing 5-year survival rates evidence of success against cancer? JAMA 283 (22): 2975-8, 2000.[PUBMED Abstract]

  22. Irwig L, Houssami N, Armstrong B, et al.: Evaluating new screening tests for breast cancer. BMJ 332 (7543): 678-9, 2006.[PUBMED Abstract]

  23. Hakama M, Miller AB, Day NE, eds.: Screening for cancer of the uterine cervix. Lyon, France: International Agency for Research on Cancer, 1986.[PUBMED Abstract]

  24. Connor RJ, Prorok PC, Weed DL: The case-control design and the assessment of the efficacy of cancer screening. J Clin Epidemiol 44 (11): 1215-21, 1991.[PUBMED Abstract]

  25. Friedman DR, Dubin N: Case-control evaluation of breast cancer screening efficacy. Am J Epidemiol 133 (10): 974-84, 1991.[PUBMED Abstract]

  26. Janzon L, Andersson I: The Malmo mammographic screening trial. In: Miller AB, Chamberlain J, Day NE, et al., eds.: Cancer Screening. Cambridge: Cambridge University Press, 1991, pp 37-44.[PUBMED Abstract]

  27. Moss SM: Case-control studies of screening. Int J Epidemiol 20 (1): 1-6, 1991.[PUBMED Abstract]

  28. Weiss NS, Lazovich D: Case-control studies of screening efficacy: the use of persons newly diagnosed with cancer who later sustain an unfavorable outcome. Am J Epidemiol 143 (4): 319-22, 1996.[PUBMED Abstract]

  29. Suzuki KJ, Nakaji S, Tokunaga S, et al.: Confounding by dietary factors in case-control studies on the efficacy of cancer screening in Japan. Eur J Epidemiol 20 (1): 73-8, 2005.[PUBMED Abstract]

  30. Etzioni R, Gulati R, Tsodikov A, et al.: The prostate cancer conundrum revisited: treatment changes and prostate cancer mortality declines. Cancer 118 (23): 5955-63, 2012.[PUBMED Abstract]

  31. Mandelblatt JS, Stout NK, Schechter CB, et al.: Collaborative Modeling of the Benefits and Harms Associated With Different U.S. Breast Cancer Screening Strategies. Ann Intern Med 164 (4): 215-25, 2016.[PUBMED Abstract]

  32. de Koning HJ, Meza R, Plevritis SK, et al.: Benefits and harms of computed tomography lung cancer screening strategies: a comparative modeling study for the U.S. Preventive Services Task Force. Ann Intern Med 160 (5): 311-20, 2014.[PUBMED Abstract]

  33. Black WC: Overdiagnosis: An underrecognized cause of confusion and harm in cancer screening. J Natl Cancer Inst 92 (16): 1280-2, 2000.[PUBMED Abstract]

  34. Olsen O, Gøtzsche PC: Screening for breast cancer with mammography. Cochrane Database Syst Rev (4): CD001877, 2001.[PUBMED Abstract]

  35. Black WC, Haggstrom DA, Welch HG: All-cause mortality in randomized trials of cancer screening. J Natl Cancer Inst 94 (3): 167-73, 2002.[PUBMED Abstract]

  36. Saquib N, Saquib J, Ioannidis JP: Does screening for disease save lives in asymptomatic adults? Systematic review of meta-analyses and randomized trials. Int J Epidemiol 44 (1): 264-77, 2015.[PUBMED Abstract]

 | 

本要約の変更点(04/21/2017)

PDQがん情報要約は定期的に見直され、新情報が利用可能になり次第更新される。本セクションでは、上記の日付における本要約最新変更点を記述する。

がんスクリーニング

新規症例数および死亡数の推定値に関する統計が2017年度用に更新された(引用、参考文献1としてAmerican Cancer Society)。

本文に以下の記述が追加された;3つのがんが臨床徴候および症状のために診断された。

本要約はPDQ Screening and Prevention Editorial Boardが作成と内容の更新を行っており、編集に関してはNCIから独立している。本要約は独自の文献レビューを反映しており、NCIまたはNIHの方針声明を示すものではない。PDQ要約の更新におけるPDQ編集委員会の役割および要約の方針に関する詳しい情報については、本PDQ要約についておよびPDQ® - NCI's Comprehensive Cancer Databaseを参照のこと。

 | 

本PDQ要約について

本要約の目的

医療専門家向けの本PDQがん情報要約では、がんスクリーニングについて包括的な、専門家の査読を経た、そして証拠に基づいた情報を提供する。本要約は、がん患者を治療する臨床家に情報を与え支援するための情報資源として作成されている。これは医療における意思決定のための公式なガイドラインまたは推奨事項を提供しているわけではない。

査読者および更新情報

本要約は編集作業において米国国立がん研究所(NCI)とは独立したPDQ Screening and Prevention Editorial Boardにより定期的に見直され、随時更新される。本要約は独自の文献レビューを反映しており、NCIまたは米国国立衛生研究所(NIH)の方針声明を示すものではない。

委員会のメンバーは毎月、最近発表された記事を見直し、記事に対して以下を行うべきか決定する:


  • 会議での議論、

  • 本文の引用、または

  • 既に引用されている既存の記事との入れ替え、または既存の記事の更新。

要約の変更は、発表された記事の証拠の強さを委員会のメンバーが評価し、記事を本要約にどのように組み入れるべきかを決定するコンセンサス過程を経て行われる。

本要約の内容に関するコメントまたは質問は、NCIウェブサイトのEmail UsからCancer.govまで送信のこと。要約に関する質問またはコメントについて委員会のメンバー個人に連絡することを禁じる。委員会のメンバーは個別の問い合わせには対応しない。

証拠レベル

本要約で引用される文献の中には証拠レベルの指定が記載されているものがある。これらの指定は、特定の介入やアプローチの使用を支持する証拠の強さを読者が査定する際、助けとなるよう意図されている。PDQ Screening and Prevention Editorial Boardは、証拠レベルの指定を展開する際に公式順位分類を使用している。

本要約の使用許可

PDQは登録商標である。PDQ文書の内容は本文として自由に使用できるが、完全な形で記し定期的に更新しなければ、NCI PDQがん情報要約とすることはできない。しかし、著者は“NCI's PDQ cancer information summary about breast cancer prevention states the risks succinctly: 【本要約からの抜粋を含める】.”のような一文を記述してもよい。

本PDQ要約の好ましい引用は以下の通りである:

PDQ® Screening and Prevention Editorial Board.PDQ Cancer Screening Overview.Bethesda, MD: National Cancer Institute.Updated <MM/DD/YYYY>.Available at: https://www.cancer.gov/about-cancer/screening/hp-screening-overview-pdq.Accessed <MM/DD/YYYY>.[PMID: 26389235]

本要約内の画像は、PDQ要約内での使用に限って著者、イラストレーター、および/または出版社の許可を得て使用されている。PDQ情報以外での画像の使用許可は、所有者から得る必要があり、米国国立がん研究所(National Cancer Institute)が付与できるものではない。本要約内のイラストの使用に関する情報は、多くの他のがん関連画像とともにVisuals Online(2,000以上の科学画像を収蔵)で入手できる。

免責条項

これらの要約内の情報は、保険払い戻しの決定基準として使用されるべきものではない。保険の適用範囲に関する詳しい情報については、Cancer.govのManaging Cancer Careページで入手できる。

お問い合わせ

Cancer.govウェブサイトについての問い合わせまたはヘルプの利用に関する詳しい情報は、Contact Us for Helpページに掲載されている。質問はウェブサイトのEmail UsからもCancer.govに送信可能である。

 |