大腸癌治療ガイドライン評価委員会
遺伝性大腸癌診療ガイドライン2020年版の外部評価は,偏りなく,質の評価を行うために内的妥当性としてAGREEⅡ日本語訳(公益財団法人 日本医療評価機構EBM医療情報部2016. 7)を用いてガイドラインの作成方法の評価を行い,外的妥当性として専門家の意見として日本の遺伝性大腸癌診療の現状に過不足ない内容が記載されているか否かについて評価した。遺伝性大腸癌診療ガイドライン作成委員会(以下,作成委員会)でガイドライン案が作成され,パブリックコメントに公開して良いか否か,大腸癌治療ガイドライン評価委員会(以下,評価委員会)で概略評価を行った後にパブリックコメントが募集された。作成委員会により指摘事項に関して協議が行われ最終案が作成され,評価委員会で最終評価を施行した。
ガイドライン作成方法についての評価として,7名のすべての委員がAGREEⅡ日本語訳に従って6領域23項目と全体評価2項目について作成方法の評価を行った(表1)。委員が各々の項目について評価尺度により評価(全くあてはまらない1から強くあてはまる7まで)を行い,獲得評点の平均および領域別評点を算出した。領域別評点は,各領域内の個々の項目の評点をすべて合計し,その合計点を各領域の最高評点に対するパーセンテージとして算出した。
領域別評点(%)=(獲得評点―最低評点)/最高評点―最低評点)
専門家の視点からの評価は,各専門家が担当分野について評価を提出し,さらに全体で協議してコンセンサスを得た。
表1 AGREEⅡを構成する6領域
領域1 | 対象と目的 |
---|---|
領域2 | 利害関係者の参加 |
領域3 | 作成の厳密さ |
領域4 | 提示の明確さ |
領域5 | 適用可能性 |
領域6 | 編集の独立性 |
領域別評点をみると,6領域のうち5領域(対象と目的,利害関係者の参加,作成の厳密さ,提示の明確さ,編集の独立性)が80%以上の評点を獲得しており,非常に高い評価であった(表2,図1)。しかしながら,適用可能性については,主要CQに対する全体的なアルゴリズムがなく,各論の説明文や各CQに散在している点,医療費やコストの記載は少ない点,ガイドラインのモニタリングや監査の基準に関する記載はない点が指摘された。
ガイドライン全体の質の評価(最高7点,最低1点)として,獲得評点の平均は5.6点で概ね良好な評価であった(表3)。また,このガイドラインの使用を推奨するかの問いに対して,推奨する5票,推奨する(条件付き)2票,推奨しない0票であり,条件付き推奨の原因として,以下の2項目が指摘された。第一に,疾患の定義,診断,治療,サーベイランスに関して,何が分かっていて,どこまでがエビデンスをもとにコンセンサスがとれていて,未解決の臨床的な疑問が何か,が読みにくく,系統だった記載になっていないこと。第二として,エビデンスの集積が十分でない状況で,推奨が決定されていることを認識した上で使用が望ましいことが指摘された。
以下,評価委員会において指摘され,作成委員会で再検討され,加筆・修正された項目のうち,重要と思われる指摘事項を列挙する。
CQのエビデンスレベルならびに推奨に関する合意形成については,デルファイ法など具体的なステップを明示することが望ましい。
CQのエビデンスと推奨をもう少しわかりやすく記述したほうが望ましい。
例えば,「する」「しない」の強い推奨がともに「1」だと,数字だけを見て「する」ことを強く推奨するのか,「しない」ことを強く推奨するのかの区別がつきにくい。
また,「D」で「1」だとすると,「エビデンスがないから『しない』ことを強く推奨する」になるが,「効果に差がないことがランダム化比較試験で検証されて『しない』ことを強く推奨する」とは「1」の意味合いが異なり,この判断で良いかの根拠が明確にされていない。
看護師や患者会も参加して作成されたことは確認できたが,どのように参加したかや意見がどう反映されたかの追記が望まれる。
全体(診断,治療,サーベイランス)とCQの関係を明示したほうが,利用のためのツール作成の観点で望ましい。
一部のCQでは記載があるが,メタアナリシス,ランダム化比較試験,前向き観察研究など,研究デザインを明示し,結果を数値として明示したほうがよいものは数値を具体的に記載する。
保険診療の範囲内であるか否か,明示しておく必要がある。また,費用対効果の記載が海外の検討だけだとわかりにくい点があるので,日本での金額等の記載が必要かを検討したほうが良い。
論文の批判的吟味からエビデンスレベルを決定,推奨が決定されている。しかしながら,遺伝性大腸癌に関するエビデンスは十分ではなく,本ガイドラインで作成された22のCQにおいてエビデンスレベルCまたはDが77.3%(17のCQ)を占めている。本邦における遺伝性大腸癌のエビデンスが集積され,高いエビデンスに基づき推奨の決定がなされるのが望ましい。以下,専門家の視点から指摘された項目のうち主要なものを列挙する。
家族性大腸腺腫症の随伴病変の項目の並びは1)十二指腸・癌,2)デスモイド腫瘍,3)その他の病変,が望ましい。
改訂点に家族性大腸腺腫症の死因の表の削除と本文中に死因頻度記載とあり,随伴病変のうち胃底腺ポリポーシス・胃腺腫に癌化の可能性を記載しているが,胃癌の死亡頻度について未記載となっている。2016年版では胃癌の死因頻度の掲載があるので数値の記載が望ましい。
大腸全摘・回腸人工肛門造設術(TPC)の利点「合併症は少ない」は,「縫合不全がない」,大腸全摘・回腸嚢肛門(管)吻合術(IPAA)の欠点「手術は複雑」は,「手術は高難度」などの表現が適切である。また,表内の表現で単語と文章が混在している。
本文中に家族性大腸腺腫症,リンチ症候群の予後に関する文章が確認できない。特にリンチ症候群には報告が複数ある。
2016年版も同様の順番であるが,付録,資料にも貴重な情報があるので,より読者の目につきやすい順序を検討すること。付録,資料,文献,など
あえて[付録]という文言を使う理由があるか。同様に資料で良いのではないか。
以上
表2 AGREEⅡ日本語訳によるガイドライン作成方法の評価結果
項目 | 獲得評点の平均 | 領域別評点(%) | 意見 | |
---|---|---|---|---|
領域1 対象と目的 |
1 ガイドライン全体の目的が具体的に記載されている。 | 5.3 | 86.5 | ・健康上の課題に対して期待されるべきアウトカムが,直接的に記載されていない。 |
2 ガイドラインが取り扱う健康上の問題が具体的に記載されている。 | 5.7 | ・介入やアウトカム記載なし。 ・対象疾患は家族性大腸腺腫症とリンチ症候群,と具体的に示されているが,症候群の詳細は示されない(表1,各疾患の「概要」の項,CQ11-13に述べられている)。だが,これらの疾患の治療のうち,本ガイドラインで扱うのは大腸病変のみなので,この表現で許容されるとも考えられる。 ・標準的な治療,診断,サーベイランスが何で,それに対して,新たにどういう課題があるのかがわかりにくい。 |
||
3 ガイドラインの適用が想定される対象集団(患者,一般市民など)が具体的に記載されている。 | 6.7 | ・家族,親族,どこまでが対象か明記なし。 ・「遺伝性大腸癌に対する一般臨床家の認知度は必ずしも高くない。」,「一般に公開し,医療者と患者の相互理解を深めること」,「家族性大腸腺腫症とリンチ症候群および関連する疾患の診療に従事する医師および医療関係者を対象とする。」の記載からは利用者が明確になっているとは言えない。 |
||
領域2 利害関係者の参加 |
4 ガイドライン作成グループには,関係する全ての専門家グループの代表者が加わっている。 | 6.3 | 82.5 | ・作成グループに方法論の専門家(システマティックレビューの専門家,疫学者,統計学者,図書館情報学専門家など)が含まれていない。 |
5 対象集団(患者,一般市民など)の価値観や希望が調べられた。 | 5.1 | ・患者会の代表者の意見がどう反映されたかがわからない。 ・1-3と裏表になる。医師と医療従事者のためのガイドライン,と明記されている=対象集団の価値観や好みは,個々の医療現場に任される |
||
6 ガイドラインの利用者が明確に定義されている。 | 6.4 | ・記載されている。 | ||
領域3 作成の厳密さ |
7 エビデンスを検索するために系統的な方法が用いられている。 | 6.1 | 86.9 | ・検索語の記載がなく,検索を再現できない。 ・小見出しの記載がない。 |
8 エビデンスの選択基準が明確に記載されている。 | 5.3 | ・批判的吟味,十分吟味との記載のみで具体的採用基準が示されていない。 | ||
9 エビデンスの総体(body of evidence)の強固さと限界が明確に記載されている。 | 5.7 | ・エビデンスの強弱がA~Dに分け示されており,「限界」を明確に示したものではない。 ・エビデンスレベル分類の記載はあるが採用したエビデンスの研究デザイン記載,利益と害の大きさについての記載が少ない。 ・GRADEを使ったとの記載はあるが,risk of biasの評価は不十分である。また,エビデンスがないものをエビデンスとしている点は問題である。例えば,サーベイランスの必要性を疾患リスクから推察しているが,サーベイランスのエビデンスではなく,それをもとに推奨を決定するのは誤っている。 |
||
10 推奨を作成する方法が明確に記載されている。 | 6.4 | ・投票により決定したことの記載はあるが,エビデンスレベルに対する判断は一律でなく,GRADEの考え方にそぐわない方法になっていることの記載がない。 | ||
11 推奨の作成にあたって,健康上の利益,副作用,リスクが考慮されている。 | 6.4 | ・利益と害の大きさについての記載が少ない。例えば,妊婦に対するリスクなどの記載はあるが,推奨の決定にあたってどう考慮されたかはわかりにくい。 | ||
12 推奨とそれを支持するエビデンスとの対応関係が明確である。 | 5.6 | ・一部エビデンスレベルと推奨の強さが不一致の部分が認められる。 ・エビデンスに対する推奨の決定が不明瞭である。また,対応するエビデンスがない場合,大腸がん全体のエビデンスを用いたり,疾患リスクから推察していたり,推奨がエビデンスを反映しているようには見えない。 |
||
13 ガイドラインの公表に先立って,専門家による外部評価がなされている。 | 6.9 | ・対象集団の代表が含まれていない。 | ||
14 ガイドラインの改定手続きが示されている。 | 6.9 | ・示されている。 | ||
領域4 提示の明確さ |
15 推奨が具体的であり,曖昧でない。 | 5.9 | 80.2 | ・CQ内にはおおよそ記述があるものの,推奨文が一意にならないものがある。文中ではいくつかの分岐があるものをまとめて推奨にしているのは曖昧な表現といえる。推奨にエビデンスの不確実性が反映されていない。 |
16 患者の状態や健康上の問題に応じて,異なる選択肢が明確に示されている。 | 6.0 | ・提示されてはいるが,読み取りにくい。 ・シンプルな医療者向けガイドラインを目指しており,治療の選択肢の詳細を網羅するのが目的ではない。 |
||
17 重要な推奨が容易に見つけられる。 | 5.6 | ・フローチャートも利用されているが,何が標準で,なぜ標準で,それに対して,臨床的疑問が何で,推奨が何か,というものがわからない。 ・主要CQに対応するアルゴリズムがなく,CQや推奨の重要度がわかりにくい。 |
||
領域5 適用可能性 |
18 ガイドラインの適用にあたっての促進要因と阻害要因が記載されている。 | 5.0 | 63.5 | ・これについての独立した項立てはない。促進要因については「総論」の「目的」に記されている。 ・カウンセリング,保険適用などの記載がある。しかしながら,遺伝子検査や予防的治療の保険収載に関する記載などについて阻害要因については記載がない。 |
19 どのように推奨を適用するかについての助言・ツールを提供している。 | 5.0 | ・「総論」の「作成法」に記述されている。 ・情報源はあるが,教育ツールや要約はない。 ・主要CQに対する全体的なアルゴリズムがなく,各論の説明文や各CQに散在している。 |
||
20 推奨の適用に対する,潜在的な資源の影響が考慮されている。 | 5.6 | ・医療費やコストの記載は少ない。 ・付録,がそれに当たると思われる。 |
||
21 ガイドラインにモニタリングや監査のための基準が示されている。 | 3.4 | ・当ガイドラインのモニタリングや監査の基準に関する記載はない。 | ||
領域6 編集の独立性 |
22 資金提供者の見解が,ガイドラインの内容に影響していない。 | 6.9 | 96.4 | ・資金源はきちんと記載されている。製薬会社や医療機器メーカーがほとんどであり,ガイドラインの内容への影響は無いと思われるが,完全に無しにするのは難しい(遺伝子パネル検査,抗癌剤や免疫チェックポイント阻害剤による治療,など)。 |
23 ガイドライン作成グループメンバーの利益相反が記録され,適切な対応がなされている。 | 6.7 | ・個人個人ではないが,全体のCOIが記載されている。 |
図1 領域別評点(%)
表3 ガイドライン全体の評価
ガイドライン 全体の評価 |
1 このガイドラインの全体の質を評価する。 | 獲得評点の平均5.6 |
---|---|---|
2 このガイドラインの使用を推奨する。 | 推奨する5票/推奨する(条件付き)2票/推奨しない0票 |