赤身肉・加工肉の発がん性評価を巡る論争の大きな影響
唐木 英明
東京大学名誉教授
はじめに
公衆衛生学において、食習慣と慢性疾患の因果関係を特定することは最も困難な領域の一つである。2015年、世界保健機関(WHO)の外部組織である国際がん研究機関(IARC)が、赤身肉および加工肉の発がん性に関する評価結果を公表した際、世界の食肉産業および公衆衛生政策に激震が走った。IARCは、加工肉を「ヒトに対して発がん性がある(グループ1)」、赤身肉を「ヒトに対しておそらく発がん性がある(グループ2A)」に分類し、特に大腸がんとの関連を指摘した。ところが、その4年後の2019年、国際研究グループNutriRECSが、IARCが採用した証拠の確実性が極めて低いとして、成人は赤身肉および加工肉の現在の摂取習慣を継続することを推奨したのである。この事態は、科学的事実を認定するための「方法論」そのものを巡る対立へと発展した。その背後には「ヒル基準」と「GRADE」という二つの評価体系の相違がある。
1.IARCによる発がん性評価の論理
IARCは、特定の物質や曝露要因がヒトにがんを引き起こす能力があるかどうかの「ハザード(危険性)」を特定することを目的とする。2015年10月、10カ国22人の専門家からなる作業部会がリヨンのIARC本部に招集され、赤身肉と加工肉に関する評価が行われた。作業の内容は、世界各地の多様な食習慣を持つ集団を対象とした800件以上の疫学研究のレビューである。
| 対象 | 定義 | 評価 | 主な関連がん種 |
|---|---|---|---|
| 加工肉 | 塩蔵、熟成、発酵、燻製などの処理により風味向上や保存性を高めた肉(ハム、ソーセージ、ベーコン、缶詰、肉ベースのソースなど) | グループ1(発がん性がある) | 大腸がん(十分な証拠)、胃がん(限定的な証拠) |
| 赤身肉 | 牛肉、仔牛肉、豚肉、羊肉、ヤギ肉、馬肉などの哺乳類の筋肉部位 | グループ2A(おそらく発がん性がある) | 大腸がん、膵臓がん、前立腺がん |
その結果、加工肉に関しては、ヒトにおける発がん性の「十分な証拠」があると認定した。これは、疫学研究において加工肉の摂取量と大腸がんの発生との間に相関が認められたことを意味する。そして、加工肉を1日に50g摂取するごとに、大腸がんのリスクが約18%上昇すると発表した。
一方、赤身肉については「限定的な証拠」に留まった。これは相関は観察されているものの、交絡要因を完全には排除できない状態を指す。ただし、「メカニズムの強い証拠」が存在したことが、グループ2Aへの分類を決定づけた。そして、1日あたり100gの摂取ごとに大腸がんのリスクが17%上昇する可能性を示唆した。
メカニズムとは、調理や加工の過程で生成される化学物質である。肉が加熱される際、ヘテロサイクリックアミンや多環芳香族炭化水素といった発がん性物質が生成される。加工工程での塩蔵や燻製により、N-ニトロソ化合物が形成される。また、赤身肉に豊富に含まれるヘム鉄が大腸内で脂質の過酸化を促進し、N-ニトロソ化合物を生成することも、大腸がんの腫瘍形成を促進する重要なメカニズムとされている。
IARCが行ったのは「ハザード評価」であり、「リスク評価」ではない。にもかかわらず、加工肉を1日に50g摂取するごとに、大腸がんのリスクが約18%上昇するという「リスク評価」を発表したことが、大きな論争を引き起こすことになった。この数値は、大腸がんになる相対リスクが1.18倍になることを意味する。疫学では、一般に、相対リスクの大きさによって相関の強さを以下のように分類する。3倍以上では強い相関(因果関係の可能性が高い)、1.5~3倍では中程度の相関、1.2~1.5倍では弱い相関、1.2~0.9倍ではほとんど相関なし(または無視できる)。この分類によれば、加工肉の1.18倍というリスクはほとんど無視できる。
2.NutriRECSによる異議申し立て
IARCの評価公表から4年後、NutriRECSは、赤身肉および加工肉の摂取に関する正反対の見解を発表した。5つの新しい文献レビューに基づき、現在の摂取量を減らす必要はないとの結論を下したのだ。NutriRECSの推奨は、成人に対し、未加工の赤身肉の摂取を現在のレベルで継続することを提案(弱い推奨、確実性の低い証拠)し、加工肉の摂取を現在のレベルで継続することを提案(弱い推奨、確実性の低い証拠)するものである。
IARCとの違いは、IARCが「相対リスク」を強調してきたのに対し、NutriRECSは「絶対リスク」と「証拠の確実性」を重視したことにある。相対リスクとは「その原因によって、リスクは何倍になるのか」であり、絶対リスクとは「結局、自分は何%の確率で病気になるのか」である。NutriRECSの分析でも、赤身肉や加工肉の摂取を減らすことで、全死因死亡、心血管疾患死亡、がん死亡のリスクが統計的に有意に低下することは確認された。しかし、その減少幅は極めて小さかった。例えば、週に3サービングの赤身肉摂取を減らすことによる全生涯のがん死亡減少(絶対リスク)は、1000人あたり7人にとどまる。
NutriRECSは、この「非常に小さい絶対リスクの減少」と「証拠の確実性の低さ」を天秤にかけた。さらに、彼らは「価値観と嗜好」に関する系統的レビューも実施し、多くの人が肉を食べることを楽しみ、健康上の懸念があっても肉を食べることを止めない傾向があることを明らかにした。結果として、健康上のメリットが不明確かつ微小である以上、個人の食の楽しみや文化を優先すべきであるとの判断を下したのである。
3.ヒル基準 vs GRADE
論争の対立軸は、エビデンスをどのように格付けし、そこからどのように因果関係を推論するかという方法論の違いにある。IARCや公衆衛生疫学は、1965年にオースティン・ブラッドフォード・ヒルが提唱した視点を事実上の標準としてきた。これは、統計的な「相関」を「因果関係」とみなすための9つの基準(以下、ヒル基準)である。
| 基準項目 | 内容 | 赤身肉・加工肉への適用 |
|---|---|---|
| 強固性 | 相関が強いほど因果の可能性が高い | IARCは加工肉の18%増を有意と判断 |
| 一貫性 | 異なる時間、場所、集団で同様の結果が出る | 800以上の研究での一貫性を確認 |
| 時間的先行性 | 原因(摂取)が結果(発がん)より先にある | 前向きコホート研究により担保 |
| 生物学的勾配 | 摂取量が増えるほどリスクが上がる | 用量作用関係の確認 |
| 生物学的妥当性 | 既知の生物学的機序と矛盾しない | ヘム鉄やN-ニトロソ化合物の機序 |
| 整合性 | 既知の病理学的知見と一致する | 動物実験や細胞研究との整合 |
| 実験的証拠 | 介入による変化が確認できる | 動物試験での発がん確認 |
ヒル基準の考え方は、すべてに項目に当てはまらなくても、総合的な「専門家の判断」により因果関係を認定できるというものである。ヒトでのランダム化比較試験(RCT)が最も強い証拠になるのだが、それが倫理的に不可能なことから、このような方法が広く使われたのだ。
一方、NutriRECSが採用したGRADEという評価法は、臨床医学における介入の効果を評価するために開発された方法である。GRADEは、証拠の「確実性」を4段階(高、中、低、極めて低)で格付けするが、その出発点において厳格な階層を設けている。そこでは、RCTを「高」とし、観察研究(コホート、ケースコントロール)は「低」としている。観察研究は、交絡因子の影響を排除しきれないため「低」とされるのであり、さらにバイアスのリスクや不正確さがあれば「極めて低」にダウングレードされる。
この評価法に従って、NutriRECSは赤身肉・加工肉に関するほぼすべての観察研究を、栄養疫学に特有の測定誤差(食事記録の不正確さなど)や残存交絡を理由に「確実性が低い」と判断した。GRADEの枠組みでは、いかに大規模で一貫したコホート研究があっても、RCTが存在しない、あるいはRCTで有意な差が出ない場合、証拠は「弱い」と結論付けるのだ。
4.公衆衛生界の反発と利益相反を巡る議論
NutriRECSの発表を受けて、ハーバード大学公衆衛生大学院、世界がん研究基金(WCRF)、アメリカがん協会(AICR)などは即座に声明を発表した。彼らは、NutriRECSの推奨事項が、「わずかながらも有意なリスク上昇」という事実と矛盾していることを指摘した。「データは有害性を示しているのに、食習慣を変えるなと言うのは科学的倫理に反する」という批判である。
特にWCRFの専門家は、NutriRECSが赤身肉と加工肉を一つの推奨事項にまとめたことを批判した。IARCが示した通り、加工肉には発がん性の証拠がある一方で、赤身肉には栄養価も認められるという違いがある。この2つをいっしょにして「現状維持」と勧告することは、消費者に誤った安心感を与え、大腸がんリスクを増大させる恐れがあるという主張である。
論争をさらに激化させたのは、NutriRECSの主任著者であるブラッドリー・ジョンストン博士の背景であった。ジョンストン博士が2016年に発表した「砂糖の摂取制限ガイドラインを批判する研究」において、食品・飲料業界のロビー団体とされる国際生命科学研究機構(ILSI)から資金提供を受けていたことが、発表の数カ月後に明らかになった。今回の食肉に関する研究に業界資金の提供は確認されなかったものの、ジョンストン博士が「GRADEという業界に有利な科学的手法」を繰り返し用いているのではないかという疑念が、ハーバード大学などの研究者から投げかけられた。これに対し、NutriRECS側は「過去の資金提供は今回のレビューに影響を与えていない」とし、むしろ反対派の公衆衛生学者がこれまでの自身の主張を守るために「印象操作」をしているのだと逆提訴する泥沼の様相を呈した。
5.予防原則と公衆衛生の論理
この論争は、不確実な科学的証拠に基づいて公衆衛生政策を決定することの極めて高い困難さを浮き彫りにしている。根本的な困難は、個々の患者を対象とする「エビデンスに基づく医学(EBM)」と、社会全体を対象とする「エビデンスに基づく公衆衛生(EBPH)」の目的の違いにある。GRADEが代表するEBMは、不確実な介入によって個人に害を及ぼさないよう「確実性」を追求する。他方、公衆衛生政策の根底には「予防原則」が存在する。これは、深刻または不可逆的なダメージの恐れがある場合、科学的な確実性が欠如していても、それを対策を遅らせる理由にしてはならないという原則である。ハーバード大学の専門家らは、証拠が「低確実性」であることを理由に肉の摂取を「継続」するよう勧告することは、公衆衛生の倫理に反し、人々に回避可能な害を及ぼす可能性があると批判しているが、そこには明確な予防原則の考え方がある。
一方で、不確実な段階で性急な指針を出すことへの慎重論も存在する。過去には「低脂肪食」の推奨が、結果として炭水化物の過剰摂取と肥満を招いたという教訓がある。証拠が不十分な中で強い勧告を行うことは、後に指針が覆された際に科学への信頼を失墜させ、将来の公衆衛生メッセージの効果を減退させるリスクを孕んでいる。
6.世界の評価機関による解決策
「エビデンスの解釈の不一致」を解決するため、WHOや各国の栄養政策決定機関は、単一の評価システムに頼らない、より広範で透明性の高い意思決定方法の構築へと動いている。WHOは、複雑な公衆衛生上の決定を下すための「WHO-INTEGRATE」を採用している。これは、健康の便益と害、公平性と人権、経済的影響、実現可能性と受容性、環境への影響を「総合的に評価」するものである。その特徴は、たとえGRADEで証拠の確実性が「低」と判定されたとしても、がん予防という重大な利益があり、かつ環境負荷の低減(赤身肉の削減による温室効果ガス抑制)など、他の利益がある場合には、公衆衛生上の「強い推奨」を出すことができる点にある。これはNutriRECSが「証拠が弱いから行動を制限しない」とした論理に対し、「証拠が不完全でも、多角的なメリットがあるなら予防的に介入する」という予防原則の論理を対置するものである。
GRADEの弱点を補い、栄養学の特性に配慮した評価法に改善したのがNutriGradeである。そこでは、観察研究が主体の栄養学において、エビデンスの質を単に研究デザインだけで決めるのではなく、以下の8項目を評価することにしている。バイアスのリスク、精密度(信頼区間の幅)、不均一性、直接性(代理指標ではなく臨床エンドポイントか)、出版バイアス、資金提供バイアス(業界との癒着)、用量反応関係、効果の大きさである。NutriGradeを用いることで、質の高いコホート研究を「中」から「高」の確実性へと引き上げることが可能になり、GRADEで生じる「すべてが低確実性になる」という硬直化を防ぐことができる。
ハーバード大学のウィレット教授らが提唱しているHEALMは、RCTの実施が不可能な長期的な食習慣の影響を評価するために、生物学的メカニズム(機序)、短期間の介入試験、大規模な人口統計、そして数十年にわたる長期追跡コホートの4点を統合して評価することで、ヒル基準の現代的な再現を目指している。
米国食事ガイドラインにはこの論争の影響がみられる。当初、諮問委員会(DGAC)は、植物ベースの食事パターンを優先し、赤身肉や加工肉の摂取制限を強化する科学的報告書を作成した。しかし、行政当局が作成した最終文書では、動物性タンパク質の重要性が再び強調されるという乖離が生じた。諮問委員会のメンバーからは、最終的なガイドラインが「科学的報告書の厳格なプロセスを無視し、不透明な政治的判断によって歪められている」と批判しているが、その背景には、これまでに述べたような評価法の違いがある。
おわりに
IARCとNutriRECSの論争は、「科学的事実」が、それを見る「レンズ(評価体系)」によって全く異なる姿を見せることを露呈させた。ヒル基準という「公衆衛生のレンズ」で見れば、数十年の研究の蓄積は「肉の摂取を制限すべき十分な根拠」と見える。一方でGRADEという「臨床医学のレンズ」で見れば、同じデータが「個人の行動を変えさせるには不十分な弱い証拠」にしか見えない。それだけではない。誰が評価したのか、どのような倫理的背景を持つのかで、科学的事実に対する社会の見方が変わる。本来、リスク評価は、思想信条など科学以外の何ものにも左右されない判断が求められる。他方、「リスク管理」は個人の健康増進だけでなく、環境負荷や倫理的側面を内包した「持続可能な判断」が求められる。この2つの違いが無視され、混同されたことが今回の混乱を引き起こしたものであり、世界の評価機関は、原則に立ち返り、それぞれの透明性を高めることで混乱を回避しようと試みている。












