横浜市立大学大学院医学研究科 遺伝学 高田 篤客員准教授(理化学研究所 脳神経科学研究センター 分子精神病理研究チーム チームリーダー兼務)、濱中耕平助教、松本直通教授の研究グループは、遺伝統計学的解析と人工知能(機械学習)を用いたデータ駆動型アプローチ(注1)で、米国臨床遺伝・ゲノム学会(American College of Medical Genetics and Genomics: ACMG)と分子病理学会(Association for Molecular Pathology: AMP)が作成した世界標準の臨床遺伝子診断ガイドライン(ACMGガイドライン(注2))を洗練させるための手法を開発し、報告しました。これにより、日本発の技術で、世界標準たるガイドラインの「カイゼン」を達成しました。本研究の成果により、既存のガイドラインに従った判定では見逃されていた遺伝性疾患の原因遺伝子変異を発見したり、誤診を回避したりすることが可能になると予想されます。
本研究は、Cell出版社のトランスレーショナル医学雑誌『Med』に掲載されます。(日本時間3月12日午前1時付オンライン)
研究の背景
ヒト遺伝性疾患の分子診断(タンパク質やDNAなどの分子を調べて疾患を特定する)を正確に行うためには、遺伝子変異の病原性、変異の遺伝形式、臨床症状など、様々な情報を統合する必要があります。米国臨床遺伝・ゲノム学会(American College of Medical Genetics and Genomics: ACMG)と分子病理学会(Association for Molecular Pathology: AMP)によって、2015年にヒト遺伝性疾患の分子診断における診断ガイドライン「ACMGガイドライン」が作成され、世界標準として幅広く利用されています(論文検索システムであるGoogle Scholarでの引用回数は2021年3月時点で9700回以上)。
ACMGガイドラインでは、例えば、ある疾患の原因遺伝子上のDNA塩基配列(注4)の変異の候補が、遺伝子がコードするタンパク質の機能を完全に喪失させると予想される、ノンセンス変異(注5)やフレームシフト挿入欠失変異(注6)であった場合には、病原性を示唆するエビデンスとして最も強い「PVS(pathogenic very strong:以下、「超強力」と表現)」の基準を満たすと判定されます。同様に、患者でのみ認められ、両親では認められない突然変異であった場合には、強いエビデンスである「PS(pathogenic strong:以下、「強力」と表現)」の基準、変異が重篤な先天性疾患を認めないヒトの集団では観察されない場合には、中等度のエビデンスである「PM(pathogenic moderate:以下、「中等度」と表現)」の基準、変異が複数のコンピュータプログラムで有害と予測されるミスセンス変異(注7、以下「有害ミスセンス変異」と表現)である場合は、弱いが支持的なエビデンスである「PP(pathogenic supportive:以下、「支持的」と表現)」の基準を満たすと、それぞれ判定されます。ACGMガイドラインでは、このような基準の組み合わせから、変異の病原性を判定します。例えば、PVSの基準を満たし、かつ「中等度」の基準を2つ以上満たす場合や、「強力」の基準を1つ満たし、かつ「中等度」の基準を3つ以上満たす場合、その遺伝子変異は「病原性あり(pathogenic)」と判断されます。
このガイドラインの基準には、変異の機能的タイプ(例えば上述のノンセンス変異、フレームシフト変異など)に基づくものがいくつかあり、タンパク質の翻訳開始コドンが変化して、翻訳開始位置が変わるかなくなってしまうと予想される「スタート喪失変異」は「超強力」と判定されます。また、タンパク質の翻訳終止コドンが変化して、通常よりも長い異常なタンパク質が翻訳されると予想される「ストップ喪失変異」は、タンパク質の読み枠を変化させない「インフレーム挿入欠失変異」とともに「中等度」に分類されます。
一方、「スタート喪失変異」に関しては、例えば近傍に別の開始コドンが存在する場合には遺伝子機能に対する影響が大きくない可能性があります。また、多数の異常なアミノ酸が付与されることが多い「ストップ喪失変異」を、数個のアミノ酸の変化にしかつながらない「インフレーム挿入欠失変異」とひとくくりにして良いのかという問題もあります。さらに、このガイドラインはエキスパートの知識・意見にのみ依拠しており、客観的データに基づいて吟味されたものではありません。
研究グループはこれらの問題に対して、遺伝統計学、機械学習といった、近年注目を浴びているデータ駆動型のアプローチで取り組みました。
図3:既知疾患原因スタート喪失変異の判別性能
各ツールの性能をROC曲線(注19)で評価したところ、PoStaL(黒線)が断トツで大きいarea under the curve(AUC: カーブの下の面積のことで判別ツールの総合的性能の指標の一つ。大きいほど性能が高いことを意味する)を示した。赤の点線は特異度95%のライン。黒線以外は、スタート喪失変異に特化はしていない(主にミスセンス変異などを対象とした)病原性予測ツールを用いたときの結果。
*2 ACMGガイドライン
米国臨床遺伝・ゲノム学会(American College of Medical Genetics and Genomics: ACMG)と分子病理学会(Association for Molecular Pathology: AMP)が共同で発表した、遺伝子診断のガイドライン。下記論文に詳述されている。
Richards et al., Genetics in Medicine volume 17, pages405–423(2015), doi: 10.1038/gim.2015.30