特異体質性副作用は新薬開発における臨床試験の中止や、市場撤退の主要な原因となる。しかし、発生頻度が稀であり、用量依存性を示さないため、非臨床試験等からの毒性予測は極めて困難である。また、臨床的にも治験の症例数では検出することは難しい。そのため、新薬の開発段階において、特異体質性副作用を引き起こす可能性のある候補物質を予測できれば、臨床試験や市販後の安全性評価の効率化につながる。
一方、コンピュータの発展により、人工知能技術を用いた高度なデータ解析が可能になり、医療分野においても大規模医療情報と人工知能が活用されている。機械学習は、既知データをコンピュータが学習することで新たなパターンを見つけ出し、未知データの予測を可能にする人工知能技術の一つである。そこで、副作用や毒性発現の既知情報に基づいて、化学物質の化学構造情報を特徴量とした定量的構造活性相関(QSAR)アプローチにより毒性を予測するインシリコ手法が開発されている。特異体質性副作用のインシリコ予測が可能になれば、開発候補物質自体の毒性のみならず、合成段階での不純物やヒト特異的代謝物等の開発段階で生じる多種多様な化学物質の毒性を予測することで、効率的な安全性評価に貢献できる。
我々は、特異体質性副作用の予測において機械学習と有害事象自発報告データベースに着目した。各国で有害事象の自発報告が制度化されており、症例報告が集積された有害事象自発報告データベースは、市販後の医薬品安全性監視に利用されている。また、データマイニングを用いたシグナル検出により、医薬品と有害事象の関連性をスクリーニングすることが可能である。
本シンポジウムでは、特異体質性副作用であるスティーブンス・ジョンソン症候群や中毒性表皮壊死症等の重症皮膚副作用の予測モデルについて紹介する。PMDAが運用している医薬品副作用データベース(JADER)を利用し、シグナル検出と報告件数から医薬品の重症皮膚副作用の有無を定義した。これらを学習データとして、Deep Learningを用いて医薬品の化学構造情報から重症皮膚副作用を判別するモデルを構築した。本モデルは医薬品の基礎的な情報である化学構造情報から、ヒトの特異体質性副作用を予測することを可能とし、機械学習と副作用データベースの新たな活用方法が示された。さらに、化学構造情報以外の特徴量も取り入れた新たな取り組みについても紹介したい。