【背景・目的】
薬剤性急性腎障害(AKI)は、多種多様な医薬品が原因となり、重篤な副作用であるため、薬剤性AKIを発症するリスクの高い医薬品を同定することは臨床上重要である。一方で、市販後の臨床現場における副作用の実態を網羅している副作用報告データベースを用いることで、医薬品と副作用の関連性を見出すことができる。そこで、我々はこれまでに医薬品副作用報告データベースを利用し、機械学習を応用して薬剤性AKIの発症する可能性の高い医薬品を、化学構造情報から予測するモデルを発表してきた。本研究では、複数の機械学習予測アルゴリズムを組み合わせて予測を行うアンサンブル機械学習モデルを適用することで機械学習予測モデルの精緻化を目指した。
【方法】
副作用データベースとしては、主に国内からの副作用報告に基づくJapanese Adverse Drug Event Report database(JADER)およびグローバルに副作用報告を集積したFDA Adverse Event Reporting System(FAERS)を用いた。FAERSにおいて、一般財団法人日本医薬情報センターがデータクリーニングを実施したJAPIC FAERSを用いた。対象副作用は、MedDRA/J ver23.0の標準検索式の「急性腎障害」とした。薬剤性AKI発症リスクの陽性・陰性の定義にはシグナル検出法であるReporting Odds Ratios法と報告件数を用い、該当する医薬品を抽出し、薬剤性AKIデータセットを作成した。AlvaDescにより算出した分子記述子を説明変数とし、k近傍法、adaboost、Random Forestを組み合わせたアンサンブル機械学習モデルを用いて、薬剤性AKI発症リスクの陽性・陰性を判別するモデルを構築した。
【結果・考察】
JADER(陽性:135剤、陰性:131剤)、JAPIC FAERS(陽性:239剤、陰性:248剤)およびそれらを統合したデータセット(陽性:302剤、陰性:344剤)の3パターンのデータセットを用いてアンサンブル機械学習モデルを構築したところ、モデルの性能を示すArea Under the ROC Curveは、JAPIC FAERSあるいは統合したデータセットでは、0.8以上になり、アンサンブル機械学習モデルは、単独のアルゴリズムを用いた機械学習法よりも高い予測性能を発揮した。
【結論】
今回の研究では、2種類の副作用報告データベースを活用して、医薬品の化学構造情報から薬剤性AKIを発症する可能性の高い医薬品を判別するアンサンブル機械学習モデルを構築することができた。