【目的】薬の乳汁移行性に関する情報は、母乳育児を希望する患者および授乳婦の薬物療法に関わる医療者にとって重要であり、milk-to-plasma(M/P)比は乳汁移行性を評価する指標の1つとして用いられる。本研究は、既報のM/P比データのキュレーションを行い、定量的構造活性/物性相関(QSAR/QSPR)および機械学習を用いて、AUCで評価されたM/P比(M/PAUC)が1を超えるか否かを予測する二項分類モデルと、具体的なM/PAUCを予測する線形回帰モデルを構築することを目的とした。
【方法】原著論文からヒトM/P比のデータを収集し、M/PAUCのみをデータセットに用いた。産後7日以内に評価された初乳のM/PAUCは除外した。二項分類モデルには人工ニューラルネットワーク(ANN)とサポートベクターマシーン(SVM)の2種類、線形回帰モデルにはANN、SVM、カーネル部分最小二乗分析(KPLS)、重回帰分析(MLR)の4種類の機械学習アルゴリズムを使用した。化学構造式からの記述子の算出および予測モデルの構築にはそれぞれADMET Predictor(R)10.3とADMET ModelerTMを使用した。
【結果・考察】403化合物のM/P比のデータを収集した。そのうちM/PAUCのデータが得られたのは173化合物であり、初乳のデータを除外した129化合物をデータセットに用いた。二項分類モデルにおいて、ANNモデルの感度はトレーニングセットで0.969、テストセットで0.833であり、SVMモデルの感度はトレーニングセットで0.971、テストセットで0.667であって、いずれのモデルも効果指標は良好であった。線形回帰モデルにおいて最も予測精度が高かったのはMLRモデルであり、決定係数(QSQD)はトレーニングセットで0.935、テストセットで0.321であった。また、二乗平均平方根誤差(RMSE)はトレーニングセットで0.159、テストセットで0.432であった。線形回帰モデルではトレーニングセット-テストセット間の効果指標の差が大きいため、今後はデータ数を増やし、モデル構築の設定について検討を行う。
【結論】QSAR/QSPRおよび機械学習を用いたM/PAUC予測モデルを構築した。二項分類モデルは予測精度が高く、脂溶性やタンパク結合率などの物理化学的性質および能動輸送の関与によりM/PAUCが1を超える薬のスクリーニングに有用と考える。