従来の薬物動態あるいは薬力学領域でレスポンスの時間変化あるいは用量変化の解析には、モデルの作成が基本的に必要である。機械学習はモデルの作成が不要なので、将来は職人芸のようなモデリングはもはや不要との意見も聞く。これでは先が読めないと悩む母集団薬物動態解析の研究者も多いのではなかろうか。私達はモデリング等の数値解析の専門家と自称し、ここ数年、母集団薬物動態解析とその発展、ベイズ統計に基づくMCMC法、そして様々な機械学習の方法を試してきたので、その経験をこのシンポジウムで共有したい。
機械学習には、ランダムフォレストなどの二分木に基づく方法、サポートベクターマシン、そして囲碁で有名になったパーセプトロンなどのニューラルネットワークなどがある。いずれも多量の情報を高速に処理し、一定の傾向や重要な特徴量を抽出することができる。また概念を形成するような学習も可能ではある。ただし、そのような学習は一般に数十万以上のデータ量で可能になるもので、なかなか実現しない。ビッグデータの時代なので、その数のデータがないわけではないが、今度はデータが多様すぎて、なかなか解析が難しくなる。私達は経口吸収に対する食事の影響を機械学習で解析し、この場合に使えたデータは500薬程度なので、ランダムフォレストが良い結果であった。その結果、従来のBCSに比べて優れた予測が実現したが、従来に比べて格段の向上したかというと、むしろ従来の解析の妥当性を説明したと言える程度かもしれない。また母集団解析を機械学習におきかえる研究も試したが、計算の高速性は素晴らしかったが、現在の機械学習には個体間誤差と個体内誤差などのように、誤差構造を識別する機能が欠けている。したがって、母集団解析と同等の解析ができたわけではない。
一方で私達は母集団薬物動態解析法を拡張して、長期疾患進行を解析するSReFTを発表している。あるいは薬物相互作用の解析にはin vitroとin vivoの情報をすべて統合して解析するためにMCMC法を用いている。さらに臨床試験の個別情報を詳細に解析するためにコックス回帰の精密な適用を行っている。このような解析法は、機械学習を組み合わせることで効率化は可能と考えているが、いずれも機械学習で代替えできるものではない。結論として、機械学習も含めて、情報処理の専門的知識を持ち、それらを自由に使いこなす研究者は今後さらに必要になると考えている。