一款创新药从靶点发现到获批上市平均需要12.8年,研发投入超过26亿美元。在这条荆棘之路上,临床前研究犹如"死亡之谷"——仅7%的候选药物能通过药代动力学(PK)评估,而传统动物实验不仅需要消耗3000-5000只实验动物,其数据与人体真实反应的匹配度更不足40%。人工智能辅助的药代动力学(PK)模型通过提高药物研发效率,可以显著减少动物实验次数约30%到50%,并提高临床一期试验的成功率约10%到20%。作为深耕创新药研发的先锋企业,我们正将AI技术融入到新药研发,助力药物的药代动力学研究。
AI赋能新药研发:
HEC-PK助力药物的药代动力学研究
在AI重塑新药研发的浪潮中,东阳光药以前瞻性布局率先构建“数据-算法-平台”三位一体的智能研发体系。依托十余年研发实践积累的多维数据,涵盖药物化学、生物活性及药代动力学等,运用AI技术,东阳光药构建了一个综合性的大鼠PK曲线预测模型1.0版(HEC-PK模型),旨在精准预测药物的药代动力学特征。
目前,基于药物静脉注射途径(IV)数据进行数据去重、整理后,得到1383条数据,并按照8:2比例划分为训练集和测试集,其中训练集用来训练,测试集用于检测模型性能。HEC-PK模型视小分子化合物为图(Graph), 以图神经网络(GNN)为基础模块提取分子图中的特征信息,可用于预测药物的大鼠PK曲线。模型筛选以GATConv作为消息传递层;组合使用WeightAndSum Pooling + MaxPooling作为池化层。当前HEC-PK模型深度为2层,采用2层GATConv进行消息传递,并进行池化提取整图信息,经MLP层预测小分子化合物的PK曲线。HEC-PK模型结构如图所示:
图1 模型结构
我们定义了多种性能指标来评估模型性能,HEC-PK模型的预测浓度与真实浓度的对数平均绝对误差 MAE (平均绝对误差)与mfce (中位数倍速误差)接近于1,决定系数R2非负样本比例超过 60%,非负样本R2平均值超过0.6。综上所述,HEC-PK模型在预测大鼠的药代动力学PK曲线方面表现出色,其预测出的PK曲线数值与真实值之间的误差较小,这充分证明了该模型具有良好的预测性能。HEC-PK成功构建了一个全面且准确的药代动力学模型,将为药物研发提供重要的理论支持和应用工具。