TorsionNet, 预测小分子torsional energy的深度学习模型

TorsionNet, 预测小分子torsional energy的深度学习模型

TorsionNet, 预测小分子torsional energy的深度学习模型


辉瑞研究人员近日JCIM的文章 (之前已有预印本公开)。


评估小分子的构象是否低能,是药物设计很重要的一个方面,但有时 (也许是往往) 并没有很好被考虑。


docking打分或者没有考虑小分子构象penalty,或者有strain energy,但是基于MM方法,准确性不佳。


QM方法算得的结果比较准确,但计算量大,通量低,只适合精细modeling,不适合大规模虚拟筛选。


用机器学习/深度学习来“学习”训练集 (QM数据或晶体结构) 的信息并建立model,来预测新的小分子的低能构象,之前已有报道,这篇文章也是类似的尝试。


小分子torsion是影响小分子构象一个重要方面,这篇文章主要集中在小分子torsional energy profiling上面。


也就是CADD或基于结构的药物设计常说的扫二面角,比如前几天提的BI大环EGFRi那篇文章就有。现在比较多的用QM方法扫,也有用MM方法的。


当然还有一种方法是查晶体数据库,通过statistics方法看优势torsion的分布,如果数据库中有较多相似结构的话。


回到文章。


方法部分简单介绍 (图1, 图2),个人也不在行。


首先是为AI找学习素材。

辉瑞研究人员将内部分子库碎片化,拆成保留torsional特征的最小片段。

从中挑一部分最常见的片段,先用MM方法找出不同torsion angle的构象,然后对这些构象依次用QM方法 (B3LYP/6-31G**) 算对应的能量,这一步计算量大,放在亚马逊云上进行。


用这些数据来“喂”给AI,建模用到两种方法,随机森林及DNN (Deep Neural Network),期间也有迭代。模型建好后,进一步验证及预测。


TorsionNet, 预测小分子torsional energy的深度学习模型

图1


TorsionNet, 预测小分子torsional energy的深度学习模型

图2


图2 c d e f,其中c e是校正前的结果,d f做了简单校正,即把橘线 (DNN) 整体下拉,让最低点贴近x轴。c的结果很不错,校正后与DFT结果基本重叠,E的结果就比较差,趋势都不对。


着重看结果部分。


整体来讲,与DFT结果还是有比较好的相关性,Pearson相关系数0.94,平均绝对误差0.7 Kcal/mol,RMSE 1.2 Kcal/mol。


TorsionNet, 预测小分子torsional energy的深度学习模型

图3


图4是与晶体结构的验证,曲线能量低的点,晶体结构分布多,整体来讲吻合也比较好。


TorsionNet, 预测小分子torsional energy的深度学习模型

图4


图5是统计学上探讨strain energy与分子活性的关系,当然分子活性不完全由strain energy决定,但可以看出分子活性与预测的strain energy有相关性,整体来讲活性差的分子strain energy更高。


TorsionNet, 预测小分子torsional energy的深度学习模型

图5


图6是三种方法在benchmark数据集的比较,TorsionNet即这篇文章的方法,MMFF94是较常见的MM力场,ANI-2x是之前发表的AI类力场方法,可以看出TorsionNet表现相对最好,ANI-2x有些指标反而不如MMFF94,作者认为可能是因为这个模型训练时用的QM方法不同。


TorsionNet, 预测小分子torsional energy的深度学习模型

图6


最后是三个应用场景。


第一个是从一系列较低能构象中挑出晶体结构pose,这个也许在晶型预测有潜在应用,图7可以看出,文章model比MMFF力场表现要好一些,尤其在CSD数据集 (在PDB数据集表现相对差可以理解)。


TorsionNet, 预测小分子torsional energy的深度学习模型

图7


第二个是用来改进docking打分函数,提高虚拟筛选命中率。

结果如图8所示,加上DNN strain校正的打分函数,有相对更高的虚筛命中率。另外注意这里dataset包含较多高活性分子,因此命中率普遍偏高,不能代表真实世界VS水平。


TorsionNet, 预测小分子torsional energy的深度学习模型

图8


第三个是用来refine晶体结构小分子的构象,如图9所示,青色的部分表示晶体的density map,橘色的是原先fit的小分子pose (一般是根据MM力场),但有些地方看起来不是低能的,而较低能的构象也能fit进这个map,没有其它数据支持的话应该采纳这个更低能的构象 (refine后的绿色构象map缺失那块感觉也还不低能,可能需要进一步探讨)


TorsionNet, 预测小分子torsional energy的深度学习模型

图9


总之,这篇文章探讨了用deep learning方法预测小分子torsional energy,截取了小分子构象研究中的一部分话题来研究。结果显示,DNN model预测的结果比一般的MM力场方法要好,而比精度更高的QM方法要快,有可能用于改善docking score等应用。


相关code作者上传在https://github.com/PfizerRD/TorsionNet,不过相关的数据集 (5万个fragment及QM计算结果) 只公开了一部分 (500个) 作为benchmark。另外,MM conformation这一步用的是个商业软件,用其它软件应该也可代替,但有可能最终的performance会有不同。


TorsionNet: A Deep Neural Network to Rapidly Predict Small- Molecule Torsional Energy Profiles with the Accuracy of Quantum Mechanics. JCIM, Feb. 4, 2022.




End


版权声明/免责声明

本文为授权转载文章,仅代表作者观点,版权归作者。

仅供感兴趣的个人谨慎参考,非商用,非医用、非投资用。

欢迎朋友们批评指正!衷心感谢!

文中图片、视频为授权正版作品,或来自微信公共图片库,或取自网络

根据CC0协议使用,版权归拥有者。

任何问题,请与我们联系(电话:13651980212。微信:27674131。邮箱:contact@drugtimes.cn)。衷心感谢!

TorsionNet, 预测小分子torsional energy的深度学习模型

推荐阅读

TorsionNet, 预测小分子torsional energy的深度学习模型

TorsionNet, 预测小分子torsional energy的深度学习模型点击这里,与~20万同药们喜相逢!

本篇文章来源于微信公众号:药时代

发布者:药时代,转载请首先联系contact@drugtimes.cn获得授权

(0)
打赏 为好文打赏 支持药时代 共创新未来! 为好文打赏 支持药时代 共创新未来!
上一篇 2022年2月8日 14:41
下一篇 2022年2月10日 12:47

相关推荐

公众号
公众号
分享本页
返回顶部
FDA批准首款NASH/MASH新药,中国药企如何分享这个百亿美元大蛋糕?点击观看直播