上海药物所与凯思凯迪联合团队在首届AI药物研发算法大赛上取得优异成绩

【重磅录像】颜宁:“AI在结构生物学中的未达之地”
获取有效的先导化合物是药物研发的起始环节,也是后续顺利进行药物研发的关键。通常,科学家需要在数以百万计的分子库中寻找寥寥几个先导化合物,在获取先导化合物的基础上再进行分子和细胞水平的测试及化合物优化。如何有效在大量化合物中筛选有分子及细胞水平活性的先导分子是药物研发人员所面临的巨大挑战,也是AI药物研发领域亟待解决的科学问题。
近日,经过3个多月的激烈角逐,由百度飞桨平台举办的首届AI全球药物研发算法大赛已于北京时间8月26日上午12点落下帷幕。面向药物研发领域的关键问题,此次比赛吸引了广泛的关注和热烈的讨论,共有来自世界各地的1105名参赛者参加。
由中国科学院上海药物所药物靶标结构与功能中心博士生何欣恒、工作人员李俊睿、单虹,凯思凯迪公司工作人员徐沁琦组成的联合“蓝风信的团队”,在徐华强研究员指导下,从878支队伍中脱颖而出,获得了此次大赛的第二名(图1)
上海药物所与凯思凯迪联合团队在首届AI药物研发算法大赛上取得优异成绩

图1 首届AI药物研发算法大赛最终排名情况

本次比赛的目标是利用人工智能方法,发掘治疗新冠病毒的潜在药物。

比赛提供了大量以简化分子线性输入规范(SMILES)形式表征的小分子,及其对新冠病毒主蛋白酶的抑制活性和在Caco细胞上抑制新冠病毒复制的活性数据,参赛者的目标是利用这些数据及已知的数据库,通过人工智能方法构建模型,预测在测试集中的分子在分子水平和细胞水平上的抑制能力。这样的应用场景贴合药物研发的实际情况,也是目前的AI药物设计算法尚未完全解决的问题。

面对这样的复杂问题,上海药物所与凯思凯迪联合团队针对性地在国产深度学习框架paddlepaddle上实现了图2所示的工作流,提供了一套相对合理的解决方案。

基于课题组常年深耕结构生物学的领域内知识,研究团队首先收集了PDB数据库中主蛋白酶的晶体结构和上面结合的抑制剂分子,此外还在其他药物数据库和文献中挖掘到了其他靶向主蛋白酶和具有新冠病毒复制的细胞抑制活性的分子。

获得数据后,一方面获取其3D结构,将3D结构转换成基于原子和键的分子图以及基于键和键角的分子图,使用几何增强型的分子表征(GEM)提取图层次的分子表征,另一方面使用分子指纹和预训练模型提取分子本身的特征,将这些特征堆叠作为分子的表征,最后使用残差网络汲取分子表征中所蕴含的信息,最终输出预测概率。在数据收集和模型调试方面,该团队也得到了徐华强课题组及凯思凯迪公司的参与和支持。

上海药物所与凯思凯迪联合团队在首届AI药物研发算法大赛上取得优异成绩

图2 针对AI药物算法大赛,本团队所使用的工作流

作为人工智能技术发展的“三驾马车”,数据、算法和算力在优秀人工智能工具开发中的重要性不言而喻。在药物研发领域,基于不同背景的团队若能通力合作,可能可以将这样的三驾马车并驾齐驱,获得更佳的药物设计分子。

本次比赛中,上海药物所徐华强团队克服困难,精诚合作,收集了大量的活性数据,这对于比赛的最终成绩是不可或缺的。同时,上海药物所和凯思凯迪公司提供的算力基础也为取得这样的成绩提供了良好的保障。算法方面,本次比赛中尝试的其他较新的算法(如图Transformer)反而表现会有所下降,提示在小数据集的药物设计领域,使用过多参数的深度学习方法可能带来潜在的过拟合问题,需要在研究中意识到数据不足时AI的能力和局限性。

上海药物所与凯思凯迪联合团队在首届AI药物研发算法大赛上取得优异成绩

上海药物所与凯思凯迪联合团队在首届AI药物研发算法大赛上取得优异成绩
上海药物所与凯思凯迪联合团队在首届AI药物研发算法大赛上取得优异成绩

心衰再升温:拜耳扩充非奈利酮的心衰试验到1.5万人,增加3项3期临床试验……

上海药物所与凯思凯迪联合团队在首届AI药物研发算法大赛上取得优异成绩

8月,23家药企宣布裁员!

本篇文章来源于微信公众号: 药时代

发布者:haitao.zhao,转载请首先联系contact@drugtimes.cn获得授权

(0)
打赏 为好文打赏 支持药时代 共创新未来! 为好文打赏 支持药时代 共创新未来!
上一篇 2023年9月4日 17:58
下一篇 2023年9月4日 17:59

相关推荐

公众号
公众号
分享本页
返回顶部