智慧芽Eureka生物医药团队为了解决专利挖掘药物问题而打造的专利推荐PCC分子Agent,自7月份上线以来,已收到不少专业用户的体验。
阅读和分析专利是药企研发、IP及立项部门的日常工作,而创新药研发的源头正是发现苗头化合物(hit),并进一步优化至临床前候选(PCC)分子。
最初的苗头化合物是如何发现呢?大体来说,主要通过高通量筛选(成本昂贵)、AI辅助药物发现(技术不断迭代中)、跟踪其他公司公开的高价值专利中的分子。因此,从专利中精准挖掘最优分子具有重要意义。
在实践中,研发人员也常把高价值专利中的最优分子当作阳性参照,通过和自己公司设计合成出来的化合物,进行头对头生物测试,来评估自有IP的分子能否拿去立项、能否推进至PCC活IND阶段。由此可见,快速从专利中确定优选分子对于企业决策至关重要。
秉承着为企业创新提效的使命,智慧芽Eureka平台推出专利推荐PCC分子Agent,提供根据药物代号推荐核心专利和根据专利号推荐最优分子两大功能。
下面将结合实例,为您详细解析。
根据药物代号AI推荐核心专利
2024年诺华与Monte Rosa Therapeutics达成全球独家开发和商业化许可协议,以推进靶向Vav1的分子胶降解剂的开发,包括在研疗法 MRT-6160。根据协议条款,诺华同意向Monte Rosa支付1.5亿美元预付款。
2025年3月,Monte Rosa宣布了其MRT-6160 I期单次递增剂量/多次递增剂量(SAD/MAD)研究的临床结果(图1)。

图1 MRT-6160的FIH研究
若研发人员想快速跟进诺华引进的这个分子胶药物MRT-6160,整个工作流程可能会花费数个小时,甚至1-2天:
-
先找到MRT-6160的核心专利;
-
再分析核心专利中的权利要求和说明书中的效果数据,找到专利中的关键分子;
-
如果核心专利有多篇,还需要分析关联性大的专利,并作优先级排序。
而借助智慧芽生物医药开发的专利推荐PCC分子Agent,这一复杂流程可大幅压缩至5-10分钟。
操作十分简便,研发人员只需要输入“MRT-6160”,接下来:
-
Agent将先调用synapse中的AI推荐核心专利工具,找到推荐的专利号WO2024151547A1(如果有多篇专利,会根据相关性推荐优先级高的专利,最终列出前5篇);
-
随后调用推荐专利最优分子工具来分析专利WO2024151547A1;
-
最终给出分子185是最优解(图2)。
图2 MRT-6160的最优分子推荐报告
值得一提的是,推荐专利最优分子工具模拟了药物化学家分析专利中重点分子的过程,通过预设的Prompt确定规则,筛选专利中的最优分子和重点分子。
其判断依据包括:是否开展大动物实验(如猴、犬)、是否具备药效和毒理数据、生物实验数据是否充分等。同时,模型严格遵循活性数值越低越好、毒性数值越高越好、选择性指数(SI)越大越优的评判原则。
该Agent以微调过的外部大模型或智慧芽自研模型为底座,结合不断调试的Prompt策略,再配合经过RAG的数据源的训练,目前可以完成多种不同专利类型(WO/CN/US/JP/EP)的解析。
对于小分子专利,除了给出最优分子预测和次优的5-10个分子外,还能给出高频母核和高频片段,并提供包含实施例中化合物的SDF文件,极大便利了研发人员开展专利SAR(构效关系)研究。
礼来的orforglipron最近公布了三期临床数据,也是即将获批的首个GLP1R小分子激动剂。其核心化合物专利是WO2018056453A1,我们可以选择这篇专利来测试。
在专利推荐PCC分子Agent中直接输入该专利号,Agent可识别用户的意图是想推荐专利最优分子。经过几分钟的分析,Agent输出最优实施例是化合物67,并提供对应的SDF文件。
虽然该篇专利是日文书写格式,但智慧芽生物医药的模型+翻译工具,仍很好地解析了该篇专利权要和说明书中的文字描述与表格数据(图3)。

图3 分析WO2018056453A1的最优分子
该实施例化合物67在雄性食蟹猴(大动物)中进行了胰岛素分泌促进作用、血糖降低作用和摄食抑制作用的体内药效学试验,并显示出剂量依赖性的良好效果,且其作用与对照药Exenatide相当。这是专利中唯一提及在大动物中进行药效学测试的化合物。
此外,实施例162、163、164、165详细描述了实施例化合物67的钙盐水合物的制备、晶型分析、热重分析和卡尔费休水分测定,表明其成药性得到了深入研究。
如图3关键数据栏所示,胰岛素分泌促进作用、血糖降低作用、药代动力学、晶型与稳定性等数值,均提取自专利说明书中的图表信息。
除了推荐最优分子,Agent还会综合分析专利说明书中的实验数据,推荐5-10个次优分子(图4)。参考数据均来自于该篇专利中的图表数据,未公开的信息则不予呈现。
需要强调的是,推荐逻辑贴合实际的工作流:例如化合物66虽然EC50值与后面几个相同,但其有晶型研究(实施例161、163),这在一定程度上增加了其成药潜力,但仍无法与有大动物数据的化合物67相比。

图4 WO2018056453A1的5-10个最优分子推荐
专利推荐PCC分子Agent除了推荐小分子专利以外,小核酸、抗体、ADC以及PROTAC等药物类型的专利也能作推荐。
其推荐理由均基于大模型提取到的权要和说明书中的效果数据(包括图表)。不同的是,现阶段只有小分子药物支持高频片段分析,在后面迭代版本中,Agent也会和智慧芽生物医药的其他SaaS产品打通,进一步展现序列信息处理等功能。
自从该Agent上线以来,得到了很多关注,同时也感谢用户给我们提出的宝贵意见。
智慧芽生物医药团队非常重视每位用户的反馈,我们会定期回访、邀请用户吐槽(反馈),同时也会将Agent的迭代节奏保持在每两周一次。
首先,我们会持续关注DeepSeek等大模型的能力,同时不断迭代内部自研大模型。
在每一个Agent上线前,我们都会微调模型,并通过多轮测试,选择最佳的模型来搭配具体Agent。之所以这样做,是因为生物医药的场景多种多样,为了降低幻觉,实现更准确的输出,理论上也需要搭配不同模型以完成复杂任务。

图5 Lipinski成药5规则
-
增加推荐分子的 clogp、tpsa、分子量、氢键供体和受体、预估溶解度、预估admet数据等,帮助研发人员全面分析推荐分子的成药性(结合Lipinski成药5规则)。
-
目前模型提取到的说明书,部分图表形式的数据识别不出来;迭代版本会结合文档精读Agent的能力,更准确地提取图表活性数据。
-
拓展多个应用场景,例如增强Agent分析专利权利与要求的能力,帮助研发人员完成具体分子的侵权分析等。
总而言之,专利推荐PCC分子Agent能够在药物结构尚未公开时,帮助研发人员快速锁定候选药物的核心专利。
若识别出多篇核心专利,Agent会依据专利进入国家的战略重要性(如优先判断是否进入美国)、专利布局的国家数量、是否存在重要权利转让记录,并结合智慧芽专业的专利价值评估模型(图6)进行综合排序,最终精准推荐前5篇专利供深入分析。
图6 智慧芽专利价值评估模型
此外,Agent支持对单篇专利进行深度解析,包括逐条解读权利要求和说明书数据、精准筛选出最可能成药的分子有哪些。用户也可以直接输入专利号,快速获取该专利的成药实施例及分子信息。
针对小分子专利,Agent还提供高频片段与母核分析,并支持导出SDF文件,便于与ChemDraw等工具联动进行后续SAR研究。
🎁现专利推荐PCC分子Agent已上线,我们持续欢迎您的试用和反馈。

立即扫码体验,获取10天试用权限!
参考文献:
https://eureka.zhihuiya.com/share/?id=841974ac18b4c83eb68672ce55ad1153&from=eureka_ls_agent_patent_preclinical_candidate_compound&content=分享人: huwei2内容: 关于”MRT-6160″的解决方案.
智慧芽新药情报数据库和专利数据库.
https://synapse.zhihuiya.com/clinical-progress-detail/822a28dea459e88a32859229a528e235.
https://eureka.zhihuiya.com/share/?id=3ffc8a7e5813f1e6ae377fbe426f9dd6&from=eureka_ls_agent_patent_preclinical_candidate_compound&content=分享人: huwei2内容: 关于”WO2018056453A1的最优分子是哪个?”的解决方案.
https://www.kaggle.com/code/yeonseokcho/lipinski-s-five-rule-for-druglikeness.
本篇文章来源于微信公众号: 药时代
发布者:haitao.zhao,转载请首先联系contact@drugtimes.cn获得授权