Anew Therapeutics
研究

AnewSynth

知识引导的可合成性预测:生成切实可行的合成路线

AnewSynth

核心亮点

AnewSynth 创新性地将“专家编码方案”与 145 个经过精细标注的反应模板相结合,有效解决了过去合成路径规划中的化学冲突问题,提高反应路径的实验室合成可行性。该模型表现显著优于现有的 SOTA 基线模型。此外,我们还首创了一套标准化的反应路径可行性 (RPF) 评分系统,通过严格量化路线的可行性,确保最终送入合成验证的分子都配备在化学合成中切实可行的合成路径。

领域痛点:可合成性的挑战

尽管分子生成技术发展迅猛,算法能在毫秒间生成全新分子。同时,反应规划类模型和逆合成预测模型也能够输出潜在合成路线。但是,分子及其合成路线的“合成可行性”始终是阻碍其落地的核心壁垒——湿实验验证依然是最大的瓶颈。

为了解决这一问题,业内通常采用“基于反应模板”的方法,试图让模型学习预设规则,利用市售的化学砌块来规划合成路线,以此模拟药物化学家的思维逻辑。然而,新生实验室在回顾性研究中发现,这些主流方法存在致命的脱节:它们仅仅学会了化学反应的“表层语法”,却忽略了“深层语义”——即真实有机化学中不可或缺的领域直觉

这导致模型经常输出一些“算法上合理,但违背基本化学原理”的路线。这些纯模板生成的路线往往只是纸上谈兵,在实际的实验室操作中失败率极高。

破局之道:基于反应模板的专家编码

为了系统剖析这些失败案例,新生实验室搭建了专属的分子合成路线标注平台。经过合成专家的严格交叉验证,我们将传统模板规划失败的原因精准锁定为五大模式:1. 化学选择性问题(如亲核选择性偏差);2. 违背反应活性层级;3. 特定条件下的官能团降解;4. 催化剂中毒;5. 空间位阻效应

为了攻克这些痛点,让基于规则的合成规划真正走向实用,新生实验室研发团队正式推出 AnewSynth 模型。

AnewSynth 实现了一次范式跃迁:它突破了传统的“化学空间投影”架构,进化为一个真正由“真实有机合成规则”驱动的规划模型。我们在模型中深度集成了 145 个药物化学常用的、经专家精标的反应模板库,并对每一个有机反应的精确条件进行了细致编目。通过将这套“专家编码方案”直接嵌入模型的训练与推理环节,AnewSynth 在连续分子合成路线规划任务中,表现显著优于现有的 SOTA 模型,大幅提升了生成路线的实际可行性

严谨验证:反应路径可行性 (RPF) 评分

最后,为了确保路线评估的严谨性,我们基于专家标注数据集,专门开发了一款“反应评估智能体”。该系统将生成的合成路径划分为四个等级:I 级(严重缺陷)II 级(低可行性)III 级(中等可行性)IV 级(高可行性)

我们将这些评估结果转化为标准化的反应路径可行性 (RPF) 评分,为行业提供了一项全新的量化指标。凭借这一严苛的评分体系,新生实验室成功跨越了“计算预测”与“实验现实”之间的鸿沟。这种定量化的评估方法,确保了我们始终能为实验台提供最稳健、切实可行的分子合成路线。

论文即将发布
返回所有研究