合成复杂有机分子的能力对于发现和制造功能性化合物(包括小分子药物)至关重要。几个世纪以来,化学合成已从艺术发展到科学。像Robert B. Woodward和Elias J. Corey这样的二十世纪化学家帮助开发了设计合成的逻辑基础,计算机科学的进步使人类能够将这些规则教授给人工智能算法,使他们能够规划化学途径来分析目标分子。虽然自动化学合成机器的工作已经被报道过,但是能够将计算机辅助合成路线设计(CASP)、反应条件优化与评估、以及机器人执行等全流程进行整合的的自动化合成平台还未被开发。
不久前,美国麻省理工学院(MIT)研究人员在《Science》杂志发表了一篇题为“A robotic platform for flow synthesis of organic compounds informed by AI planning”的论文,文章描述了一种结合AI设计合成路线和机器人执行的自动化合成平台,该方法基于美国专利和Reaxys数据库中的反应训练了人工智能算法,能够为给定分子提出合成路线,包括反应条件,并根据步骤数和预测产量评估哪条路径最佳。同时,该系统拥有一个灵活的机器人手臂,能够执行所有合成操作流程,实现自动化合成。研究人员证明该机器人平台可以成功用于15个化学小分子药物的合成路线设计和自动化合成。
来源:Science. 利多卡因30倍速合成过程示例。其中反应器选择,反应器放置,试剂管线组装,工艺模块密封,工艺堆栈压缩,工艺模块释放,反应器拆卸和反应器存储的步骤以较少加速的插图突出显示。
计算机辅助合成路线设计(CASP)在进入实验室前已经被作为一种工具帮助化学家确定反应路线。如今,从反应数据库(例如Reaxys, SciFinder)中搜索已知化合物的已知反应已成为一项常规技能。然而,除了最近报道的Chematica程序可以基于专业编码对新路线进行设计外,计算机设计合成路线几乎没有实质性的进展。数据科学和机器学习的最新进展带来了科学家对CASP的新兴趣,最近的一些研究,包括Segler等人应开发的Monte Carlo 树加速了计算机辅助合成路线设计的发展。
MIT研究人员开发的新系统结合了三个主要步骤:首先,由人工智能指导的软件提出了合成分子的途径,然后专家化学家审查这条路线并将其细化为化学“配方”,最后将配方发送到机器人平台,自动组装硬件并执行反应构建分子。
研究人员为计算机辅助逆合成路线设计(CASP)开发了一个开源软件ASKCOS(图2B),该软件套件受到Reaxys数据库和美国专利商标局数百万反应的培训,旨在通过学习应用逆合成转化,确定合适的反应条件,并评估反应。该算法利用Reaxys中1250万个单步反应归结出大约164,000个可靠规则。然后训练一个神经网络(NN)模型来预测这163723个规则中最能够转化应用到目标分子结构上的规则。在每种情况下,系统询问是否存在将给定反应物转化为预期产物的任何条件。最终目标是将目标化合物追溯为可从供应商如Sigma-Aldrich获得的容易且廉价的小分子。
图1. A. 按需合成目标有机化合物的工作流程;B.结合化学信息学和机器学习的软件模块,用于设计和验证合成途径;C.机器人流动化学平台的照片。
推荐的合成路线部分涵盖CRFs文件(refined chemical recipe files),需要用户提供额外的信息来定义停留时间,化学计量和浓度来保证连续的流程。为了执行这些合成,机器人臂根据CRF中定义的期望过程配置将模块化过程单元(反应器和分离器)组装成连续流动路径。机器人还通过流体开关板将试剂管线和计算机控制的泵连接到反应器入口,系统开始合成。在指定的合成时间之后,系统使用清洁溶剂冲洗管线,并且机械臂断开试剂管线并将处理模块移至其适当的存储位置。
图2. 软件以safinamide为例说明工作流程:A. 查询目标分子; B. 预测合成路线;C. 预测的10种可能反应条件;D. 在最佳条件下预测反应主要产物;E. 链接到支持每个反应模板的文献先例摘要,包括导出Reaxys查询的选项。
研究人员基于前人的即插即用单元操作设计了一个自动设置连续合成系统。如图3所示,该系统包含进程栈、反应器、分离器和溶剂树。这个合成路线设计软件和自动化合成平台被用于15种药用相关的小分子的设计和自动合成,包括阿司匹林(91%)、secnidazole、利多卡因、地西泮,和能够证明能识别立体化学的(S)-华法林(78%,er 4:1)和safinamide,还合成了2种化合物库:5种ACE抑制剂,包括喹那普利和4种非甾体类抗炎药,包括塞来昔布。这些目标需要总共8种特定的逆合成路线和9种特定的工艺配置。
图3. 流动化学机器人平台的组成模块(A)进程栈,其中模块与UPB连接以形成连续的流动路径(左)和显示加热的反应器的热图像(右); (B)试剂树和试剂歧管的正视图; (C)反应器主体正视图; (D)1.0毫升反应器处理模块; (E)双柱填充床反应器工艺模块; (F)一次性PFA反应器插件; (G)1.0毫升反应器背面的集成电子器件; (H)在线膜分离器; (I)UPB的特写镜头,其中装有1.0毫升反应器。
图4. 以阿司匹林,secnidazole,利多卡因,地西泮,(S)-华法林和safinamide 为例的合成预测和自动合成
研究人员承认该系统目前还存在一些挑战:1.对过程强化的需求(例如减少反应时间),减少固体形成以避免堵塞,在非水溶剂和非环境温度下溶解度的计算预测仍然困难;2. 预测合适的纯化方法也非常具有挑战性,尤其是对于非柱层析的方法;3. 文章展示的反应例子都是单步或者两步的,多步反应的优化会由于参数的传播而变得复杂。
总的来说,CASP和流动化学机器人的整合平台代表了完全自主化学合成之路上的里程碑,解放化学家的双手似乎越来越成为可能。但目前为止,该系统只能使用已知的反应,研究人员希望AI最终可以用于根据已知结果预测全新的合成步骤。研究人员认为,化学空间巨大,最好的合成化学家可以使用的所有工具,但仍然很难合成一些复杂分子,因此期望这些自动化系统能够与最优秀的人类化学家合成相同范围的分子是不现实的。所以像这样的系统将是助手,而不是替代品。
参考资料:
1. Science 2019. DOI: 10.1126/science.aax1566.
2. Automating synthesis from planning to execution, C&EN
来源:化学科讯原创编译
{replyUser1} 回复 {replyUser2}:{content}