2020/05/19
DNA编码化合物库(DNA Encoded Library,以下简称DEL)技术在新药研发阶段展示出巨大的潜力,同时也面临着挑战。目前能够应用于DEL构建的化学反应十分有限,一些具有挑战的反应,因为苛刻的条件、较低的底物转化率,通常被认为是不能在水相中进行DEL反应,例如需要在酸性环境下反应的Pictet-Spengler反应。机器学习在DEL技术中有许多潜在的应用方向,其中之一就是可以用来辅助筛选DEL建库的试剂。对此,彭宣嘉博士领导的药明康德HitS事业部DEL平台,近日与中国科学院上海药物研究所陆晓杰教授、郑明月教授合作,在iScience杂志上报道了利用机器学习辅助挑选DNA 兼容的Pictet-Spengler反应的试剂。经过训练的机器学习算法筛选的试剂中有79.4%具有高转化率(反应大于50%的转化率),而盲目挑选的具有高转化率的试剂只有18.4%。
通过PS反应产生的多取代的具有光学活性的色氨酸衍生物是吲哚类生物碱中常见的结构片段,该结构存在于天然生物碱和一些药物中,例如:依托度酸 (etodolac)等。但是,Pictet-Spengler环化反应因苛刻的反应条件阻碍了其在DEL技术中的应用。
2019年,Satz博士利用固相合成的方法,在一定程度上把Pictet-Spengler反应产物应用于DNA编码。在此之前,2017年,(Brunschweiger 教授课题组)利用附着在树脂上的酸性稳定的DNA低聚物,实现了缺电子芳香醛的On-DNA的Pictet-Spengler反应;此外,利用 Mtt/Boc保护色氨酸连接的PNA单体,在TFA的催化下,可以实现色氨酸与醛化合物的On-PNA的 Pictet - Spengler反应。但是,水相DNA兼容的Pictet - Spengler反应仍有待探索。
首先,采用DNA连接的色氨酸底物1和醛类化合物作标准底物,对DNA兼容的Pictet-Spengler反应进行探索(图4 A)。使用传统的路易斯酸(Sc(OTf)3, In(OTf)3, YbCl3, YCl3, Sm(OTf)3)和布朗斯特酸(H3PO4, HCOOH)作为酸启动子时,观测到DNA严重损伤。根据反应机理和DNA的耐受性,选择富电子的色氨酸底物3a和缺电子的对硝基苯甲醛对该反应进行优化(图4B)。研究发现,将质子性溶剂异丙醇(i-PrOH)能够促进反应的发生,提高有机溶剂的比例,改善醛类化合物的溶解性,可以将转化率提高至78%。
得到优化条件后,作者首先对醛类化合物的普适性进行了考察(图4 C),研究发现,在优化条件下,卤素(序号 1, 2, 3, 4, 5, 7, 11, 15)、酯(序号1、8、14)、炔烃(序号13),腈(序号6)等官能团都具有较好的耐受性,缺电子的醛类化合物转化较高,富电子的醛类化合物转化率较低,甚至不发生反应。需要指出的是,部分芳醛化合物反应后会观测的两种构型的产物。
之后,作者利用内部1655个醛的反应测试数据,建立了一个深度神经网络(DNN)模型并将模型的预测结果和实验结果进行了比较。经过训练后的模型在识别转换率大于50%的醛类化合物的精度为79% (内部测试数据集为81%)。与盲选的醛类化合物转化率相比,该模型具有显著优势[高转化率百分比: 18.4% (不使用AI模型)vs 79.4%(使用AI模型),图5B]
此外,为了证实底物的电子效应对反应有重要的影响,作者研究了不同电性的On-DNA色氨酸底物的反应性,其中甲氧基取代的底物(3a)得到了最好的结果,而溴取代的底物(3c)几乎没有得到想要的产物(图6A)。除此之外,On-DNA的芳醛与不同的色氨酸底物之间的反应,在优化的条件下也实现了中等的转化 (图6B)。为了进一步探索On-DNA Pictet-Spengler反应在DEL中的应用,作者以On-DNA的吲哚胺类化合物7为底物,对醛类化合物进行了考察,并得到良好的转化结果(图6 C)。
在完成了以上工作后,为了验证这种DNA兼容的Pictet - Spengler环化反应在DEL中的实用性,作者设计了两条可能用于DEL的构建的路线,并最终成功观测到了预期的目标化合物(图7)。
完成上述工作后,作者又通过qPCR和NGS测试实验,证实了在文中Pictet - Spengler环化的过程中,没有对DNA序列造成明显可观测到的损伤。这种方法可以应用于水相的DEL构建。
综上, 研究者通过对On-DNA吲哚底物的有效设计,发展了DNA 兼容的Pictet-Spengler环化反应,实现四氢咔啉类生物碱的快速构建,该反应对DNA完整性没有负面影响。此外,本次研究中首次将利用机器学习算法筛选潜在的反应物和DNA编码库合成进行有效结合,助力新药发现。
参考文献: