科学家开发出一种机器学习方法帮助设计更好的抗体药物

cnBeta.COM 2021-06-07

　　据外媒报道，抗体不仅由我们的免疫细胞产生，以对抗体内的病毒和其他病原体。几十年来，医学界也一直在使用生物技术生产的抗体作为药物。这是因为抗体非常善于根据“锁钥原理”专门与分子结构结合。它们的用途包括从肿瘤学到治疗自身免疫性疾病和神经退行性疾病等。

　　然而，开发这种抗体药物并不简单。基本要求是抗体以最佳方式与其目标分子结合。同时，一种抗体药物必须满足一系列的额外标准。例如，它不应该在体内引发免疫反应，它应该利用生物技术有效地生产，并且它应该在很长一段时间内保持稳定。

　　一旦科学家们找到了与所需分子目标结构结合的抗体，开发过程就远远没有结束。相反，这标志着一个阶段的开始，在这个阶段中，研究人员利用生物工程来尝试改善抗体的特性。由苏黎世联邦理工学院（ETH）生物系统科学和工程系教授Sai Reddy领导的科学家们现在已经开发出一种机器学习方法，支持这一优化阶段，帮助开发更有效的抗体药物。

　　机器人无法管理超过几千个

　　当研究人员以治疗形式优化整个抗体分子时（即不仅仅是抗体的一个片段），过去是以一个与所需目标结构合理结合的候选抗体开始。然后研究人员随机突变携带抗体蓝图的基因，以便在实验室中产生几千个相关的候选抗体。下一步是在它们之间进行搜索，以找到与目标结构结合最好的抗体。"通过自动化流程，你可以在实验室中测试几千个候选治疗药物。但要筛选出比这更多的东西其实并不可行，"Reddy说。通常情况下，这种筛选中最好的十几种抗体将进入下一步，并测试它们满足额外标准的程度。他说："最终，这种方法可以让你从几千人的群体中找出最好的抗体。

　　通过机器学习大量增加候选者库

　　Reddy和他的同事们现在正在使用机器学习，将待测的初始抗体集增加到几百万。Reddy说：“可供选择的候选药物越多，找到真正符合药物开发所需的所有标准的机会就越大。”

　　ETH的研究人员利用罗氏的抗体癌症药物赫赛汀为他们的新方法提供了概念证明，该药物已经上市20年了。"但我们并不希望就如何改进它提出建议--你不能只是追溯性地改变一种已批准的药物，"Reddy解释说。"我们选择这种抗体的原因是它在科学界是众所周知的，而且它的结构已在开放的数据库中发表。"

　　计算机预测

　　从赫赛汀抗体的DNA序列开始，ETH研究人员使用他们几年前开发的CRISPR突变方法创建了大约4万个相关抗体。实验表明，其中1万个抗体能很好地与有关的目标蛋白，即一种特定的细胞表面蛋白结合。科学家们使用这4万种抗体的DNA序列来训练一种机器学习算法。

　　然后他们将训练好的算法用于搜索一个包含7000万个潜在抗体DNA序列的数据库。对于这7000万个候选抗体，该算法预测了相应的抗体与目标蛋白结合的程度，从而得出了一个预计会结合的数百万序列的列表。

　　利用进一步的计算机模型，科学家们预测了这几百万个序列将如何满足药物开发的额外标准（耐受性、生产、物理特性）。这将候选序列的数量减少到8000个。

　　科学家们从他们计算机上的优化候选序列列表中选择了55个序列，在实验室中生产抗体并描述其特性。随后的实验表明，其中几个序列与目标蛋白的结合甚至比赫赛汀本身更好，而且比赫赛汀更容易生产和更稳定。Reddy说：“一种新的变体甚至可能比赫赛汀在体内的耐受性更好。众所周知，赫赛汀会引发一种微弱的免疫反应，但在这种情况下，这通常不是一个问题。"然而，对于许多其他抗体来说，这是一个问题，而且对于药物开发来说是必须要预防的。”

　　ETH的科学家们现在正在应用他们的人工智能方法来优化正在进行临床开发的抗体药物。为此，他们最近成立了ETH衍生公司deepCDR Biologics，该公司与早期和成熟的生物技术和制药公司合作进行抗体药物开发。

责任编辑：刘鑫嵘

上一篇：天文学家疑似发现新磁星待确认后总数将增加至25个

下一篇：超级计算机提高了空间天气预报能力

科普中国APP 科普中国微信 科普中国微博