来自普林斯顿工程和罗格斯大学的研究人员找到了稳定蛋白质的方法。该团队的机器人平台将速度提高了10倍以上,他们的计算方法找到解决方案的速度,比单独依靠人类智能可能的速度快几周到几年。
稳定蛋白质是药物研发、生物燃料生产和塑料回收研究的核心挑战。目前,科学家利用他们的化学知识来估计在不同条件下哪些化合物会与蛋白质很好地配对。传统的方法使用试错法来提炼结果。这种艰苦的方法可能需要几个月的时间,因为科学家们创造和测试分子样本,而且往往毫无结果。
在新系统中,工程师使用机器学习模型来识别化学化合物最有可能稳定所需的蛋白质。该模型有助于将数十万种可能性缩小到几个可能的候选人。一个机器人装配平台生产分子样本用于评估。将机器人平台与机器学习模型几天后就会有结果。
这种双涡轮增压方法提供了一个额外的优势:由于它能够处理大量数据,机器学习模型经常会推荐科学家不会想到的候选分子。
利用机器学习来指导我们的搜索加速了发现,其数量很难量化,但非常重要。
在韦伯和罗格斯大学生物医学工程助理教授亚当·葛姆雷的带领下,研究人员在杂志上发表了他们的发现新材料.
在开发他们的系统时,该团队转向了三种具有独特属性的蛋白质,包括在辣根中发现的一种蛋白质,这种蛋白质广泛用于医院和水处理厂。
如果我们能够解决这三种酶的问题,那么理论上可以将相同的程序扩展到所有种类的酶。
虽然蛋白质在自然界中表现出各种惊人的壮举,但它们往往对自己的工作条件很挑剔。温度的变化或暴露在溶剂中会阻止它们前进。为了使蛋白质变硬,以便在它们的自然环境之外使用,科学家们经常用专门的支撑材料来加固它们,如混凝土中的钢筋,使这些脆弱的结构更加坚固。这是实现大量生物医学、环境和其他工业技术的关键一步。
但是找到蛋白质和它的支持分子之间的完美匹配意味着优化天文数字的选择。传统的方法很慢,而且很不系统——试错法——这意味着大多数可能的解决方案都没有被探索过。
研究人员首先基于传统的直观方法制作了500种不同的支持分子。每一种支持物都有可能使蛋白质抵抗恶劣的工业条件,但研究人员知道的不多。然后,他们测试了作为支持物的500个分子中的每一个,收集了关于其性能的真实数据,同时让计算机模型预测他们会发现什么。将预测与发现进行比较,使他们能够通过称为强化学习的积极强化过程来改进计算机模型。
利用新训练的计算机模型,研究人员将搜索范围扩大到50多万种可能的支持分子。每个分子代表一种不同的配方,由成千上万种不同结构的成分拼凑而成。他们在模型中运行了四次数据,每次都在寻找两件事:表现优于该领域其他人的分子,或者拥有一些有趣品质的分子,这些品质可能使算法更加复杂。
与他们使用基于直觉的方法识别的分子相比,新的机器辅助方法发现的支持分子对辣根蛋白的作用要好五倍以上。当使用脂肪酶(一种分解体内脂肪的蛋白质)时,结果要戏剧性得多。新系统发现了一种支持分子,与最初的选择相比,它将性能提高了大约50倍,甚至推动了蛋白质在自然环境之外比在自然状态下工作得更好。
他们可以通过整合机器学习模型现场的物理机器人系统。大部分初始工作是通过在两个实验室之间来回发送数据来完成的。
该团队正在着手开发的具体应用分子稳定蛋白质可能会带来变革性的解决方案:一种回收难以破碎的塑料的新方法和一种非侵入性的脊髓损伤治疗方法。