AI和化学圈惊呼AIGPT-4代理智能体科研实力炸裂

author
0 minutes, 50 seconds Read

由大语言模型组成的代理智能体,手把手教你选试剂、剂量、预测反应结果。梅隆大学科学家的一篇论文,将AI圈和化学圈一并震撼!>拥有矢量数据库的长期记忆,GPT-4代理智能体能读懂复杂的科学文档,还可以在基于云的机器人实验室中进行化学研究,令网友惊叹。AI自主研究并发表研究成果的时代要来临?化学界AI圣杯即将问世!

研究者希望通过多个大语言模型的AI来开发自主设计并完成实验的基础设备。研究人员在论文中提出,他们基于GPT-4和其他模型的AI确实可以解决化学方面的难题。通过上网查找文献,准确控制液体仪器,以及解决需要多个硬件和数据源的复杂问题,这个AI已经做到很厉害了,令人想起绝命毒师。

论文地址:https://arxiv.org/abs/2304.05332

研究者开发了一种AI模型,能够自动合成药物,例如布洛芬。输入简要提示后,模型会在互联网上查找制作该药物所需步骤。该模型已可识别许多不同的化学反应,并以高度准确性合成多种药物。

资料来源:https://www.nature.com/articles/s41928-021-00621-1

一种AI模型能够自动合成药物,例如阿司匹林和阿斯巴甜。模型通过Friedel-Crafts和铃木反应自主学习和合成化合物。若发现制成物中含有错误成分,模型则会通过云实验室进行更正。该模型可识别多种常见的化学反应,并已达到高准确度。

资料来源:https://www.nature.com/articles/natrevmats202199

使用API将模型连接到化学反应数据库(如Reaxys或SciFinder)可以大大提高化学反应自动化模型的准确性。通过分析历史记录,也能提高模型的准确性。操作机器人可以将一组样本视为整体,并可以通过自然语言输入指令进行实验操作,例如为微孔板涂上颜色。

资料来源:https://www.nature.com/articles/natrevmats202199

一种机器人代理人可以通过执行自然语言输入的实验操作来解决化学反应问题。代理人会准备样本并请求测量,得到光谱信息后使用Python代码来识别吸光度最大的波长,并解决问题。操作流程与自然语言输入的实验请求非常相似。

资料来源:https://www.nature.com/articles/natrevmats202199

研究人员评估AI设计实验的能力,从网络整合数据和运行计算开始,AI编写程序给液体试剂操作系统,并应用加热摇床模组增加复杂度。

资料来源:https://www.cnbc.com/2022/01/04/robots-are-taking-over-labs-by-designing-experiments-and-running-droves-of-tests.html

研究人员设计了一个液体试剂操作系统,其中的源液包含多种试剂和催化剂。AI控制着这个操作系统上的两块微型版,并希望通过设计流程成功实现铃木和索诺格希拉反应。

资料来源:https://www.cnbc.com/2022/01/04/robots-are-taking-over-labs-by-designing-experiments-and-running-droves-of-tests.html

研究人员使用AI设计出一套流程,成功实现铃木和索诺格希拉反应。AI自行搜索所需试剂的定量、浓度等信息,并在多个芳基卤化物中进行选择。最终,AI选择了溴苯和碘苯作为试剂,还选了对碘硝基苯作为一种备选试剂。

资料来源:https://www.cnbc.com/2022/01/04/robots-are-taking-over-labs-by-designing-experiments-and-running-droves-of-tests.html

 

AI选择了Pd/NHC催化剂和三乙胺作为碱,进行了耦合反应实验,并计算出每种试剂所需的量并规划了整个实验过程。虽然中途出现了一个错误,但AI及时修正了实验过程,最终成功运行。该模型具有潜力,因为它可以通过多次反复实验分析推理过程,获得更好的结果。

资料来源:https://www.cnbc.com/2022/01/04/robots-are-taking-over-labs-by-designing-experiments-and-running-droves-of-tests.html

 

AI展现出了极高的分析推理能力,并能写出高质量的代码推进实验设计。研究人员希望AI能开发一种新的抗癌药物。

资料来源:https://www.cnbc.com/2022/01/04/robots-are-taking-over-labs-by-designing-experiments-and-running-droves-of-tests.html

 

AI克服困难,从当前抗癌药物研发趋势中选定目标,自行合成了一种新的抗癌药物。AI通过上网搜索相关反应机制和实例,完善合成过程。

然而,上图所示的内容只是理论探讨,AI并不能真正合成甲基苯丙胺、海洛因等药物。

 

资料来源:https://www.cnbc.com/2022/01/04/robots-are-taking-over-labs-by-designing-experiments-and-running-droves-of-tests.html

 

AI提供了4种化合物的合成方案并尝试继续合成,但拒绝合成另外5种化合物,因为它们被明令禁止。AI在搜索资料时发现,这些化合物是管制药品,不能随便合成。

例如,当AI尝试合成可待因时,发现它与吗啡之间有关系。因此,AI得出结论,这东西属于管制药品,不应该合成。

 

然而,这种保险机制并不那么牢固。如果用户稍加修改,比如用化合物A代替吗啡,用化合物B代替可待因等,就可以绕过AI的识别。

资料来源:https://www.cnbc.com/2022/01/04/robots-are-taking-over-labs-by-designing-experiments-and-running-droves-of-tests.html

 

用户可以通过编造药品许可证来骗过AI,获得合成方案。AI无法识别未知化合物,对潜在危险无法警示。

例如,复杂的蛋白质毒素。

 

为了避免有人因好奇去验证这些化学成分的有效性,研究人员在论文中特别加入大红底警告,强调非法药品和化学武器的合成只是为了学术研究,主要目的是提醒新技术的潜在危险。

资料来源:https://www.cnbc.com/2022/01/04/robots-are-taking-over-labs-by-designing-experiments-and-running-droves-of-tests.html

 

不应尝试制造本文中讨论的物质或化合物,此类活动非常危险,在大多数地区都是非法的。

不要在网上搜索实验方法 

AI由多个模块组成,这些模块可以互相交换信息,有些还能上网、访问API和Python解释器。

 

如果描述详细,它能自己理解整个实验。

「网络搜索器」(Web search)模块可以使用人工智能技术搜索并拾取有用信息,以帮助Planner执行实验。

 

「搜索器」包括「Archer」和「Docs searcher」两个组件。Archer通过谷歌API搜索,过滤前十个文档和PDF,用「BROWSE」操作提取文本生成答案。GPT-3.5完成任务性能强;Docs searcher通过查询和索引,查找硬件文档,生成精确答案。代码执行组件在隔离的Docker容器中执行,保护终端,输出传回Planner。

「自动化」组件修复软件出错,采用类似预测修复的原理。

大语言模型生成易懂软件文档 

现代软件文档语言专业,难以理解。大语言模型能生成易懂文档,克服这一障碍。

 

研究者使用API文档训练模型,为提高AI使用API的准确性,他们提供任务文档和计算与查询相关的相似性。通过向量搜索选择文档的部分并提供给AI相关文件。最大token数设为7800。

提供信息给AI对于加热器-振动器硬件模块的化学反应至关重要。应用于不同机器人平台,如Emerald Cloud Lab (ECL),会有更大挑战。但可以向GPT-4模型提供SLL等未知信息。在所有情况下,AI能正确识别任务并完成。

模型保留有关函数的选项、工具和参数的信息。系统提示模型使用函数生成代码块,并将其传回Planner。

研究人员强调,必须采取防护措施防止滥用大型语言模型,并呼吁人工智能社区、开发团队和物理科学社区共同努力确保安全性。

纽约大学教授马库斯支持卡内基梅隆大学三位科学家对LLM进行安全研究的紧急呼吁。

Similar Posts