近年来,新一代人工智能技术蓬勃发展,推动科研范式变革。一批科技工作者面向世界科技前沿,探索建立化学研究的精准化、智能化双驱动模式,并率先在机器化学家、离子膜、固态电解质等领域取得创新和突破。
形成全新研究范式
(资料图片仅供参考)
“我们希望有一个机器人可以代替人做实验。”中科院精准智能化学重点实验室主任李震宇告诉记者。如今,这个想法已经变成现实。在中国科学技术大学机器化学家实验室,重达200公斤的机器人“小来”取代了身穿白大褂的人类实验员,伸出机械臂就可精确抓取样品瓶配制试剂,完成各种实验工作。
集阅读文献、自主设计实验、材料开发于一体的“全流程机器化学家”平台,其研发始于2014年。当时,中国科学技术大学化学物理系教授江俊找来人工智能、电子科技、数学、化学等不同专业人才组成具有交叉学科背景的团队,尝试建立会思考的“化学大脑”。经过多年努力打造的机器化学家“小来”,让研究速度实现了质的飞跃。
“实验数据经处理后输入‘小来’的计算大脑,由人工智能模型帮助科研人员优化实验方案,可以大幅提升我们的效率。”江俊说。以研发高熵合金催化剂为例——阅读1.6万篇论文并自主遴选出5种非贵金属元素,再从55万种可能的金属配比中找出最优配方,“机器化学家”可将科研周期缩短至5周。
李震宇表示,传统化学研究范式深度依赖“试错法”,过程繁琐、耗时冗长,化学反应经常产生大量副产物,不环保、不经济、不安全。改变研究范式是社会环境、经济发展和化学学科本身发展的迫切需求。而通过人工智能加速实现精准化研究,过程透明、机理清晰、全程可控,更高效环保。
不只是催化剂,还有新材料。前不久,《自然》杂志发表了一项重要成果,中国科学技术大学徐铜文、杨正金团队与合作者设计了一类新型离子膜——微孔框架聚合物离子膜,首次实现膜内近似无摩擦的离子传导,有望应用于能源转化、大规模储能以及分布式发电等领域。使用该膜组装的液流电池,充放电电流密度可达到每平方厘米500毫安,是当前普遍报道值的5倍以上。“传统研究范式中,选择制作合用的膜,就像大海捞针。有了人工智能工具的帮助,我们就能根据应用场景所需要的分类精度,判断这个膜需要具备什么性能,在通道中再进行精准调控、修饰。”徐铜文说。
李震宇这样形容化学研究范式的变革:“拿交通方式打比方,化学研究的初级阶段就像步行;之后技术手段升级,相当于坐上了自行车、摩托车、汽车;引入人工智能,好比坐上火箭,量变引起质变,可以带我们去月球等以前靠步行、坐车去不了的地方。”
科学家会被取代吗
有了机器人,还需要人类科学家吗?“这种担忧完全没有必要。好的工具会带来更多可能性,我们能做更多事。”江俊说。
中国科学技术大学应用化学系教授姚宏斌的最新突破,就是一个电脑帮助人类做出更好科研成果的故事。今年4月初,姚宏斌课题组、李震宇课题组的研究成果发表在《自然》上,他们通过材料结构和界面精准设计,开发出镧系金属卤化物基固态电解质新家族。
几年前,在寻找卤化物电解质过程中,姚宏斌课题组考虑将石榴石氧化物——锂镧锆氧中的“氧”换成“氯”。按传统研究方法得在实验室里一点点试错,不仅慢还得碰运气。为此,他想求助于计算机。2021年,姚宏斌录取了一名既有材料科学专业背景、又有计算机编程基础的研究生罗锦达,并找到计算化学方向的李震宇教授共同指导。在两位教授的共同指导下,罗锦达写出了可满足研究需要的程序。之后,姚宏斌团队和李震宇团队联合,根据计算机模拟结果设计出一个常温条件下可以稳定存在的镧系金属氯化物,又在实验室成功合成出具有优质性能的镧系金属氯化物固态电解质。
样品出来后,如何解释原理?团队成员结合自己的实验数据以及历史上相关研究的海量实验数据,让计算机程序在超算中心去“跑”。经过长时间计算模拟和分析,最终探明镧系金属卤化物框架结构的锂离子传导原理。
姚宏斌说:“模拟计算在这项研究中的分量,约占三分之一。没有这三分之一,研究将无法令人满意,因为我们可能无法在短时间内寻找到最优的电解质材料,也不能把实验现象背后的原理解释清楚。”
未来需要什么样的科研人才?“应该具备扎实的基础和开放的心态。”江俊表示,现在知识量已经无比庞大,没有人能看到全局,我们应该找到自己喜欢的专业,把知识的脉络看清楚;同时还要有开放的心态,敢于学习新东西。
“先进技术为人类探究更深层次的科学问题提供了更多可能性,但科学探究的边界仍被人类对自然界的认知和理解所限制。”姚宏斌则认为,科研工作者需要不断拓展认知,才能更好地解释大自然的奥秘。
培养更好的科研人工智能
国外也有会做实验的机器人。2020年,利物浦大学研制的世界首个机器人化学家登上《自然》杂志封面,它可以在1周内研究1000种催化剂配方,相当于1个博士生4年的工作量。但这款机器人化学家没有物理模型,没有预见性,不能提出任何科学假设。
与之相比,中国科学技术大学的“小来”是一个有“脑子”的机器人化学家。它“能学”,可阅读海量文献,学习化学知识;“能想”,可调用底层的物理模型,结合大数据与人工智能技术进行思考和模拟计算;“能做”,可自主完成实验,采集精准实验数据来校准模拟计算结果,理实交融给出解决方案,形成科学研究闭环。
但“小来”的进化依然存在不少难点。算力算法不足,是现阶段的痛点。江俊团队自主研发了一款化学领域的聊天机器人程序ChemGPT。但因为GPU算力不足,ChemGPT“跑不快”,训练迭代很慢。
数据也有待丰富和优化。“人工智能需要学习大量数据,但其实我们很缺数据。”江俊说。现阶段大部分科研数据都从文献中收集,而文献中的数据常常是被“美化”过的理想数据。由于现存研究数据来源多且杂,数据质量参差不齐,人工智能从这些数据中学习,就可能学到错误的东西。
“精准化学依赖实验数据的准确性。”李震宇表示,应该从精准数据出发获得高质量的化学智能,有了化学智能再回过头来对化学反应、材料性质等实施精准调控,形成完整的研究闭环。
科学家们对更好的科研人工智能充满期待。“我们希望将精准智能化学重点实验室建设成一个精准智能化学领域的国际顶尖研究机构,形成一个新的精准智能化学研究范式,建立我国主导的精准化学数据体系和智能化学的软硬件标准。”李震宇说。 (经济日报记者 佘惠敏)