利用机器学习突破科学发现的极限

2024-09-02 14:36:43健康专一的悟空

如果科学家和政策制定者能够自动化和优化他们所交互的每个系统中的海量数据的过滤，以提取能够帮助人类解决粮食安全、个性化医疗、气候变化等问题的信息，那会怎样?

利用机器学习突破科学发现的极限

有了机器学习，我们也许就能做到这一点。这种革命性的工具有可能扩展人类的直觉，并识别出我们原本不会想到的地方的模式。我们很可能在这些地方找到一些最紧迫问题的创新解决方案。机器学习已经可以帮助我们快速解读大量数据，但现在我们要弄清楚如何应用它。

机械工程与应用力学(MEAM)副教授NatTrask将他在应用数学和传统物理建模方面的专业知识与机器学习相结合，通过他所谓的“自动驾驶实验室”发现了大量应用。

凭借应用数学博士学位，特拉斯克开始了他的研究生涯，为计算流体力学项目提供咨询。他很快加入了桑迪亚国家实验室，开始研究许多受复杂物理学控制的系统，如聚变能、冲击物理学、半导体物理学、3D打印和材料发现。在过去五年里，他彻底改变了自己的研究方向，将重点转向科学建模的机器学习。特拉斯克意识到机器学习的应用是无穷无尽的，于是带着新的研究目标加入了宾夕法尼亚大学工程学院。

“我们在桑迪亚所关注的问题非常复杂，单靠传统建模无法做出准确预测，”他说，“其中涉及的物理和长度尺度实在太多了。”

正是在那时，他的自动驾驶实验室的想法诞生了。

“自动驾驶实验室就像一辆自动驾驶汽车，”特拉斯克说。“在汽车中，人工智能会根据传入的信息和系统参数告诉机械系统该做什么。在自动驾驶实验室中，人工智能会根据收到的数据告诉机器人按特定顺序执行某些实验。一次可能会进行一千个实验，每个实验都会从大型数据集中提供不同的见解。”

特拉斯克计划在宾夕法尼亚大学设计他的首批机器学习驱动的自动驾驶实验室。这些实验室将使来自不同领域的研究人员能够发现他们工作中的新模式和联系，并帮助推动医疗诊断和治疗、能源存储、可持续材料发现等领域的创新解决方案。

“利用机器学习和人工智能来执行此类任务的时代将以类似于过去的工业革命和流水线发明的方式提高当今的效率，”他继续说道。“通过应用这些工具来推进科学发现，我们可以获得一种新的吞吐量，速度更快，覆盖所有规模。”

特拉斯克已经在自己的工作中运用机器学习的力量来制作更为精确的物理模型。

传统上，物理建模是通过研究各个尺度上的个体相互作用来完成的，从原子到分子再到毫米级材料等等。这些观察结果与限制性假设相结合，产生了相对简单的模型，这些模型并不适用于所有情况。通过使用机器学习，可以以更高的分辨率观察和理解这些相互作用。

“现在，我们可以将每个尺度上的一个相互作用示例插入算法中，并让算法完成识别有用信息的艰苦工作，”特拉斯克说。“它可以应用已知的物理定律，例如‘f=ma’，然后为物质如何在这些尺度上相互作用的模型提供信息。通过这种方法消除了我们人类认知的局限性，我们也消除了以前方法中应用的限制性假设，并产生了更准确的模型。”

从构建更精确的基于物理的模型到开发支持自动驾驶实验室的自动化实验，特拉斯克认为宾夕法尼亚大学是合作和自由实验的理想场所。

“桑迪亚拥有开发人工智能的优秀实验设施，可以告诉我们下一步该做什么实验，但大学是进行冒险研究和快速开发新想法的更好地方，”特拉斯克说。“这就是我加入宾夕法尼亚大学的原因。宾夕法尼亚大学工程学院以自主机器人、医疗设备、材料科学等领域的世界级专家而闻名，我希望与这些人合作，将机器学习和自动驾驶实验室应用于现实的社会问题。”

特拉斯克已经开始在宾夕法尼亚大学内外建立关系来解决这些问题。作为能源部资助的数学多面综合能力中心(SEA-CROGS)的联席主任，特拉斯克正在与其他六所大学和两个国家实验室合作开发下一代科学机器学习架构，以满足高后果工程环境中的需求，例如改善气候系统分析和识别极端天气的早期预警信号。

除了运营SEA-CROGS之外，特拉斯克还在宾夕法尼亚大学建立自己的实验室并启动他的首批一些合作项目。

“对我和整个机器学习领域来说，这是一个激动人心的时刻，”Trask说。“今年秋天，我的团队将搬进AmyGutmannHall，启动许多合作项目，并邀请教职员工和学生参与新工作，开发宾夕法尼亚大学首批自动驾驶实验室。我们处于创建物理信息机器智能标准的最前沿，那些现在正在研究这些问题的人可能是第一个做到这一点的人。”，